240 发简信
IP属地:江西
  • 2023。

    照例年末来写上几笔,最近一段时间比较忙,虽说已经2024年二月了,赶在农历年之前做个年终总结 工作/技术 这一年的变动比较大,工作地点从上海转移到了杭州,虽说整个大环境都不怎...

  • 文章标题不错😉

    关于使用Flink RocksDB状态后端时一定要写MapState而非ValueState<Map>这档事(以及解决方法)

    前言 抱歉起这种烂大街的日本轻小说风格标题来吸引注意力。原本我认为这是常识,不需要专门写一篇文章来讲解如此细碎的点。但是在最近工作巡检中发现了越来越多如同ValueState...

  • q3会有笛卡尔积吗

    完美- sql题

    用户活跃数据 请进行批处理Q1: 将附件中 ip_china.csv.zip文件加载为 Hive 内部表,保持格式与 csv header一致,表需要开启压缩Q2: 将附件中...

  • 实时这块门槛比较高

    2023-08-10 Sqlboy没有前景[A Sqlboy with no future]

    只写SQL的数仓是没有前景的 可能是我的问题,也可能是国内环境的问题吧,但我一定要说Sqlboy毫无前景以前能混着就混着,拿着不错的工资,工作轻松,回到出租房还能打打游戏,看...

  • 120
    网易云音乐数据治理

    1.整体方案 2.找问题 3.获取完整的元数据信息 4.解决方案 5.治理体系 6.治理实践 6.1权责有归属 ods治理项,这里先是数仓按业务承接云村平台所有dump任务和...

  • 是不是可以用RoaringBitmap进一步优化?

    基于clickhouse研发高性能 用户分群 操作

    背景 DCP是目前大多数公司在进行用户精细化运营和市场营销中常用的工具,其核心的技术是快速生成用户群;举个栗子,运营同学希望对用户表里当日注册用户,且订单表里当日有下单的用户...

  • hive sql 初阶

    1.找出所有科目成绩都大于某一学科平均成绩的学生 表结构:uid,subject_id,score 2.统计出每个用户按月的累积访问次数 表结构:uid,visit_date...

  • Clickhouse 运维语句

    ClickHouse 中有没有一些能够 “安家立命” 的运维 SQL 语句。我想对于这个问题很多朋友都会有兴趣,所以就在这里做一个简单的分享。 在 ClickHouse 默认...

  • clickhouse 常见问题处理(持续更新中)

    1.删除表 ZK replicas未同步: 连上ZK deleteAll 直接OK 2.无法执行DDL(alter) 这里原因比较多,后面有详细的报文,按照提示来,如果是表太...

  • 新的版本应该支持row_bumber()了

    Clickhouse(连续登陆例题)

    CH的数据的导入和导出 1 使用集成引擎HDFSFileMySQLKAFKA2 from 表函数 file mysql **** hdfs****3 insert i...

  • 突然想认识大佬

    2022-01(完成事项)

    本月计划事项 完成上个月未完成的高级SQL用法补充到博客中的 计划的方向是每个月阅读一本技术书籍和成长书籍,这样的话大致在4月的时候可以阅读完8本书的,是一个不错的成就 关于...

  • ES有哪些应用场景

    ES的主要应用分为两大类: 搜索类(带上聚合),考虑事务性,频繁更新,与现有数据库进行同步,通过ES进行查询聚合。 日志类,包括日志收集,指标性收集,通过beats等工具收集...

  • @LittleMagic 京东好像今年要搞春节红包,是你们部门吗

    2021。

    2021年的最后几个小时了,抽空来写几笔。待会儿再揭晓年度最佳单曲。 健康 新冠疫情仍然没有趋缓的迹象。看着近期又开始上涨的确诊病例数,还有承载着不同生活轨迹的流调报告,有时...

  • 来了,来了😄

    2021。

    2021年的最后几个小时了,抽空来写几笔。待会儿再揭晓年度最佳单曲。 健康 新冠疫情仍然没有趋缓的迹象。看着近期又开始上涨的确诊病例数,还有承载着不同生活轨迹的流调报告,有时...