Avatar notebook default
17篇文章 · 7107字 · 1人关注
  • 双流join的底层原理

    union:union 支持双流 Join,也支持多流 Join。多个流类型必须一致; connector:connector 支持双流 Joi...

  • 双流left join

    A表left join B表 (1)A表数据来了,B没来 (2)A表数据来了,B在规定时间内到 (3)A表数据来了,B在规定时间后面到 怎么处理...

  • 保障实时指标的质量

    1.⭐事前: ⭐任务层面:根据峰值流量进行压力测试,并且留一定 buffer,用于事前保障任务在资源层面没有瓶颈 ⭐指标层面:根据业务要求,上线...

  • 合理评估任务最大并行度

    0. 前提:并行度必须 <= 最大并行度 1.⭐ 最大并行度的作用:合理设置最大并行度可以缓解数据倾斜的问题 2.⭐ 根据具体场景的不同,最大并...

  • 合理评估flink的并行度

    Flink 任务并行度合理行一般根据峰值流量进行压测评估,并且根据集群负载情况留一定量的 buffer 资源 1.⭐ 如果数据源已经存在,则可以...

  • flink双流 Join

    流式计算中的 2 个问题: ⭐ 流式数据到达计算引擎的时间不一定:比如 A 流的数据先到了,A 流不知道 B 流对应同 key 的数据什么时候到...

  • flink开窗函数

    FlinkSQL 窗口: TUMBLE(TABLE data, DESCRIPTOR(timecol), size) HOP(TABLE dat...

  • 状态,状态后端和checkpoint的关系

    状态:本质来说就是数据,在 Flink 中,其实就是 Flink 提供给用户的状态编程接口。比如 flink 中的 MapState,Value...

  • task,slot,线程,并行度的关系

    Flink中slot是任务执行所申请资源的最小单元,同一个TaskManager上的所有slot都只是做了内存分离,没有做CPU隔离。 slot...

文集作者