240 发简信
IP属地:北京
  • 乱坟地里的黄大仙

    七十年代,我们村东头有个毛笔厂,做各种各样的毛笔,远销很多地方。做毛笔要用到兔毛,所以远近有很多养兔子薅兔毛的人家。但上好的毛笔,要用狼毫来做,...

  • Resize,w 360,h 240
    Flink详解系列之九--反压机制和处理

    反压是什么 反压是在实时数据处理中,数据管道某个节点上游产生数据的速度大于该节点处理数据速度的一种现象。反压会从该节点向上游传递,一直到数据源,...

  • Resize,w 360,h 240
    Flink详解系列之八--Checkpoint和Savepoint

    一、Checkpoint 获取分布式数据流和算子状态的一致性快照是Flink容错机制的核心,这些快照在Flink作业恢复时作为一致性检查点存在。...

  • Flink详解之七--状态管理

    一、概念 实时处理中的很多操作都是一次对单个事件做处理,也有一些操作需要历史事件的信息,这些操作被称为有状态的。也就是说,所谓的状态就是由历史事...

  • flink算子:union和connect

    在合并数据流时,可以使用union和connect两种算子,两者的使用方式如下。 union 1、可以合并两个以上的数据流;2、合并的各实时流数...

  • Resize,w 360,h 240
    Flink详解系列之六--窗口机制

    窗口是flink处理无限流的核心,窗口将流拆分为有限大小的“桶”,我们可以在这些桶上进行计算。 1、Keyed vs Non-Keyed Win...

  • Resize,w 360,h 240
    Flink详解系列之五--水位线(watermark)

    1、概念 在Flink中,水位线是一种衡量Event Time进展的机制,用来处理实时数据中的乱序问题的,通常是水位线和窗口结合使用来实现。 从...

  • Resize,w 360,h 240
    Flink详解系列之四--时间

    在流处理场景中,处理的是持续到达且可能是无穷的事件流,时间在这样的应用中是最核心的要素。Flink定义了三种时间类型: 事件时间(Event T...

  • Resize,w 360,h 240
    Flink详解系列之二--核心概念

    一、流处理 在自然环境中,数据的产生原本就是流式的。无论是来自 Web 服务器的事件数据,证券交易所的交易数据,还是来自工厂车间机器上的传感器数...

个人介绍
微信公众号:wx_zhaowenhao