240 发简信
IP属地:河北
  • Spark 3.0 主要feature

    SPARK-11215 Multiple columns support added to various Transformers: Stri...

  • Resize,w 360,h 240
    Flink学习笔记之九状态和容错

    一.理解状态 1.什么是状态 其实是某一个时刻,计算的结果,一般是operator/task,保存在内存,由于Flink分布式的运行,所以根据体...

  • Resize,w 360,h 240
    Flink学习笔记之八connector

    1.Connector是什么 2.Connector渠道 3.基于文件的预定义Source 4.基于Socket的预定于Source 5.基于E...

  • Resize,w 360,h 240
    Flink学习笔记之七AsycIO

    1.什么是异步IO ,当请求外部系统或者耗时操作,需要异步IO 2.AsyncDataStream 3.实现原理 有序 processing t...

  • Resize,w 360,h 240
    Flink学习笔记之六ProcessFunction

    1.概念 低阶API process function,越底层越丰富复杂,提供了对状态的管理中阶API DataStream API,...

  • Resize,w 360,h 240
    Flink学习笔记之五join

    1.join对比 cogroup相等于 left join,join 相等于 inner join,connect可以不不相关的2个流连接起来i...

  • Resize,w 360,h 240
    Flink学习笔记之四Time&Window

    一.Time 1.DataStream支持3种Time env.setStreamTimeCharacteristic(TimeCharacte...

  • Resize,w 360,h 240
    Flink学习笔记之三DataStream API

    DataStream是Flink API中最核心的数据结构,代表一个运行在多个分区上的并行流。 1.map&flatMap 2.filter 3...

  • Resize,w 360,h 240
    Flink学习笔记之二编译源码

    1.git 下载源码 git clonehttps://github.com/apache/flink.git 公司目前使用的是1.5.0版本,...