前言 本文是两个月前参加黑马比赛时写了一半的,为了避免烂尾,今天补全发出来。 Flink CDC经过长时间的发展,目前无疑是实现数据源端Pipeline的最简单直接的方式。而...
前言 本文是两个月前参加黑马比赛时写了一半的,为了避免烂尾,今天补全发出来。 Flink CDC经过长时间的发展,目前无疑是实现数据源端Pipeline的最简单直接的方式。而...
Timer简介 Timer(定时器)是Flink Streaming API提供的用于感知并利用处理时间/事件时间变化的机制。Ververica blog上给出的描述如下: ...
Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Had...