前言 本文是两个月前参加黑马比赛时写了一半的,为了避免烂尾,今天补全发出来。 Flink CDC经过长时间的发展,目前无疑是实现数据源端Pipeline的最简单直接的方式。而...
前言 本文是两个月前参加黑马比赛时写了一半的,为了避免烂尾,今天补全发出来。 Flink CDC经过长时间的发展,目前无疑是实现数据源端Pipeline的最简单直接的方式。而...
Timer简介 Timer(定时器)是Flink Streaming API提供的用于感知并利用处理时间/事件时间变化的机制。Ververica blog上给出的描述如下: ...
Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Had...
背景 所有一切的开始都是因为这句话:一个单子(Monad)说白了不过就是自函子范畴上的一个幺半群而已,有什么难以理解的。第一次看到这句话是在这篇文章:程序语言简史(伪)。这句...
学习列表: scala官方文档[http://scala-lang.org/documentation/] scala cheat[http://docs.scala-lan...
本文由厦门大学计算机系教师林子雨翻译,翻译质量很高,本人只对极少数翻译得不太恰当的地方进行了修改。 【摘要】:Spanner 是谷歌公司研发的、可扩展的、多版本、全球分布式、...
上次在做内部培训的时候,我讲了这么一句: 一个Job里的Stage都是串行的,前一个Stage完成后下一个Stage才会进行。 显然上面的话是不严谨的。 看如下的代码: 这里...
简书 占小狼转载请注明原创出处,谢谢! java并发采用的是共享内存模型,线程之间的通信对程序员来说是透明的,内存可见性问题很容易困扰着java程序员,今天我们就来揭开jav...
简书 占小狼转载请注明原创出处,谢谢! 收集算法 垃圾收集算法主要有:标记-清除、复制和标记-整理。 1、标记-清除算法对待回收的对象进行标记。算法缺点:效率问题,标记和清除...