在学习 paimon sink 的过程中本来只想快速梳理下 paimon 的 sink 时对 DataStream 操作的拓扑, 但是过程中发现 paimon 会有很多概念,...
在学习 paimon sink 的过程中本来只想快速梳理下 paimon 的 sink 时对 DataStream 操作的拓扑, 但是过程中发现 paimon 会有很多概念,...
前言 我们知道,列式存储的数据组织形式使得它适合海量数据在线查询、分析的场景,而写入性能相对于读取性能似乎并不那么重要(传统的ORC / Parquet on Hive方案就...
前言 这篇从半个月前就开始写,断断续续写到现在,终于能发了(被简书吞了好几次),不容易。 最近笔者正在补习与RocksDB底层相关的细节,因为: 次要原因——当前所有Flin...
前言 最近在进行StarRocks与数据湖集成方面的一些工作(重点是SR 3.2与Paimon 0.6的适配),同时阅读和修改了部分代码,发现StarRocks JNI Co...
@LittleMagic hhh,FFA2023听完了,是Paimon+StarRocks批流一体湖仓分析的大佬嘛?
关于使用Flink RocksDB状态后端时一定要写MapState而非ValueState<Map>这档事(以及解决方法)前言 抱歉起这种烂大街的日本轻小说风格标题来吸引注意力。原本我认为这是常识,不需要专门写一篇文章来讲解如此细碎的点。但是在最近工作巡检中发现了越来越多如同ValueState...
前言 抱歉起这种烂大街的日本轻小说风格标题来吸引注意力。原本我认为这是常识,不需要专门写一篇文章来讲解如此细碎的点。但是在最近工作巡检中发现了越来越多如同ValueState...
大佬,请问这个是什么版本的Flink呢,我看的是1.15,现在没有lookup,是eval()方法了
Flink 源码之 SQL TableSource 和 TableSinkFlink源码分析系列文档目录 请点击:Flink 源码分析系列文档目录[https://www.jianshu.com/p/d4a372809e3d] 前言 Flink S...
前言 Long time no see(鞠躬 最近终于开始尝试推广Hudi在部门内部的应用,作为流批一体计划的最后一块拼图,顺便复活许久未更的博客,希望今后至少能保持周更的节...
大佬有wx或者其他沟通群嘛?想持续沟通交流一下,我司现在也在研究流批一体的落地,目前是FLink+Iceberg,但是仅限于实时任务比较简单的行为日志数据能够落地
流批一体随想前言 好久不见(鞠躬 今年以来的主要工作方向之一就是部门内流批一体能力的建设与落地。虽然这个概念早已成为老生常谈,并且笔者现在还没什么fancy的成果(惭愧),但今天还是想随...
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 背景 本篇接Flink 使...
前言 今天是大年初一,祝各位虎年大吉大利~ 近期受工作变动影响,博客又荒废了许久。今天难得有空,就前段时间内部技术分享里提到的一个小知识点来写几笔。 对象重用(object ...
好强啊~还没30年就已经架构师了!像你学习
2021。2021年的最后几个小时了,抽空来写几笔。待会儿再揭晓年度最佳单曲。 健康 新冠疫情仍然没有趋缓的迹象。看着近期又开始上涨的确诊病例数,还有承载着不同生活轨迹的流调报告,有时...
1. 概述 Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越...
1. 概述 在2.x中,spark有两个用来与kafka整合的代码,版本代号为0.8和0.10,由于在0.8,kafka有两套消费者api,根据高级api得到了Receive...
Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储...