Hiwayz - 简书

发简信

Hiwayz

18
关注
95
粉丝
25
文章
48055

字数
125

收获喜欢
10

总资产

IP属地：广东

Hiwayz

paimon sink 源码之 paimon table 创建
在学习 paimon sink 的过程中本来只想快速梳理下 paimon 的 sink 时对 DataStream 操作的拓扑, 但是过程中发现 paimon 会有很多概念，...

loukey_j
507 1 3
Hiwayz

浅谈Deletion Vector及其在StarRocks中的应用
前言我们知道，列式存储的数据组织形式使得它适合海量数据在线查询、分析的场景，而写入性能相对于读取性能似乎并不那么重要（传统的ORC / Parquet on Hive方案就...

LittleMagic
868 1 6

Hiwayz

loukey_j
写了 55832 字，被 78 人关注，获得了 120 个喜欢
Hiwayz

LSM Tree-Based存储引擎的compaction策略（feat. RocksDB）
前言这篇从半个月前就开始写，断断续续写到现在，终于能发了（被简书吞了好几次），不容易。最近笔者正在补习与RocksDB底层相关的细节，因为：次要原因——当前所有Flin...

LittleMagic
13748 13 29
Hiwayz

简析StarRocks JNI Connector及其在数据湖Reader中的应用
前言最近在进行StarRocks与数据湖集成方面的一些工作（重点是SR 3.2与Paimon 0.6的适配），同时阅读和修改了部分代码，发现StarRocks JNI Co...

LittleMagic
590 0 5
Hiwayz

@LittleMagic hhh，FFA2023听完了，是Paimon+StarRocks批流一体湖仓分析的大佬嘛？

关于使用Flink RocksDB状态后端时一定要写MapState而非ValueState<Map>这档事（以及解决方法）
前言抱歉起这种烂大街的日本轻小说风格标题来吸引注意力。原本我认为这是常识，不需要专门写一篇文章来讲解如此细碎的点。但是在最近工作巡检中发现了越来越多如同ValueState...

LittleMagic
963 5 8
Hiwayz

关于使用Flink RocksDB状态后端时一定要写MapState而非ValueState<Map>这档事（以及解决方法）
前言抱歉起这种烂大街的日本轻小说风格标题来吸引注意力。原本我认为这是常识，不需要专门写一篇文章来讲解如此细碎的点。但是在最近工作巡检中发现了越来越多如同ValueState...

LittleMagic
963 5 8

Hiwayz

大佬，请问这个是什么版本的Flink呢，我看的是1.15，现在没有lookup，是eval()方法了

Flink 源码之 SQL TableSource 和 TableSink
Flink源码分析系列文档目录请点击：Flink 源码分析系列文档目录[https://www.jianshu.com/p/d4a372809e3d] 前言 Flink S...

AlienPaul
3562 1 3
Hiwayz

Hudi Timeline简析
前言 Long time no see（鞠躬最近终于开始尝试推广Hudi在部门内部的应用，作为流批一体计划的最后一块拼图，顺便复活许久未更的博客，希望今后至少能保持周更的节...

LittleMagic
1917 6 17
Hiwayz

大佬有wx或者其他沟通群嘛？想持续沟通交流一下，我司现在也在研究流批一体的落地，目前是FLink+Iceberg，但是仅限于实时任务比较简单的行为日志数据能够落地

流批一体随想
前言好久不见（鞠躬今年以来的主要工作方向之一就是部门内流批一体能力的建设与落地。虽然这个概念早已成为老生常谈，并且笔者现在还没什么fancy的成果（惭愧），但今天还是想随...

LittleMagic
2471 10 16
Hiwayz

Flink 使用之 CDC 自定义 DeserializationSchema
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 背景本篇接Flink 使...

AlienPaul
7083 0 9
Hiwayz

AlienPaul
写了 324005 字，被 1445 人关注，获得了 989 个喜欢

Java bug搬运工，小数据攻城狮^O^

Hiwayz

Flink
AlienPaul 编，102 篇文章，8 人关注
Hiwayz

浅谈Flink对象重用（object reuse）
前言今天是大年初一，祝各位虎年大吉大利~ 近期受工作变动影响，博客又荒废了许久。今天难得有空，就前段时间内部技术分享里提到的一个小知识点来写几笔。对象重用（object ...

LittleMagic
2417 5 11
Hiwayz

好强啊~还没30年就已经架构师了！像你学习

2021。
2021年的最后几个小时了，抽空来写几笔。待会儿再揭晓年度最佳单曲。健康新冠疫情仍然没有趋缓的迹象。看着近期又开始上涨的确诊病例数，还有承载着不同生活轨迹的流调报告，有时...

LittleMagic
1131 15 7
Hiwayz

kafka 数据可靠性深度解读
1. 概述 Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统，后成为Apache的一部分，它使用Scala编写，以可水平扩展和高吞吐率而被广泛使用。目前越来越...

尼小摩
1446 0 17
Hiwayz

spark-streaming与kafka的整合
1. 概述在2.x中，spark有两个用来与kafka整合的代码，版本代号为0.8和0.10，由于在0.8，kafka有两套消费者api，根据高级api得到了Receive...

王大为学习笔记
1036 0 1

Hiwayz

HiveSQL解析过程详解
Hive是基于Hadoop的一个数据仓库系统，在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建，每天执行近万次的Hive ETL计算流程，负责每天数百GB的数据存储...

尼小摩
1531 0 9
Hiwayz

尼小摩
写了 304289 字，被 593 人关注，获得了 953 个喜欢

我曾以为 黎明之后太阳就会升起 就会有光 后来才知道 原来黑夜和黎明之间 还有一个时刻叫破晓 破晓之后 新的一天才正式开始。。。