如果云知道_3dfd

发简信

如果云知道_3dfd

49
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
10

总资产

IP属地：北京

如果云知道_3dfd

本地部署DeepSeek R1与RAG简单实验
前言叠个甲，流水账，非专业，只是蹭一下DeepSeek的热度（实验环境为家用PC，配备NVidia GeForce RTX 4090D显卡、AMD锐龙9 9950X处理器...

LittleMagic
718 0 3
如果云知道_3dfd

Flink 双网分离环境使用问题解决记录
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 前言本文为大家分享博主在...

AlienPaul
79 0 2

如果云知道_3dfd

Apache Flink 2.0：Streaming into the Future
本文整理自宋辛童（阿里云智能高级技术专家）老师，梅源（阿里云智能资深技术专家）、李麟（阿里云智能高级技术专家）老师，在 Flink Forward Asia 2024 主会场...

Flink中文社区
86 0 1
如果云知道_3dfd

再谈Java类型擦除与其对Flink类型和序列化的影响
前言本文前半部分的内容在很久之前讲过，但是最近又有交接到团队内的历史任务出现这方面导致的性能问题，故有必要再讲一次，并扩展一部分新内容。先通过两个例子来引入Java类型擦除...

LittleMagic
223 0 3
如果云知道_3dfd

饿了么基于Flink+Paimon+StarRocks的实时湖仓探索
摘要：本文整理自饿了么大数据架构师、Apache Flink Contributor 王沛斌老师在8月3日 Streaming Lakehouse Meetup Online...

Flink中文社区
243 0 2
如果云知道_3dfd

2024人生主线混乱
人生主线混乱最近一年真的是啥也没搞….一直是一个半途而废的糕手…一直想搞搞计算机其他方向的东西之前花了俩三周学前端技术,后面到css和布局直接搞懵了,直接没啥搞的欲望了,...

冰菓_
86 0 2
如果云知道_3dfd

StarRocks Elasticsearch Catalog原理简析
前言 Elasticsearch不仅是强大的全文搜索引擎，在很多场景下（特别是TiDB、ShardingSphere等框架成熟之前）也被当做分布式HTAP数据库使用，在存储、...

LittleMagic
528 0 3

如果云知道_3dfd

Flink 使用之Yarn session模式和application模式对比
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 前言 Flink提供了Ya...

AlienPaul
459 0 3
如果云知道_3dfd

聊聊存算分离StarRocks的垃圾清理机制
前言大家已经了解，StarRocks的更新模型、主键模型等在Flush和Compaction过程中会产生历史版本数据，这些垃圾数据需要及时被清理，以防止存储空间浪费。而St...

LittleMagic
1102 0 5
如果云知道_3dfd

Hudi 使用之Flink读写
前言本篇从Hudi角度介绍Flink常用的几种读写操作。内容主要来源于官网例子和个人理解。读者如果想了解从编译、部署到使用的步骤，请参考：Flink 使用之 Hudi 编...

AlienPaul
1271 0 5
如果云知道_3dfd

浅谈Deletion Vector及其在StarRocks中的应用
前言我们知道，列式存储的数据组织形式使得它适合海量数据在线查询、分析的场景，而写入性能相对于读取性能似乎并不那么重要（传统的ORC / Parquet on Hive方案就...

LittleMagic
884 1 6
如果云知道_3dfd

Hudi 源码之 Clustering
什么是Clustering 开门见山，Clustering主要有两个作用：数据小文件合并和重排序。当数据写入Hudi表时，为了提高写入效率和存储利用率，可能会产生大量小文件。...

AlienPaul
488 0 4

如果云知道_3dfd

Hudi 源码之 Flink Table Service 排期和执行
前言 Hudi Flink支持配置table service的异步执行。Schedule的时机为checkpoint完成的时候。执行过程在线程池中完成。Flink Hudi ...

AlienPaul
245 0 2
如果云知道_3dfd

Hudi 源码之数据写入逻辑
背景本篇以Flink操作Hudi表为例，分析COW表和MOR表的upsert以及insert操作详细的执行流程。 StreamWriteFunction Hudi Flin...

AlienPaul
1932 0 4
如果云知道_3dfd

Flink 使用之Kafka exactly-once场景
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 前言近期一个需求是写一套...

AlienPaul
651 0 5
如果云知道_3dfd

Flink 使用之Checkpoint配置
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 前言本篇接Flink 使...

AlienPaul
8980 1 3
如果云知道_3dfd

Flink 使用之WatermarkStrategy（含源码分析）
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] 前言概括来说，water...

AlienPaul
2167 1 3

如果云知道_3dfd

Spark 使用之操作Hudi表
Hudi Spark使用本篇为大家带来通过Spark shell和Spark SQL操作Hudi表的方式。 Hudi表还可以通过Spark ThriftServer操作，参...

AlienPaul
688 0 2
如果云知道_3dfd

Hudi 源码之 Cleaning service
Clean的概念 Hudi表拥有时间线(Timeline)。可以理解为Hudi表的修改日志。Hudi不仅记录了什么时候发生了何种类型修改，还记录了这次修改对应的数据文件。这些...

AlienPaul
483 0 3
如果云知道_3dfd

Hudi 源码之Bucket Index
背景对于Upsert操作，Hudi需要定位到数据所在的File Group。当File Group很多的时候，定位File Group的过程会成为性能瓶颈。 Hudi 提供...

AlienPaul
995 0 2