leon894 - 简书

发简信

leon894

14
关注
1
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：河北

tenlee

Kafka的分区数和消费者个数
Kafka的分区数是不是越多越好？分区多的优点 kafka使用分区将topic的消息打散到多个分区分布保存在不同的broker上，实现了producer和consumer消...

69314 9 26
两棵橘树

KUDU 介绍
前言近两年，KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中，KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计，试图解释为什么...

100810 4 60
chenfh5

Spark性能优化总结
总结一下个人看了一些Spark性能调优文章之后的理解，主要框架来自于meituantech，会在此框架上加入个人关注点，目录如下， Overview Spark的瓶颈一般来自...

16063 2 29
HxLiang

Spark盖中盖（一篇顶五篇）-3 DAG详解
前方高能，减速慢行！看过了Spark的核心RDD和RDD算子以后，感觉Spark是不是很神奇，竟然可以减少计算次数，优化计算。对于窄依赖是这样的，但是宽依赖怎么办？还是要等...

10559 3 15
HxLiang

Spark盖中盖（一篇顶五篇）-2 RDD算子详解
前方高能减速慢行！在上一篇RDD结构已经介绍完了。虽然RDD结构是spark设计思想最重要的组成，但是没有辅助的功能只有结构又不能独立使用。真正使RDD完成计算优化的，就是...

8700 0 11
HxLiang

Spark盖中盖（一篇顶五篇）-1 RDD的数据结构模型
前言：自Google发表三大论文GFS、MapReduce、BigTable以来，衍生出的开源框架越来越多，其中Hadoop更是以高可用、高扩展、高容错等特性形成了开源工业界...

11859 4 18
huamulou

java程序员，不懂JIT，你写的代码慢死了
努力做程序员中的标题党，这个文章的副标题面向JIT编程-方法内联 JIT的全称是Just in time compilation，中文称之为即时编译。JIT是JVM最强大的...

11160 2 13