Shuffle Write 请看 Shuffle Write解析。 本文将讲解shuffle Reduce部分,shuffle的下游Stage的第一个rdd是ShuffleR...
![240](https://cdn2.jianshu.io/assets/default_avatar/2-9636b13945b9ccf345bc98d0d81074eb.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP属地:山西
Shuffle Write 请看 Shuffle Write解析。 本文将讲解shuffle Reduce部分,shuffle的下游Stage的第一个rdd是ShuffleR...
背景 最近公司如火如荼的进行中台建设,各种业务中台涌现,迫切想知道中台的发展规划和关键解决问题,比较庆幸看到了这本书《企业IT架构转型之道-阿里中台战略思想与架构实战》应该是...
本文旨在介绍 Spark 通过JDBC读取数据时常用的一些优化手段 关于数据库索引 无论使用哪种JDBC API,spark拉取数据最终都是以select语句来执行的,所以在...
1 层级结构 Table (HBase 表) Region(表的Regions)Store(Region中以列族为单位的单元)MemStore (用于写缓存)Stor...