对于目前基于k8s的的spark应用,主要采用两种方式运行 spark原生支持的 spark on k8s[http://spark.apache.org/docs/3.0....
RDD依赖关系与stage划分 Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系。 1. 窄...
资料整理,图片来源自互联网,如有侵权请联系删除--李小李 1-Spark Shuffle发展史 1.1 Shuffle概述 在Spark的源码中,负责shuffle过程的执行...
MapReduce简介 在Hadoop MapReduce中,框架会确保reduce收到的输入数据是根据key排序过的。数据从Mapper输出到Reducer接收,是一个很...
Impala概述 Impala是什么 Impala是一款针对HDFS和HBASE中的PB级别数据进行交互式实时查询工具。最大的特点就是速度快 Impala优势 Impala的...
本文借鉴了swift官方资料,以及网络公开可查的技术文档或者图片,非绝对原创,向开源领域的贡献者和传播者致敬。 openstack swift 架构简单介绍 Swift简介 ...
本文借鉴了ceph官方资料,以及网络公开可查的技术文档或者图片,非绝对原创,向开源领域的贡献者和传播者致敬。 架构简单介绍 Ceph介绍 Ceph是一个分布式存储系统,提供对...
文/怀左同学 01 大四的时候,我跟着老潘工作过一段时间,他当时在做生意,而我,帮他看管其中的一处。 他比我大八九岁,聊城人,之前在北京工作了几年,面带风尘,用他的话来讲:“...