刚刚看完我和我的家乡,感觉还不错哈~主要讲了:1.北京-《北京好人》医保问题(没有买医保,导致看病贵,蒲公英那段是很多家庭的真实写照)2.贵州-...
1 redis 的工作原理 答: redis 是一个 k-v 存储系统和 memcached 类似,它支持存储的value 类型相对的多,包括 ...
数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为企业提供决策支持 (Decis...
大纲 1.SparkStreaming 介绍2.SparkStreaming 原理与架构3.DStream 介绍4.DStream 相关操作5....
1. 概述 shuffle 就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂.在 MapReduce框架,Shuffl...
RDD的 Shuffle 和 分区 RDD的分区操作2.Shuffle 的原理 分区的作用 RDD 使用分区来分布式并行处理数据,并且要做到尽量...
1.新建一个文件夹,并放入我们的winutils.exe文件. 2. 我们把这个路径写上去就好了. 3. 目前的结构 4. 这是mode 和 我...
Spark core Insight 1.深入理解 RDD 的内在逻辑 能够使用 RDD 的 算子 理解 RDD 算子的 Shuffle 和 缓...
1.1 Spark 是什么 Apache Spark 是一个快速的,多用途的集群计算系统,相当于Hadoop MapReduce ,Spark ...