6篇文章 · 2263字 · 1人关注
Zookeeepr设计原理 分布式系统 什么是分布式系统 《分布式系统概念与设计》一书定义分布式系统是一个硬件或软件组件分布在不同的网络计算机上...
Kafka基本原理 Kafka 简介 Kafka由Linkedin开发的消息队列,使用Scala语言编写 分布式、多分区、多副本、基于发布/...
MapReducer
下载数据 wget http://labfile.oss.aliyuncs.com/courses/536/1987.csv.bz2bunzip...
Spark产生背景 ➢ MapReduce局限性• 仅支持Map和Reduce两种语义操作• 处理效率低,耗费时间长• 不适合处理迭代计算、交互...
Hadoop 简介 Hadoop是开源的分布式的并行计算平台,以MapReduce、HDFS为核心的计算框架,HDFS为海量的数据提供了存储,则...
文集作者