大数据技术峰会解读

发简信

大数据技术峰会解读

11
关注
91
粉丝
7
文章
20354

字数
54

收获喜欢
2

总资产

IP属地：福建

祝威廉

CarbonData实践(一)
前言 CarbonData 拥有不错的明细查询能力，比如简单的where条件过滤，性能大概是Parquet的20倍。数据的聚合分析方面，如果有不错的where过滤，则相当一部...

5665 1 14 2
悟成

一个简单的数据分析方案
大数据到数据挖掘过程中理想和现实差别非常的大。很多人开始接触大数据都是被大数据的分析、挖掘等吸引，但是现实却是面对大公司纷繁复杂的系统和应用，如何将不同系统的数据整合在一起便...

3145 0 49
玄月府的小妖在debug

Spark On YARN 集群安装部署
本文展示了在之前搭建的Hadoop分布式集群的基础上如何搭建Spark分布式集群环境一、已有环境 ubuntu 14.04hadoop 2.7.1 集群安装参考三台机器ma...

4818 6 12
DayDayUpppppp

hadoop使用Java API 访问hdfs的数据
使用hadoop dfs的api 来访问访问数据。看来一些资料和书，其实代码很简单，就是必须把需要的包，都带上就可以了。另外，要确保hadoop dfs是开启的。随便起...

1260 0 6
DayDayUpppppp

一个简明的Mapreduce 原理分析
1. mapreduce 简介 mapreduce源自google的一篇文章，将海量数据处理的过程拆分为map和reduce。mapreduce 成为了最早的分布式计算框架，...

8788 0 7
大数据技术峰会解读

Alluxio (前身为Tachyon) 加速 Spark 数据分析
今天解读的内容是来自 Spark Summit EU 2016 关于 Alluxio 的一个介绍：Effective Spark with Alluxio （视频：http...

952 3 11
祝威廉

Spark之殇
我觉得Spark有时候会伤害用户。之前Spark 2.0 刚发布不久后的第一个小版本，Structured Streaming 终于支持Kafka了，但是只支持Kafka ...

3145 5 14 3