一.功能实现: 1:将本地文件上传到HDFS上 2:从HDFS上读取文件到本地 3:删除HDFS上的文件 4:遍历HDFS上的文件 注: 1:导...

收录了11篇文章 · 5人关注
一.功能实现: 1:将本地文件上传到HDFS上 2:从HDFS上读取文件到本地 3:删除HDFS上的文件 4:遍历HDFS上的文件 注: 1:导...
1.分布式计算思想: 1.1基本思想:mapreduce是两个操作步骤,即映射和规约也是这个分布式计算的思想。即实现一个指定的Map映射函数,用...
技能树大数据.png
先思考问题 我们处在一个大数据的时代已经是不争的事实,这主要表现在数据源多且大,如互联网数据,人们也认识到数据里往往隐藏着规律或模式,能够带来巨...
倾情大奉送--Spark入门实战系列 - shishanyuan - 博客园http://www.cnblogs.com/shishanyuan...
Spark API 详解/大白话解释 之 RDD、partition、count、collect - 郭同jet · 静心 - 博客频道 - C...
Apache Spark RDD API Exampleshttp://homepage.cs.latrobe.edu.au/zhe/ZhenH...
Spark技术内幕:Executor分配详解 - 推酷http://www.tuicool.com/articles/VVFnIfq
使用hadoop dfs的api 来访问访问数据 。 看来一些资料和书,其实代码很简单,就是必须把需要的包,都带上就可以了。另外,要确保hado...
所有网站的服务器上都会保留访问的log日志。这些log日志记录的其他机器访问服务器的ip,时间,http协议,状态码等信息。 比如这样: 大型网...
专题公告
hadoop基础