最近有一个项目需要用到kafka分布式订阅发布消息系统,于是抽空的时候学习了一下关于kafka的一些事,同样在这里记录相关的笔记。最开始当然就是...
上一篇记录了HBase的shell中的基本操作,这一篇看看用java来实现那些相应的操作。 首先进入hadoop目录和Hbase目录,将伪分布式...
在这里,与前面Hadoop相同,由于设备受限,HBase我还是进行的伪分布式的安装。虽然是伪分布式的,但在使用上还是差不多。先学习在伪分布式上的...
HBase是Apache基金会的一个项目,是一个分布式可扩展的NoSQL数据库,提供了对结构化、半结构化、甚至非结构化大数据的实时读写和随机访问...
wordCount程序是hadoop中自带的一个程序,能够进行词数的统计。它的位置在hadoop目录下的share/hadoop/mapredu...
这一篇文章记录一下hadoop中的分布式运算MapReduce的过程,作为《深入理解大数据》的学习笔记。 上一篇看了HDFS的基本操作,这一篇来...
这篇文章先记录一下在java代码中对hdfs的基本操作。 打开eclipse,新建一个Map/Reduce工程。后台运行起hadoop。可以看到...
在hadoop伪分布式环境搭建好之后,我们就可以进行hadoop应用的开发了。hadoop是用java写的,也提供了java开发包,我们需要先下...
hadoop是处理大数据的得力帮手,它主要分为三种模式: 单机模式;伪分布式模式;完全分布式模式; 在这篇文章中,主要来看看在CentOS7中进...
文集作者