1 切片与MapTask并行度决定机制 MapTask并行度决定Map阶段的任务处理并发度,进而影响Job的处理速度 MapTask并行度决定机...
tps:同样方式上传hadoop安装包并且解压到/opt/同样方式配置hadoop环境 1. 各个服务器节点之间配置免密码登录(对自己也要配置)...
tips:运行hadoop的话必须在服务器上面配置jdk,提前自己下好 1.将jdk传到linux 在cmd里面输入sftp root@xxx....
tips:我选择的是centos7最小化安装。 1. 查看并配置windows网卡(vmware的虚拟网卡) 1.0 安装虚拟机时要采用nat网...
实现序列化需要七步 实现Writable接口 反序列化是需要调用空参构造方法,所以需要创建空参构造方法。 重写序列化方法(writer) 重写反...
Tips:File是java.io包下的类可以完成删除、重命名、新建文件和文件夹。 IO流分类: 输入流和输出流输入流:只能从中读取数据,而不能...
因为我的是mac而且把shell换成了zsh所以在配置maven环境变量时,并不是在.bash_profile里面配置而是在.zshrc里面配置...
优点 MapReduce 易于编程,仅仅实现一些简单的接口,就可以完成一个分布式程序。并且部署到廉价的服务器上。良好的扩展性,通过简单的增加服务...
hdfs:Hadoop Distributed File System (Hadoop 分布式文件系统) 1.特点: 一次写入多次读出,并且不支...