240 发简信
IP属地:山东
  • 1. InputFormat 数据输入

    1 切片与MapTask并行度决定机制 MapTask并行度决定Map阶段的任务处理并发度,进而影响Job的处理速度 MapTask并行度决定机...

  • Resize,w 360,h 240
    Hadoop集群搭载经历之hadoop配置

    tps:同样方式上传hadoop安装包并且解压到/opt/同样方式配置hadoop环境 1. 各个服务器节点之间配置免密码登录(对自己也要配置)...

  • Resize,w 360,h 240
    Hadoop集群搭载经历之jdk配置

    tips:运行hadoop的话必须在服务器上面配置jdk,提前自己下好 1.将jdk传到linux 在cmd里面输入sftp root@xxx....

  • Resize,w 360,h 240
    Hadoop集群搭载经历之linux配置ip

    tips:我选择的是centos7最小化安装。 1. 查看并配置windows网卡(vmware的虚拟网卡) 1.0 安装虚拟机时要采用nat网...

  • Hadoop_MapReduce自定义Bean序列化

    实现序列化需要七步 实现Writable接口 反序列化是需要调用空参构造方法,所以需要创建空参构造方法。 重写序列化方法(writer) 重写反...

  • javaIO流

    Tips:File是java.io包下的类可以完成删除、重命名、新建文件和文件夹。 IO流分类: 输入流和输出流输入流:只能从中读取数据,而不能...

  • Hadoop——MapReduce——WordCount手写经历

    因为我的是mac而且把shell换成了zsh所以在配置maven环境变量时,并不是在.bash_profile里面配置而是在.zshrc里面配置...

  • Hadoop之MapReduce学习总结

    优点 MapReduce 易于编程,仅仅实现一些简单的接口,就可以完成一个分布式程序。并且部署到廉价的服务器上。良好的扩展性,通过简单的增加服务...

  • Resize,w 360,h 240
    hdfs学习总结

    hdfs:Hadoop Distributed File System (Hadoop 分布式文件系统) 1.特点: 一次写入多次读出,并且不支...