240 发简信
IP属地:湖南
  • Tkinter模块找不到,解决方法

    import Tkinter模块在 python 3.x 和 python 2.x 之间的差别: 注意:首字母大写和小写的区别! 安装tk相关的包,需要配置好yum源,一般就...

  • 2.安装Apache Spark 2.1

    前言: cloudera自带的Spark版本较低,通过Apache Spark官网下载并安装Spark 2.1版本,分为单机和集群两种安装部署方式。 一、下载Spark 2....

  • Linux升级Python至3.4.5

    前言: Python版本比较低(2.6.6),为了使用新版 3.4.5,需要对旧版本进行升级,由于很多基本的命令、软件包都依赖旧版本,比如:yum。所以,在更新 python...

  • 1.Spark前言

    比MapReduce更快速 MapReduce是基于磁盘IO的,无论过程还是结果都要写入磁盘,并且无法迭代。而Spark只是在第一次运行时需要磁盘IO,之后的迭代都是基于内存...

  • 4.HDFS进阶:数据与元数据之间的关系

    查看NameNode.java源文件 The NameNode controls two critical tables: filename->blocksequence (...

  • 3.HDFS的数据与元数据

    查看HDFS配置文件 找到dfs.namenode.name.dir的位置 读取元数据文件 注意:返回值为0表示上一条指令执行成功 查看fsimage.xml,找到block...