240 发简信
IP属地:广东
  • Tensorflow学习笔记

    《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》

  • Python学习笔记

    1、字符串2、元组3、列表4、集合5、字典

  • SparkMLlib学习笔记

    1、SparkRDD创建操作2、SparkRDD转换操作3、SparkRDD行动操作

  • 120
    【Hazelcast系列一】Hazelcast 概览

    声明 本系列文章为学习Hazelcast的笔记,内容大部分都为官方文档翻译,如果对Hazelcast感兴趣,可移步Hazelcast查看官方原版文档。 学习目的 公司项目服务...

  • 120
    JDK8新特性

    一、Lambda表达式二、方法调用(双冒号)的用法三、Stream函数式操作流元素集合四 、接口新增:默认方法与静态方法五、最新的Date/Time API 一、Lambda...

  • Python字符串操作

    一、字符串格式化 Python有三种字符串格式化方法:百分号方式,format方式,模板方式 1、百分号方式 2、format方式 3、模版方式 模版方式需要导入string...

  • Hive自定义UDF函数

    在hive中,有时候一些内置的函数,和普通的查询操作已经满足不了我们要查询的要求,这时候可以自己写一些自定义函数来处理。自定义函数(user defined function...

  • HBase的rowkey设计

    HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对H...

  • HBase集群运维与优化

    1、HBase安全重启HRegionServer 以上命令执行的时候,HBase会把hostname下的region安全转移到集群的其他机器中,然后再重启,重启完成后再迁移回...

  • 120
    HBase存储架构

    上图是HBase的存储架构图。 由上图可以知道,客户端是通过Zookeeper找到HMaster,然后再与具体的Hregionserver进行沟通读写数据的。 具体到物理实现...

  • 120
    HBase存储架构

    上图是HBase的存储架构图。 由上图可以知道,客户端是通过Zookeeper找到HMaster,然后再与具体的Hregionserver进行沟通读写数据的。 具体到物理实现...

  • HBase与LSM树

    一、LSM树的原理 讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来: 哈希存储引擎是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫...

  • Hadoop添加和移除节点

    一、添加节点 将新节点的网络地址添加到include文件中 运行以下命令,将审核过的一系列datanode集合更新至namenode信息: hdfs dfsadmin -...

  • Hadoop序列化和反序列化

    在hadoop中实现了一套自己的序列化框架,相对于JDK自带的序列化工具,它更加简洁,在集群信息的传递上速度更快,容量更小。特点如下: 1. 数据紧凑带宽是集群中信息传递的最...

  • 120
    Hadoop压缩

    Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速...

  • 120
    MapReduce处理过程

    以下使用Hadoop的经典程序WordCount来说明MapReduce的处理过程,完整代码如下: 输入数据: 则以上的程序处理过程如下: 上图中从Mapping阶段到Shu...

  • 120
    YARN的三种调度器

    在Yarn中有三种调度器可以选择:FIFO Scheduler ,Capacity Scheduler,FairS cheduler。它们的区别如下: 1、FIFO Sche...