240 发简信
IP属地:天津
  • spark序列化问题

    1.Spark的transformation操作为什么需要序列化? Spark是分布式执行引擎,其核心抽象是弹性分布式数据集RDD,其代表了分布...

  • hive基本操作之二

    1.查找数据到本地 insert overwrite local directory '/home/mydir/mydir' select ....

  • Resize,w 360,h 240
    hive基本操作之一

    1.hive表中的基本数据类型 2,hive创建分区表 2.1内部表 建表语句: create table table_name( F...

  • shell入门

    awk sed grep expr let

  • hive调优

    1,参数调优 hive.map.aggr = true hive.groupby.skewindata =true 2,

  • spark内核启动流程

    1.,用户提交Application 2,启动Driver进程 3,注册Application 4,启动Executor 5,启动Task执行 ...