240 发简信
IP属地:北京
  • Resize,w 360,h 240
    Spark计算模型与I/O机制

    Part 1 1. Spark计算模型 1.1 Spark程序模型 首先通过一个简单的实例了解Spark的程序模型。 1)SparkContex...

  • Spark1.5.0的安装和部署

    一、Spark集群部署 1、软件版本 OS版本:Ubuntu 14.04 Hadoop版本:Hadoop 2.6.0 JDK版本:Jdk1.8....

  • 白日梦30篇——送给美丽的妳

    婉柔绰约,婷婷玉立 柔情似水,如碧波荡漾 甜美的微笑,月牙的慧眼 让人停眸,让人心动 大家闺秀的气质,小家碧玉的神色 让人怜爱,让人守护 静待妳...

  • Yarn Client模式下启动Spark的配置问题

    由于YARN client模式对用户不直接暴露用于提交YARN程序的辅助程序,因此许多参数是通过环境变量来设置的,可以在spark-env.sh...

  • 生如夏花の语录

    茶余饭后,品一品茗,看一看书,是何等的幸事。特别喜欢泰戈尔的《生如夏花》,活就要活得有姿态,有温度,有力度。下面是我最喜欢的60句话。 1.时间...

  • Resize,w 360,h 240
    Spark算子:统计RDD分区中的元素及数量

    Spark RDD是被分区的,在生成RDD时候,一般可以指定分区的数量,如果不指定分区数量,当RDD从集合创建时候,则默认为该程序所分配到的资源...

  • 在Ubuntu Server 14.04上安装Ganglia 3.6.1监测Spark on Yarn集群

    关于 Ganglia 软件,Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,如集群和网格。它是基于分层设计,它使用广泛的技...

个人介绍
北京大学硕士,专注于Hadoop和Spark大数据平台的机制研究和性能调优