240 投稿
收录了1篇文章 · 4人关注
  • Resize,w 360,h 240
    Spark技术内幕++深入解析Spark内核架构设计与实现原理(一)

    spark技术背景 大多数现有的集群计算系统都是基于非循环的数据流模型。即从稳定的物理存储(如分布式文件系统)中加载记录,记录被传入由一组确定性...

  • Spark踩坑之路

    当以cluster/client运行spark时候,运行在如下所示,没有任何异常报错。 接下来就是找日志,发现卡在hadoop-slave1节点...

  • Yarn, Hbase日志

    cdh默认安装,日志都在/var/log下,先找这里最方便 yarn 查看某个具体的applicationid的log:yarn logs -a...

  • Spark API - RDD

    转摘地址: Spark笔记:RDD基本操作(上) RDD本质就是一个数组,因此构造数据时候使用的是List(链表)和Array(数组)类型。 R...