简书社区内容管理公告 近期简书依照《网络安全法》《互联网信息服务管理办法》《互联网新闻信息服务管理规定》等相关法律法规,对社区内容进行调整,调整期间会出现文章锁定情况,简书运...
简书社区内容管理公告 近期简书依照《网络安全法》《互联网信息服务管理办法》《互联网新闻信息服务管理规定》等相关法律法规,对社区内容进行调整,调整期间会出现文章锁定情况,简书运...
Kafka的一些概念 Broker : 安装Kafka服务的那台集群就是一个broker(broker的id要全局唯一) Producer :消息的生产者,负责将数据写入到b...
到了今天我才恍惚知道,原来骗我的是个警察 事情的起因很简单,因为我想把王者荣耀的号卖掉,所以,有了接下来的故事。 三天前...... 当我想卖掉王者号的时候,就这样有个人(以...
RDD和它依赖的父RDD(s)的关系有两种不同类型,即窄依赖(narrow dependency)和 宽依赖(wide dependency) 窄依赖: 一:map、filt...
方式一: package Day05 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, ...
SparkSql现在有两个版本,方式如下: 方式一:使用sql版本 //提交的这个程序可以连接到spark集群中 val conf =new SparkConf().s...
现有100W+条数据,格式如下: 3|2016年9月16日,星期五,23:13:09|192.168.1.102|那谁|武士|男|27|0|175510/800000000 ...
1.什么时候使用checkpoint (1)迭代计算,要求保证数据安全 (2)对速度要求不高(跟cache进行对比) (3)将中间结果保存到hdfs //设置checkpoi...
1.aggregate: 先进行局部聚合,在进行全局聚合 val z = sc.parallelize(List(1,2,3,4,5,6), 2) z.mapPartiti...