IP属地:河南
超越感觉,是一本经典著作。从1975年出版,长达几十年的时间一直再版,截止到2017年末已经到了第九版第2次出版。 这本书的副标题是“批判性思维”,全书围绕着...
1.spark的shuffleManager是负责shuffle过程的执行、计算和处理的组件。shuffleManager是trait,主要实现类有两个:HashShuffl...
本文根据2016年7月北京IBM Spark沙龙上的分享讲稿整理而成。 大家好,我是来自GrowingIO的数据工程师付旗,今天跟大家分享的是我们GrowingIO在使用Sp...
1.登录码云:https://git.oschina.net/ 并新建git库,并复制git库地址,如:https://git.oschina.net/xmwj/sparkA...
1. 在SparkContext实例化的时候调用createTaskScheduler来创建TaskSchedulerImpl和SparkDeploySchedulerBac...
1. Application:Spark 的应用程序,用户提交后,Spark为App分配资源,将程序转换并执行,其中Application包含一个Driver program...
Spark SQL比Hadoop Hive快,是有一定条件的,而且不是Spark SQL的引擎比Hive的引擎快,相反,Hive的HQL引擎还比Spark SQL的引擎更快。...