日前,ApacheHive2.1极速登场!携着内存计算,其性能提高了约26倍。Hive计算性能得到如此大的提升,是得益于什么呢?Hive能够影响目前SQL On Hadoop...
IP属地:北京
日前,ApacheHive2.1极速登场!携着内存计算,其性能提高了约26倍。Hive计算性能得到如此大的提升,是得益于什么呢?Hive能够影响目前SQL On Hadoop...
本篇文章尝试从What、Why、How这三个角度来探索Java中的弱引用,帮助大家理解Java中弱引用的定义、基本使用场景和使用方法。由于个人水平有限,叙述中难免存在不准确或...
我常常问面试者,“你最喜欢的编程语言是什么?” 答案几乎如出一辙,“工作中我只选择正确的编程语言。” 废话,谁会故意选择错误的语言呢?这显然是为了逃避选择一种具体的编程语言,...
将多份数据进行关联是数据处理过程中非常普遍的用法,不过在分布式计算系统中,这个问题往往会变的非常麻烦,因为框架提供的 join 操作一般会将所有数据根据 key 发送到所有的...
Spark DataSource API 的提出使得各个数据源按规范实现适配,那么就可以高效的利用Spark 的计算能力。典型如Parquet,CarbonData,Post...
前一段时间自己开发了一套基于Yarn的容器调度系统,这篇文章就是分享其中的一些经验。 前言 这篇文章不会具体教你如何使用Yarn的API,但是会教你我实践过后的一些经验。接下...