一、函数式接口 函数式接口的定义: 函数式接口(Functional Interface)就是一个有且仅有一个抽象方法,但是可以有多个非抽象方法...
一:企业级数仓多事务事实表的重要性 整个企业级的数据仓库,从表的性质来分,有维度表和事实表,事务表又分为多事务事实表,累积快照事实表,周期型快照...
一、有状态计算 在flink的结构体系当中,有状态的计算可以说是flink非常重要的特性之一了。有状态的计算是指在程序计算过程中,在flink程...
一、flink支持的时间概念类型 1.1、流计算与时间属性密不可分 相比较于离线计算,流计算往往离不开讨论时间这个概念,因为离线计算是有界数据,...
《Spark性能优化:开发调优篇》《Spark性能优化:资源调优篇》《Spark性能优化:数据倾斜调优》《Spark性能优化:shuffle调优...
《Spark性能优化:开发调优篇》《Spark性能优化:资源调优篇》《Spark性能优化:数据倾斜调优》《Spark性能优化:shuffle调优...
《Spark性能优化:开发调优篇》《Spark性能优化:资源调优篇》《Spark性能优化:数据倾斜调优》《Spark性能优化:shuffle调优...
一、前言 本文将对Spark的内存管理模型进行分析,下面的分析全部是基于 Apache Spark 2.2.1 进行的。为了让下面的文章看起来不...
一、spark scheduler(spark任务调度) 在使用spark-summit或者spark-shell提交spark程序后,根据提交...