最近在做的工作比较需要一个支持任务编排工作流的框架或者平台,这里记录下实现上的一些思路。 任务编排工作流 任务编排是什么意思呢,顾名思义就是可以把"任务"这个原子单位按照自己...
Hbase 读取复杂原因: 主要基于两个方面的原因: 一是因为HBase一次范围查询可能会涉及多个Region、多块缓存甚至多个数据存储文件(HFile); 二是因为HBas...
GremlinScriptEngineManager JSR223,是java 的脚本引擎,gremlin 使用groovy 作为脚本语言来定义gremlin 整个 grem...
什么是查询优化器 查询优化器是传统数据库的核心模块,也是大数据计算引擎的核心模块,开源大数据引擎如 Impala、Presto、Drill、HAWQ、 Spark、Hive ...