阅读ClickHouse源码时,觉得这里的Block拆分为DataPart这个流程还蛮有意思的。 1. 拆分并未按行进行拆分 2. 拆分并未直接一次(拿着Block挨个遍历)...
阅读ClickHouse源码时,觉得这里的Block拆分为DataPart这个流程还蛮有意思的。 1. 拆分并未按行进行拆分 2. 拆分并未直接一次(拿着Block挨个遍历)...
ORC是RCfile的优化版本 关于Hive的文件格式 TEXTFILE 默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。源文件...
http://blog.csdn.net/yu616568/article/details/51868447背景随着大数据时代的到来,越来越多的数据流向了Hadoop生态圈,...
作者介绍: 张春源 希云cSphere 合伙人,国内早期的容器布道者,对企业应用容器化有丰富的实践经验,擅长利用容器践行 Devops 文化。国内第一套容器系列实战视频课程讲...