前言 参考资料:《Spring Microservices in Action》《Spring Cloud Alibaba 微服务原理与实战》《B站 尚硅谷 SpringCl...
前言 参考资料:《Spring Microservices in Action》《Spring Cloud Alibaba 微服务原理与实战》《B站 尚硅谷 SpringCl...
1.背景 开发部门决定在Apache Ranger开源社区贡献代码,目标是个人国内排名Top1,世界排名Top2,并且在已经成为Ranger项目的Committer情况下,争...
由于这部分内容涉及到很多 Lucene 和操作系统等内容,个人理解可能不到位或者有误,还请各位看客指出存在的问题,不吝赐教 1. 重要知识点(有瑕疵,往下看) 1. refr...
原载于简书[https://www.jianshu.com/p/420ddb3bde7f],本篇主要是介绍Hive在MySQL中存储的源数据的表结构。 Hive MetaSt...
工作中常用的 hive 参数调优,整理如下。原则:• 最少数据• 最少字段• 最少Job数• 最少读取次数• 避免数据倾斜• 整体最优而不是局部最优• JVM 内存 文件大小...
要问当前什么BI工具最热门,那肯定非PowerBI莫属,知乎、B站经常出现各类使用教程,堪比BI界的Python。 对于我这种用惯了Tableau来说,确实会有些眼红Powe...
Hive 调优-参数篇 <** 工作中常用的 hive 参数调优,整理如下。 原则: 最少数据 最少字段 最少Job数 最少读取次数 避免数据倾斜 整体最优而不是局部最优 J...
hive 控制map 和reduce的数目: map的数目: map数目是与split的数目一一对应的。 所以split的数目就是决定了map的数目。 split的切割算法:...
对hive输入格式设置为CombineHiveInputFormat的进行分析map数是如何计算的。 set hive.input.format=org.apache.had...