1. Hive总结-常用函数 学习书目:https://zhuanlan.zhihu.com/p/82601425[https://zhuanl...
全排序优化: 把所有具有相同的行最终都在一个reducer分区中,再在一个reducer中排序。cluster by column=(distr...
1savepoint checkpoint savepoint是checkpoint的一种特殊方式,手动保存,其实就是指针。savepo...
第一题:tb1: url, ts对于每个url,分别求在哪一秒点击量最大,最大值是多少?ps:ts是毫秒级int的时间戳。 第二题:tb2: u...
1.集群间文件\文件夹同步脚本 !! 集群同步脚本 准备:所有主机安装 rsync 工具sudo yum -y install rsync输入密...
-----------自动代码-------- 常用的有fori/sout/psvm+Tab即可生成循环、System.out、main方法等b...
step1: 如果需要被删除topic 此时正在被程序 produce和consume,则这些生产和消费程序需要停止。 必须设置auto.cre...
收藏小记 侵权立删1、基于boolean类型的控制变量 while循环: for循环:(高级for循环,加上了if守卫) 2、使用嵌套函数以及r...
环境:CDH5.12.1 1.在Hue提交oozie运行shell脚本,报错! 错误: FileNotFoundException: File ...