需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价值消费品 (定位高价值消费品以...
需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价值消费品 (定位高价值消费品以...
使用场景 需要查找最近修改时间在指定范围内的hive表或者hive表的相关分区,代码如下:
日常检查ETLjob时发现一段sql采用hive on mr执行比hive on spark要快70%,与正常的认知正好相反,所以对该sql进行...
本文种记录的大多是开源版本hive调优方式 我也会补充TDH集群Inceptor的优化方式 面试必备技能-HiveSQL优化 Hive SQL基...
分桶字段选择 进行分桶之前需要对表的数据分布情况进行大致的分析,一般遵循的原则为,选择离散度高的字段进行分桶。可以通过收集的数据特征,如Dist...
Hive的数学函数包含两种,一种是内嵌函数,一种是由java定义的自定义函数。对于不懂Java的数据分析师,掌握Hive的内嵌函数就显得尤为重要...
一、安装hive前提条件 hive运行在hadoop集群上,所以先要确保你的hadoop集群已经安装完毕并且可正常启动运行。如果没安装好hado...
前言: 针对有sql基础,刚熟悉linux界面,在此进行hive的入门学习分享,文章结合网络资料并加以细化步骤。本文步骤参照:https://w...
前言: 以sql为基础,利用题目进行hive的语句练习,逐步体会sql与hive的不同之处。本次练习题来源:https://www.cnblog...
前言: 以sql为基础,利用题目进行hive的语句练习,逐步体会sql与hive的不同之处。 题目用到hive的集合函数,使用了collect_...