本章主要总结开发性能调优及作业调度相关的产品知识,性能调优主要是减少性能消耗和提高ETL作业时间,常见的调优就会数据倾斜调优、合并小文件、缓存中...
标签数据开发是用户画像体系中最重要的一环,主要包括离线标签开发、实时标签开发、用户特征库开发、人群计算、打通数据服务层等开发内容。 一、统计类标...
用户画像的数据存储的技术选型有多种,不同存储方式适用于不同场景。主要有Hive、MySQL、HBase、Elasticsearch。 如果将用户...
数据指标体系是建立用户画像的基础,也是在进入开发前的关键环节,是需要结合业务场景制定的数据指标。建立用户画像一般从2个维度: ①用户维度(use...
用户画像,即用户信息标签化,是大数据精细化运营和精准营销服务的基础。它是一种勾画目标用户、联系用户诉求与设计方向的有效工具。在大数据的时代下,用...
在刚迈入数据的大门时,我经常对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。为了...
说明 ▍ 子查询:嵌套在其他查询中的查询; ▍ 组合查询(复合查询 / 并操作):执行多次查询,多条select语句,并将结果作为单个查询结果返...
一、聚合函数 对一组值进行计算,并返回单个值,也被称为组函数; 聚合计算过程:选定分组字段 – 分组 – 计算:1.选定分组字段:在 selec...
一、字段处理函数 字符串处理函数:concat(field1,field2 …… )substr(str,pos,len)replace(str...