240 发简信
IP属地:广东
  • 数仓--Hive-面试之Hive数据倾斜的原因及主要解决方法

    对于参数命令的记忆,需要固定在 数据倾斜产生的原因 数据倾斜的原因很大部分是join倾斜和聚合倾斜两大类 Hive倾斜之group by聚合倾斜 原因:分组的维度过少,每个维...

  • 120
    hive入门学习:join的三种优化方式

    hive入门学习:join的三种优化方式 第一:在map端产生join mapJoin的主要意思就是,当链接的两个表是一个比较小的表和一个特别大的表的时候,我们把比较小的ta...

  • 如何构建用户画像

    为什么 构建具体蓝本,有助于产品团队脱离自身喜好和整个团队目标的一致性 精准营销 怎么做 构建用户画像的核心是打标签,通过高度精炼的标签去描述一个用户,如年龄性别地域偏好等。...

  • 周志松:什么是用户画像,如何构建用户画像?

    用户画像 ,又称人群画像,实际是数据和文字,而不是图片,根据一系列真实目标用户的数据建立的模型。 这些数据主要是指用户的基本信息,如:性别,年龄,性格,爱好,职业等,另外,还...

  • 今日头条 数据分析 面试题总结

    SQL题: 表 Cost: date | cname(customer's name) | cost找出每天花费最大的客户 一个日志表,有两列 date,cid(custom...

  • 支持向量机(SVM)常见问题

    1 SVM原理 SVM是一种二分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。(间隔最大化是它的独特之处),通过该超平面实现对未知样本集的分类。 ...