一、背景 有个项目的数据量高达五千万,但是因为报表那块数据不太准确,业务库和报表库又是跨库操作,所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者...

一、背景 有个项目的数据量高达五千万,但是因为报表那块数据不太准确,业务库和报表库又是跨库操作,所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者...
最近一年多工作的主要精力都放在了Push系统的开发上,也是这个系统唯一的开发,投入了不少心血在里面,但是这一年多的时间一直没有对这块进行总结过,借此机会回顾下系统的相关设计。...
作为B端产品,要建立自己的B端产品的知识体系,那么首要的就要从最初始的概念开始,那就是理解B端产品这个概念,下面将从核心定义、对比C端产品的特点以及分类开始梳理。 首先,什么...
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计, 试图解释为什么...
文章目录 一、用户画像数据仓库搭建、数据抽取部分[https://editor.csdn.net/md/?articleId=109890183#_15] 二、大数据平台、用...
当前数据库分为关系型数据库和非关系型数据库 关系型数据库 关系型数据库:指采用了关系模型来组织数据的数据库。关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之...
随着流量焦虑的逐渐升级,越来越多的企业开始追求对存量用户的精细化运营。如何尽一切可能延长用户的生命周期,并且在生命周期中尽一切可能产生商业价值,是用户运营的核心命题。 而要实...
用户标签是精细化运营的基础,能有效提高流量的分发效率和转化效率。 亚马逊的CEO Jeff Bezos曾说过他的梦想,「如果我有一百万的用户,我就会做一百万个不同的网站!」,...
一、项目介绍 该项目数据来源于阿里天池——淘宝应用上的用户行为数据:https://tianchi.aliyun.com/dataset/dataDetail?dataI...