一、背景 有个项目的数据量高达五千万,但是因为报表那块数据不太准确,业务库和报表库又是跨库操作,所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者...
一、背景 有个项目的数据量高达五千万,但是因为报表那块数据不太准确,业务库和报表库又是跨库操作,所以并不能使用 SQL 来进行同步。当时的打算是通过 mysqldump 或者...
最近一年多工作的主要精力都放在了Push系统的开发上,也是这个系统唯一的开发,投入了不少心血在里面,但是这一年多的时间一直没有对这块进行总结过,借此机会回顾下系统的相关设计。...
作为B端产品,要建立自己的B端产品的知识体系,那么首要的就要从最初始的概念开始,那就是理解B端产品这个概念,下面将从核心定义、对比C端产品的特点以及分类开始梳理。 首先,什么...
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计, 试图解释为什么...
文章目录 一、用户画像数据仓库搭建、数据抽取部分[https://editor.csdn.net/md/?articleId=109890183#_15] 二、大数据平台、用...
当前数据库分为关系型数据库和非关系型数据库 关系型数据库 关系型数据库:指采用了关系模型来组织数据的数据库。关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之...
随着流量焦虑的逐渐升级,越来越多的企业开始追求对存量用户的精细化运营。如何尽一切可能延长用户的生命周期,并且在生命周期中尽一切可能产生商业价值,是用户运营的核心命题。 而要实...
用户标签是精细化运营的基础,能有效提高流量的分发效率和转化效率。 亚马逊的CEO Jeff Bezos曾说过他的梦想,「如果我有一百万的用户,我就会做一百万个不同的网站!」,...
一、项目介绍 该项目数据来源于阿里天池——淘宝应用上的用户行为数据:https://tianchi.aliyun.com/dataset/dataDetail?dataI...
背景 互联网发展到现在,数据的重要性已经不需要再多的强调,那如何做好数据搜集的工作则是每一家公司都要面临的问题。尤其是像天猫、京东、寺库这样的电商公司,数据的统计可以提升用户...
【心路历程】最近刚好在思考工作中统计数据所用的标识码产生的数据误差到底有多大,借此机会几番搜索资料+请教大神,整理出此文。 因为自己是产品经理,所以出发点是整理知识点、理解个...
01 进度管理常见问题 进度延期,无法交付项目; 活动人天评估少,造成公司损失; 进度无法统一管理,项目管理混乱; ...... 02 如何做好进度管理 一、规划进度管理: ...
数据是冰冷和客观的,会告诉你残酷的真相,也会告诉你潜在的希望。。在早期的市场调研行业,就有“定性研究来自定量数据”的说法和做法,这是这些东西在互联网世界被扩大化,主要是那些先...