1991年,比尔·恩门(Bill Inmon)出版了他的第一本关于数据仓库的书《Building the Data Warehouse》,标志着数据仓库概念的确立。我们所常说...
IP属地:广东
1991年,比尔·恩门(Bill Inmon)出版了他的第一本关于数据仓库的书《Building the Data Warehouse》,标志着数据仓库概念的确立。我们所常说...
2017年柏林Flink Forward大会上Robert Metger的"Keep It Going: How to Reiably and Efficiently Ope...
留存简单来说就是某天的注册用户有多少人在多少天后还在继续使用,但具体的定义各个公司可能都不太一样,比如三日留存是在第四天还有登陆的玩家,一天是按现实的0点为分界还是一个玩家完...
1 bucket-mapjoin 1.1 条件1) set hive.optimize.bucketmapjoin = true;2) 一个表的bucket数是另一个表buc...
偶然读取到了字节跳动关于Spark做的一些优化,发现其中一项被称为BuckedtJoin的优化项 传送门:Spark SQL 在字节跳动数据仓库领域的优化实践 [https:...
背景 随着公司业务的发展,慢慢已经从做新功能,变成优化功能,至于怎么优化功能,精细化运营已经很难直观判断。尤其作为裂变增长组的PM,对公司现有砍价、助力、签到等工具的优化,尤...
上一章《埋点需求分析&设计埋点方案》已经说明了什么是埋点,埋点需求分析、数据指标、常见的埋点事件等基本概念。本周主要输出整理埋点文档的思路。 一、什么是埋点需求文档 埋点文档...