产品经理用数据说话,商业产品经理更然。数据不等于数字,数据是可置信的信息。
大学主修电子信息工程,关于信息,男神香农(信息理论的奠基人)有一句经典的概括,信息量代表了不确定性。他创造性地用信息熵(entropy)概念来衡量信息量的大小,即为随机不定性程度的减少。这就表明了他对信息的理解:信息是用来减少随机不定性的东西。比如,我抛了一枚硬币,并清楚地知道它是正是反,则这个结论已知,完全确定,则这个信息的熵值对我来说其实是0。而如果我在抛这枚硬币之前,有人能告诉我一条硬币结果是正是反的信息,因为它是有概率存在的,按香农的公式计算出来,信息熵值为1(以bit为单位,而后的byte、KB等概念都是从此演化而来),它代表了一个最简单的陈述:是/否代表了数据的最小单位。
扯这个概念,一方面是怀念一下香农大神,另一方面也是表达,数据,或者说信息,在我们做决策时的关键作用,是抵消不确定性。可用的(即准确的)数据量越多,做决策时的风险就越小,所以,做决策需要数据驱动。 但要注意,是数据驱动而非完全依赖数据,通俗地说,数据更像是检验猜测是否正确的证据,数据分析是一种验证猜想的工具。需要什么样的数据,基于我们希望得到哪些因素之间的关系、现象、变化等等,所以,数据也是需要经过设计的,并不是套框架或者全盘覆盖,坐等结论。
数据驱动的核心是,在收集到有效数据的前提下,运用合理的方法对数据进行处理和分析,从而输出对决策有帮助的结果和结论,从而指导实际的产品设计和内容选择。
这里直接以一个很多人都听过甚至做过的产品,且是一个相对复杂的例子,DMP(Data Management Platform)数据管理平台(DMP在广告/搜索/电商/内容推荐等领域发挥非常关键的作用)来讲解运用数据做决策的过程,同时也带大家了解,如果在系统层面需要搭建数据驱动决策的能力,需要怎么思考。
以电商商品推荐为例,我们一般将DMP能力分解为以下几个关键模块:
- 数据的收集(根据数据需求,希望分析的特征方向,可能的关联因素,采集需要的各节点数据,比如浏览/收藏/购买/分享)
- 数据的处理(对数据进行清洗/整理,过滤无效数据,分类和整理有效数据)
- 数据的分析(基于一定的分析方法对数据进行分析和计算以输出结论,比如根据购买频次统计分析生活状态和购物喜好)
- 数据的使用(运用数据分析结果指导策略制定,比如根据购物偏好结论为该用户推荐同类更多商品)
下篇我们展开讲讲DMP。
可以关注我的公众号获取推送。