文/明道软件 胡晨川
我最近开始参与到数据产品的设计和开发中。在与产品经理、设计师和开发工程师的协作中,发现由于缺乏一些统计学常识,导致做出来的产品存在缺陷,实际应用价值大打折扣。在产品和研发资源都十分宝贵的中小企业,好钢没有用在刀刃上,是非常可惜的。
下面我从自己统计学的知识背景出发,梳理几点数据产品制作的原则。本人文笔能力一般,尽量以最通俗的文字表达,若读者您能理解,甚是欣慰;若是不能,死记硬背也是值得的。
1.分清指标和维度关系。
既然是数据产品,一定离不开数据图表。而要做图表,首先得确定这个图标当中的指标和维度。
最概括的说:指标就是图表中纵坐标轴;维度就是横坐标轴。
身高,销售量,访问量,收入这些能用数字衡量的,就是指标;而性别,部门,访问来源,地区等不能用数值衡量的,就是维度。指标和维度组成一个数据图表的基本元素。当然,最重要的一种维度就是时间,它的优先级会在其他所有维度之上,下文中会更多地讨论。
一般人应该不会分不清指标和维度,去使用一下excel中的数据透视表功能,你就会对指标和维度理解得非常深刻。
需要补充的是,指标有时会转化成维度。比如企业的成员数量是指标,但是根据企业人数的多少将企业分级(小型、中型、大型),那企业类型就是维度了。
2.有对比才有信息,有信息才有价值
销售总监向ceo汇报:“上个季度我们销量是100单”。这话其实是没有信息量的。
真正有价值的是对比后产生的信息:“上个季度我们销量100单,比上上个季度多了20单,增长25%!”。第一种对比就是时间维度的,纵向的对比,现在和过去比。这样就能知道是变好还是变坏。
“上个季度我们销售了100单,在所有分公司中排名第一!”这是第二种对比方式,即横向的对比。横向对比不能告诉你变好还是变坏,但能告诉你有多好或者有多坏。
那聪明的孩子肯定知道第三种对比方式了。纵向与横向都进行对比,一个指标的价值才会体现。不仅告诉你变好,变多好,还能告诉你哪里变好或者为什么变好。
案例一
如图1,订单量从纵向和横向(不同规模客户)进行了对比。
(下面这个例子文字较多,可以选择跳过)
这个图会反应一个很典型的销售分析场景:首先,分管销售和市场的副总裁接被告知销量增长了25%(变好了),那他会看是什么类型的客户增长了(为什么变好),他发现是50-200人的客户和0-25人的客户增长迅速,那么进一步,他再看看这些客户的地域分布、行业分布或者是所隶属的分公司的分布对比,分析增长的外生因素和企业内生因素。
比如,0-25人企业新增量大部分来自超一线城市,原因是政府鼓励学生创业计划,0-25人小微企业大量涌现,外生地导致订单量增加;而50-200人的中型企业客户增加,大部分来自珠三角地区的制造业,原因是产品功能上增加了项目管理工具和审批流程,解决了很多中型制造企业的需求,这是内生动力导致的增长。那么,接下去的策略就是在超一线城市增加与小微企业孵化器的bd合作,增加针对学生类创业人群的定向广告投放;而在珠三角和长三角地区增加销售员数量,用人去触及更多工业园区和企业,并结合会销,关键是用精心制作的案例来打动他们。
3.时间维度优先+时间跨度和显示颗粒度
这条原则确实经不起钻牛角尖,但是以我的经验,任何数据指标,你都得先纵向地观察变好还是变坏,才有必要去探究为什么。使用场景参考案例一。
时间维度不仅要优先,还要区分时间段和显示颗粒度(图表横坐标上标签的密度)两个概念。比如,我要观察公司网站半年来的pv变化趋势,那么需要选择2015.2.1号至2015.8.1号,并且选择按日、周还是月来查看。当然,选择半年跨度按天查看,图表很可能呈现波动巨大且密集的折线图,你会觉得杂乱无章。所以选择以周活着月的颗粒度看,会更直观。
补充一点,工具当中如果增加趋势线选项,那会是更棒的。在excel中,可以在“图表布局”的选项卡下找到趋势线,里面有线性、指数、幂、移动平均等模式,是观察一个指标时间维度波动趋势的好帮手。
4.尽量减少表格和静态型图表的呈现
表格可以承载很多信息,但不够直观,因此在数据产品中它的呈现要让位于数据图表。
静态型图表是指饼图、环形图、树状图等只反映某个指标在某个时间点上的结构分布的图表。这种图表的缺陷就是没有时间维度的对比。在我看来,它更适合用在公关性质或者推广性质的报告中,而对于指导企业运营的数据产品,更合理的方式是采用堆积柱形图。如下图:
堆积柱形图,总高度即当月总订单量,不同颜色的部分即不同的客户规模的订单量。用堆积柱形图结合饼图,不仅指标的总量在时间维度变化可以直观看到,各成分的量和占比的变化也变得直观。
5.具备筛选和下钻的能力
试想这样的场景:首先,CEO发现公司业绩下滑了,但并不是全公司在销售管道上的普遍下滑,那么就是某几个分公司拖了后腿;接着,他要看看是哪个分公司业绩下滑,甚至是哪个销售经理的业绩下滑;找到了下滑最厉害的销售经理后,CEO要看看他的团队在销售管道的哪个环节出了问题(假设这家公司的销售管道是约访—>拜访—>签单),最终发现是约访效率出现大幅下降;检查后发现,是这个销售团队没有好好进行话术的培训。这就是对下钻的需求。
找到症结后,CEO决定,要筛选出全公司约访率在这个季度排名在后20%的销售,进行集中的话术培训。这就是筛选需求。
这就是通过数据找到问题并针对性进行解决的一个场景。下钻的深度可以随着数据的积累慢慢增加,但下钻和筛选必须同步开发,缺一不可。
6.重视导出和接口,但要重视权限
数据产品最终是给企业决策提供依据的,看的人应该是管理层和部分业务层。他们未必都有深入研究的需求,只要通过简洁的操作,直观地发现业务上的问题就行。
而对于数据分析岗位(BI),有多样化的研究目的,需要灵活地建立模型。研究方法会不断在变,模型也会不断优化,所以不适合做到固定的数据产品当中。因此对于他们来说,更重要的是数据产品背后的数据仓库。数据仓库变量的建立要全面和详细(数据产品只是呈现一部分),并支持BI们手动导出或者与数据分析软件对接。
7.数据产品的目的
从上文中的案例和场景描述中,已经清晰地看到:数据产品制作理念,我觉得就是以决策者地角度去设计功能。从宏观到微观,从纵向观察(时间)再到其他维度的切片,目的就是发现问题,对症下药。
数据产品制作的几个原则,暂时就到这里。作者对数据产品的使用经验还非常有限,GA、百度统计、友盟、是目前用的比较多的。有说的不对的,欢迎指正。下一篇,我会写一个数据图表的专题,介绍有哪些数据图表,特点是什么,在什么时候用。
统计分析软件上,本人偏爱excel和R,spss和sas在求学时也有所涉猎。欢迎大家关注公众号“川术”,进行分享和交流。