本文共计3025字,建议阅读时长8分钟
为了避免枯燥,会有很多案例,大家耐心看
开始写数据分析,就刹不住了,因为数据分析的点太多了,不是一篇就能说完的,估计这个得是系列文章了,那么第一篇就先写写数据概况和数据思路。不仅是PM产品经理,很多工作岗位跟数据分析都有或多或少的关系,那么首先需要明确一个问题:
什么是数据分析(Data Analysis)?
A:数据分析就是分析数据呗。
B:就是会用excel。
C:是不是要用一些高深的工具,比如SPSS、Python、数据库之类的?
D:数据分析的本质就是统计学。
E:数据分析?就是数据的分析啊!
没错,就是数据的分析,以上都是不同人遇到上述问题的回答,其实大家实际上理解的数据分析就是有数据分析思路,然后通过分析得出一些符合逻辑的结论。
核心点
【数据】:先有对应的数据
我们通常理解的数据,都是阿拉伯数字的组合,但广义的数据还应包括很多内容信息,比如国家人口数据(每个人的资料)、每年上映的电影(以及电影的具体标签简介等)、今日头条每天更新的资讯,都是数据。
【分析】:通过一些既定的方法或思路来分析数据,得出结论或解决方案。
数据分析的几大流程,而在以下各个流程都有一大批公司在做对应的事。
1. 数据收集/采集
2. 数据整理
3. 数据存储
4. 数据分析
5. 数据结论
本文重点说一下数据分析思路
1.数据收集/采集、数据整理
首先得有数据,才能进行分析,而往往数据收集和数据整理经常是一个体系,这部分也是整个流程最杂最累的一部分工作。
举个例子:
百度地图里如果搜索路线,往往会显示下车步行347m之类的数据提示,这些刚开始都是通过人工测量收集,然后与购买的第三方数据或者定位数据不断做数据校准得出的最后数据。
再比如:
用户的APP使用数据,通过需要统计的地方进行数据埋点,当有用户操作该功能时,给服务端发送一个请求,数据量+1。
此环节涉及到
数据抓取
爬虫工具
人工收集数据
数据抓取、爬虫工具:如果需要做一个资讯信息整合平台,那么首先得抓取资讯数据,就是梳理好特定要抓取的数据网站,然后技术抓取对应的数据。
很多人觉得金融行业高大上又赚钱,真正高大上的是投行这些,而做金融基础数据收集的那可相当苦逼了~
2.数据存储&数据处理
数据收集过来了,总要存储起来才能用,就是数据库,目前最常用的就是MySQL数据库。存起来之后要进行数据的归类处理和整理,如果数据量很大,就涉及到大数据的处理方法,目前通用的Hadoop集群来快速处理数据,中间经过MapReduce、HDFS等等环节来对数据进行归类的整理。(就像把各个文件整理在文件夹和文件柜里一样)。PS:以上环节内容后面有机会再跟大家详细剖析。
3.数据分析
A:机器数据分析:建立数据模型,机器自动学习来给出结论,涉及到模型、算法等等,应用的语言C++、Python、R语言等。
B:人工根据数据现象,进行详细分析得出结论。
产品经理做数据分析,首先要确定的是数据的准确性且符合逻辑,如果数据都不准确,那么后续一连串的分析都没有意义。
比如:
“统计表明:睡眠时间越短的人,收入越高。”
那我们都不用睡觉了?数据没有逻辑。
再比如:
“移动端第一大用户需求是 小说”(想不到吧?)
以上数据是否准确?第一大需求的统计指标是什么?(最后发现指标是人均时长)
划重点1
要想培养数据思维,首先就是遇到数据只要有不确定的点,都要分析清楚是什么意思,保证数据准确以及符合逻辑。
再举个例子:
“锤子手机的市场渗透率是10%”
当看到上述这句话你的第一反应是什么?
A:锤子手机还不错啊,至少还有10%的人在用
B:锤子手机用的人还是少
C:市场渗透率怎么统计的?
如果你的第一反应是C,那么恭喜你,有了基本的数据思路,首先要确保准确性,什么是市场渗透率?这里解释一下,一般是第三方数据平台给出的,原因是第三方数据公司不能完全获取该数据,只能通过抽样调查的数据中得出这个市场渗透率,而具体调查了多少数据,并不知道,如果只抽样调查了10个人,其中有一个人用,那么市场渗透率也是10%,那么这数据准么?好好想一想。
划重点2
得有数据敏锐度,看到一个数据得有其关联数据的思路,比如:
一家面馆一天客流量200人
给到你,你会怎么分析?
关联数据思路:
这200人的数量,和附近其他面馆比是多是少?
这200人的数量比昨天多还是少?
200人的实际总消费,及消费均值?
面馆外的人流是多少?
与周围其他快餐店的数据对比是怎样?
当然只有200人这一个数据是分析不出结论的,关联出来的数据一起分析能得出结论,重点是得有这些关联数据的思路,然后一步步挖掘数据来进行分析。
划重点3
比率或比例是关键分析点之一
“订单量昨天下降了1000”
从以上数据能看出什么?如果直观来看,是不觉得怎么下降这么多?但实际上呢?不知道,因为没给任何别的数据,如果一天的订单量在100万以上,那么下降1000单就可能是正常波动,没有任何影响。
再举个例子:
“11月投放的广告展现量比10月份少了30%”
上面数据相比第一个例子来说就清晰了许多,紧接着来分析为什么11月投放的广告展现量少了这么多?
分析:
在其他指标都不变的情况下,初步分析是由于双十一各大电商网站投放广告强势,导致展现量下降。此期间,转化率由于购物节的影响也会受到一定程度的降低。
解决方案:
1.当下寻找其他渠道
2.狂欢购物节期间,提前明确相应渠道及影响
3.借助购物节热点,做线上运营活动拉新
划重点4
有效的分析结论是通过对比来得出的。
如上述表格,当我们在评估一个渠道的好坏,应该有与其对比的数据,否则没有衡量具体效果的意义,如果按照以上表格,那么得出的简单初步分析数据如下:
注册
转化率
购买
转化率
渠道1
30.82%
6.29%
渠道2
42.15%
7.38%
渠道3
62.20%
3.94%
1)渠道2购买转化率最高
2)渠道3注册转化率最高
3)为什么渠道3注册转化率最高,但购买转化率最低?
以上是由数据看出的现象,在这里强调一下:
现象不是结论,结论是经过分析得出的有指导意义的落地点或者解决方案。
分析思路:
① 三个渠道的优缺点特征对比
② 广告投放方式
③ 注册流程问题
④ 注册到引导购买的问题
结论:自己先想,下期揭晓。
PS:
互联网产品应用最广泛的对比实验方法就是A/Btest,其实不止ABtest,还可以多个实验同时test,比如ABCDE test,这就是不同变量在不同实验同时验证,而同一变量还是在其中两个实验中,确保对比效果。ABtest要细开来说就是一个大篇章,后面单独来剖析。
划重点5
未完待续…
说到这,发现最基础的产品数据指标没有说…汗…因为数据分析的点太多了,这篇就先给大家剖析一下思路,下期数据分析再详细讲一下产品数据指标。