数据处理的流程分为以下三步:
一、数据采集
二、数据建模
三、数据分析
好,我们依次来了解。
一、数据采集
数据采集常犯的三个错:
1、不准确 (采集了不正确的数据)
2、不完备 (只有客户端的但是没有服务 端的)
3、不细致(地域 ,年龄,没有浏览器版本)
数据采集的二个原则:
1、全:多种源(客户端,服务端、数据库)全量而非抽样(部分地区,部分人群不可取)
2、细:who\when\where\how\what各种维度
数据采集是数据分析中最重要的一步,一定要做好。
数据采集的方法:
1、可视化埋点
(鸿观的数据:pv,uv,点击量,)
2、代码埋点
(特定的行为,事件,用代码记录这些行为更全更细多维度:转化流程,不同渠道,)
3、导入辅助工具
(通过后台记录的数据 :客服服务质量考核,不同快递在不同省份运送)
二、数据建模
事件模型(对产品的任何一个操作,都可以理解为一个事件:比如提交订单,付费)
事件类型:user_id ,时间,model.,设备,地区,产品名,产品价格
OLAP(online Analytical Processing)
它是一种电脑处理机制,它可使用户简单而有选择性地从不同视角抽取和查看数据。
1、维度
城市、操作系统、
2、指标
销售额、成单量、用户量
三、数据分析
常见的数据分析方法有以下6种。
1、多维事件分析
事件:提交订单,取消订单,售后服务 ,支付,注册,商品搜索
维度:操作系统 ,城市,省份,wifi,设备,订单总价,姓名,年龄,性别
指标:如果一个维度是一个数值,那就可以把它当做指标来看。订单总和,平均值 ,最大值 ,人均值 触 发用户数
2、漏斗分析
交易型的产品是比较多会用到。
漏斗主要是指一系列的操作动作,每一步都向下传递。比如:到首页,到是否有注册,到注册后,到有多少人下单。等等。
3、留存分析
留存分析主要分析产品的用户留存情况。
4、行为序列分析
了解具体的用户,具体做了什么了。
5、A\B testing
这个大家都熟,就不说了。
6、用户分群
基于用户属性(性别,年龄)或用户做过的事(一个月购买超过3次的,一个月未登陆的)或是行为序列(A流程到B流程)进行用户分群。