19种常用数据分析模型和方法

在进行数据分析时,我们通常需要用到各类数据分析模型和方法,
一是为了让自己的结论更有说服力,二是让论证过程更具备逻辑性和条理性
常见的数据分析模型如下:

1、RFM 分析

RFM 用于对用户进行分类,并判断每类细分用户的价值。
三个关键指标:
最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。
通过上述三个关键指标判断客户价值并对客户进行观察和分类,针对不同的特征的客户进行相应的营销策略,如下图所示:


image.png

2、 帕累托分析分析 又称为 ABC分析

帕累托分析又叫 ABC 分析,平常我们也称之为“80对20”规则,分类的核心思想:少数项目贡献了大部分价值。以款式和销售量为例:A 款式数量占总体 10% ,却贡献了 80% 的销售额。
把产品或业务分为A、B、 C三类,用于分清业务的重点和非重点,反映出每类产品的价值对库存、销售、成本等总价值的影响,从而实现差异化策略和管理。
按照0-80%,80%-90%,90%-100%将商品分成ABC3个类别,然后对于这3个类别的产品做区别管理,以提高效益。

image.png

注:二八分析与 ABC 分类法大致相同,都是少数项目贡献了大部分价值。不同之处是ABC 分类法将对象分三类,而二八分析则为 A、B 两类。

3、 波士顿矩阵图

波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构。
波士顿矩阵将产品类型分为四种,如下图所示:

image.png

波士顿矩阵将产品类型分为四种:
1,明星产品:高增长且高市占,发展前景好,竞争力强,需加大投资以支持其发展;
2,问题产品:高增长但低市占,发展前景好但市场开拓不足,需谨慎投资;
3,金牛产品:低增长但高市占,成熟市场的领导者,应降低投资,维持市占并延缓衰退;
4,瘦狗类产品:低增长且低市占,利润率低甚至亏损,应采取撤退战略。
波士顿矩阵就是通过把销售增长率和市场占有率作为两个判断指标,将公司现有产品分为4类,然后针对各类产品的特点及时调整投资方向。

实际应用:
某厂家最近想了解自己客户的消费能力和消费频次,因此需要对自己的客户进行分类查看
1、统计各个客户的消费频次和平均客单价
2、设置警戒线,(警戒线值均为消费频次和平均客单价的平均值)
3、消费次数超过平均值,每次消费力度也超过平均水平的客户→判定为明星客户,这类客户需要重点关注,并给予最高的礼遇;
4、消费次数超过平均值,但每次消费力度未达到平均水平的客户→被判定为现金牛客户,这类客户通常消费频次比较频繁,能给企业带来较为稳定的现金流,这类客户是企业利润基石;
5、消费次数未达到平均值,但每次消费力度超过平均水平的客户→是问题客户,这类客户最有希望转化为明星客户,但是因为客户存在一定的潜在问题,导致消费频次不高,这类客户需要利用客服进行重点跟进和长期跟踪;
6、消费未达到平均值,消费力度也未达到平均水平的客户→属于瘦狗客户,这类客户通常占企业客户的大多数,只需要一般性维护,不需要重点投入维系。
要不断探索开发金牛类产品,这是快速拓展中国市场的最大杀手锏
要加强对明星类产品的宣传促销,保证明星类产品保持高市场占有率和高市场增长率
瘦狗类产品如果在短期内没有发生转机的现象,尽量利用或回收
这样就可以将企业有限的资源有效地分配到合理的产品结构中去,以保证企业收益,这就是波士顿矩阵的用处。

4、 转化分析

转化漏斗模型,是分析用户使用某项业务时,经过一系列步骤转化效果的方法。
转化分析可以分析多种业务场景下转化和流失的情况,不仅找出产品潜在问题的位置,还可以定位每个环节流失用户,进而定向营销促转化。


image.png

漏斗分析的作用是“定位问题节点”,即找到出问题的业务环节在哪。
关注两个指标:用户转化率和用户流失率。

5、购物篮分析-关联规则

通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,即购物篮分析,通过「支持度」、「置信度」、「提升度」三个指标判断商品间的关联.。
关联规则是反映一个事物与其他事物之间的相互依存性和关联性,常用于实体商店或在线电商的推荐系统。

6、复购率分析

复购率是指最近一段时间购买次数,用于说明用户的忠诚度,反向则说明商品或服务的用户黏性。
复购率可分为:用户复购率、订单复购率、用户回购率

  • 用户复购率=单位时间内:购买两次及以上的用户数/有购买行为的总用户数
  • 订单复购率=单位时间内:第二次及以上购买的订单个数/总订单数
  • 用户回购率=单位时间内:有购买行为的老用户数/有购买行为的总用户数
    分析方法:
  • 1.综合指标展示,分析用户黏性,辅助发现复购率问题,制定运营策略。


    image.png

    将用户复购率、订单复购率、用户回购率统一放在一个图中进行展示。
    将这三条曲线与用户总数叠加在一起可以看出用户黏性的健康度,最佳的情况是三条曲线都不随着用户数量的变化而变化,普遍保持着上升的趋势。尤其用户回购比率是一定要逐步上升的,因为随着公司的发展,为公司长期创造价值的用户一定是这些老用户。
    对复购率进行一个整体性的展示,可以根据不同情况将周期调整为季度等。通过对复购率整体性的展示,方便定义公司复购率的健康度,及时发现复购率异常后,再进行进一步的分析。

  • 2.横向维度(商品、用户、渠道)对比分析,细化复购率,辅助问题定位。
    将复购率继续拆解,可以分成会员复购率、新用户复购率。会员复购率低,是会员运营的不够好;新用户复购率低,是新用户运营的问题。通过这样的对比,可以实施有针对性的营销策落。


    image.png

    新用户由于对平台或应用的忠诚度不如老客户高,所以其复购率与老用户的复购率之间有一定差距,但差距也应该是相对稳定的。当然,对于公司的运营来说,也是应该尽量提高新用户的复购率,例如可以通过进行更精准的拉新,对新用户的复购优惠政策等等。
    根据下图中各渠道的转化率对比,也可以看出微信端、手机qq端的复购率是最高的,可以看出社群运营对于提高复购率也是一个重要的手段。


    image.png

    商品与复购率的关系,可以做一个商品的对比趋势图,也可以从商品的角度出发,看一个商品的综合价值,可以用一个散点图或者气泡图(气泡大小表示利润等)来查看商品价值。这种对对于商品较多的电商类公司比较合适。(从商品的角度来分析商品价值,还需要更多的维度来看,这里仅针对商品与复购率的关系。)
    image.png

7、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。
计算公式:某一段时间内(时间段a)的新增用户在若干天后的另一段时间(时间段b)的留存数量 / (时间段a)的新增用户总量。

留存分析模型重点在于对用户的分群,分析不同类型用户的留存情况,找到差异,定位解决问题:
模型一:新老用户同期群分析(Cohort Analysis)方法
同期群是用户分析最普遍的方法,比如用每周的新用户,观察相同时间间隔后的表现。例如2019/1/1的新用户在第一周的留存率是49%,但2019/2/5的新用户在第一周的留存率是却只有40%,这就说明新用户的留存率在下降,需要重点关注。并且可以对比后续每周的表现,看是否好转。
为什么要区分新老用户呢?因为新老用户对于产品的反应是有很大差别的,一定要区分来看。比如你第一次去京东,由于不熟悉这家电商,很有可能逛逛就走了;但如果你是一个京东的老用户,登录京东后就很可能产生购物行为。通过区分新老,能够清晰的看到这两种用户的表现,便于发现到底是哪种用户发生了问题。


image.png

image.png

如果是新用户的留存下降,很可能是新用户没有快速的感受到产品的核心价值。比如物流,用户的主要诉求就是快,那么对于新用户是否能让他感受到这个价值。如果是老用户的留存率下降,也许是产品的体验在变差,或者受其他竞品的影响。
模型二:渠道同期群分析方法
企业经常采取多种渠道来获客。有线上的方式,比如百度搜索或者抖音短视频等;有新媒体的方式,比如公众号,知乎等;有线下的方式,比如线下沙龙和公众活动。各种渠道的获客都需要成本的,我们需要知道是哪种渠道的新用户留存高,留存率高说明这是高价值渠道,我们可以在这里做更多的投入。

image.png

模型三:产品功能留存矩阵
一个产品一般具有很多功能,通过分析了解各个功能的价值,找到各个功能的提升空间,进而通过功能优化来整体提升用户留存。矩阵的横轴是功能的留存率,表示当前功能的用户黏性;纵轴是活跃用户的数量。看不同的功能在矩阵中的位置分布。
比如橘色代表的功能就是产品的核心功能,使用率和留存率都很高,我们要保证核心功能的体验越来越好,并持续监控使用情况,防止意外发生;
比如绿色代表的功能,这个功能虽然使用的人数不多,但留存率非常高,说明这个功能的体验很好,我们要尽量引导用户使用这个功能;
而对于红色代表的功能,虽然使用的用户很多,但留存率不高。也许是这个功能有用,但体验不好;也许是这个功能本身就是鸡肋;所以我们要继续深入分析,来决定是优化功能还是直接下线.
image.png

进行留存分析的时候,我们更多时候要学会做问题拆解,把提升留存率这样一个大目标拆解为一个个小的可执行的目标(按照上面的模型拆解后,还需继续拆解到因素),我们就可以通过产品优化、运营调整等等方式来实现用户留存提升

8、用户画像分析

用户画像就是与该用户相关联数据的可视化展现;一句话来总结就是:用户信息标签化。
通过对用户人口属性:用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、生育情况、工作所在的行业和职业等和行为特征:活跃度、忠诚度等指标进行分析,从而帮助企业对用户进行精准营销、辅助业务决策。


image.png

1.广告投放:在做用户增长的例子中, 我们需要在外部的一些渠道上进行广告投放, 对可能的潜在用户进行拉新, 比如B站在抖音上投广告;我们在选择平台进行投放的时候, 有了用户画像分析, 我们就可以精准的进行广告投放, 比如抖音的用户群体是18-24岁的群体, 那么广告投放的时候就可以针对这部分用户群体进行投放, 提高投放的ROI
2.精准营销:假如某个电商平台需要做个活动给不同的层次的用户发放不同的券, 那么我们就要利用用户画像对用户进行划分, 比如划分成不同的付费的活跃度的用户, 然后根据不同的活跃度的用户发放不用的优惠券
3.个性化推荐:精确的内容分发, 比如我们在音乐app 上看到的每日推荐, 网易云之所以推荐这么准, 就是他们在做点击率预估模型(预测给你推荐的歌曲你会不会点击)的时候, 考虑了你的用户画像属性;比如根据你是90后, 喜欢伤感的, 又喜欢杰伦, 就会推荐类似的歌曲给你, 这些就是基于用户画像推荐
4.风控检测:这个主要是金融或者银行业设计的比较多, 因为经常遇到的一个问题就是银行怎么决定要不要给一个申请贷款的人给他去放贷;经常的解决方法就是搭建一个风控预测模型, 去预约这个人是否会不还贷款,同样的, 模型的背后很依赖用户画像。用户的收入水平, 教育水平, 职业, 是否有家庭, 是否有房子, 以及过去的诚信记录, 这些的画像数据都是模型预测是否准确的重要数据
5.产品设计:互联网的产品价值 离不开 用户 需求 场景 这三大元素, 所以我们在做产品设计的时候, 我们得知道我们的用户到底是怎么样的一群人, 他们的具体情况是什么, 他们有什么特别的需求, 这样我们才可以设计出对应解决他们需求痛点的产品功能。在产品功能迭代的时候, 我们需要分析用户画像行为数据, 去发现用户的操作流失情况, 最典型的一种场景就是漏斗转化情况, 就是基于用户的行为数据去发现流失严重的页面, 从而相对应的去优化对应的页面

9、月复购分析

复购率可以帮我们观察用户的忠诚度。提升复购率,可以提高用户购买的频次。业务的持续增长除了拉新获客的持续输入,存量用户的复购尤为重要。
一个月内有100个用户购买商品,其中有20人购买了2次以上,那么月复购率就是20%。同理可以改变统计周期,计算季度复购率、年复购率等。

10、AARRR用户运营分析

AARRR 模型又叫海盗模型,是用户运营过程中常用的一种模型,解释了实现用户增长的 5 个指标:获客、激活、留存、收益、传播。从获客到传播推荐,整个 AARRR 模型形成了用户全生命周期的闭环模式,不断扩大用户规模,实现持续增长。
每一个产品具体情况不同,但总体上都包括这 5 个方面的发展过程。所以可以对这 5 个发展过程逐个分析。

11、用户流入流出分析

百货商场的负责人想对百货中的各个品牌的竞争力进行分析,所以他考虑从用户流入流出入手。帮助百货了解各个品牌的竞争力的同时,也可以帮助各个品牌的负责人看到自己品牌流入流出的情况如何。
他对流入客户和流出客户的行为进行了分析,将流入原因分为「其他品牌流入、渠道流入、类别流入」,流出原因分为「品牌流出、渠道流出、类别流出」。精细划分后,各个品牌的竞争力情况更加一目了然。

  • 流入人数:近 6 个月有交易,前推 6 个月无交易的用户。 ·
  • 流失人数:前推 6 个月有交易,近六个月无交易的用户。
  • 其他品牌流入:用户A若是前推 6 个月在百货别的品牌购买了电子产品,对于诺基亚电子产品类别来说,该客户属于其他品牌流入。
  • 类别流入:用户A若是前推 6 个月只在百货购买了别的类别的产品,没有购买电子设备。那么他流入的原因是因为他需要电子类别的产品,所以属于类别流入。
  • 渠道流入:用户A若是前推 6 个月没有在百货购买商品,说明他是百货的新客户,所以他属于渠道流入。

12、用户生命周期状态分析

对用户进行生命周期状态分析,可以了解企业当前的市场竞争力,并对不同类别的客户实施不同的营销动作。
比如用两个维度「最近一次登录距今的时间」和「第一次登录距今的时间」,可以将客户简单的分为四个类别:

  • 新用户:刚开始在较短的一段时期内登录/购买了产品的客户。
  • 一次性用户:在较短一段时间内登录/购买产品后,近期不再继续购买的客户。
  • 忠实用户:在较长一段时间内持续登录/购买产品,且在近期仍有购买行为的客户。
  • 流失用户:在较长一段时间内持续登录/购买了产品,但近期不再有购买行为的客户。

13、用户粘性分析

用户粘性是指用户对于品牌或产品的忠诚、信任与良性体验等结合起来形成的依赖程度和再消费期望程度,是了解产品健康度的重要指标。
比如,为了解团队对产品“不断改进”的过程中,对用户粘性是否有提升作用,我们可以制作一张用户粘性仪表板,用于观察粘性情况。

14、需求分析方法-KANO模型

KANO模型是对用户需求分类和优先排序的有用工具,以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。
比如,产品经理常常会遇到非常多的产品需求,但开发人员资源有限,怎么才能捞出真正的用户需求?给真正重要的需求高优先级?这时候就需要引进「KANO模型」,进行系统的需求梳理,对需求进行分析和提炼,提高效率。

15、库存周转分析

库存周转率是企业在一定时期销售成本与平均存货余额的比率,用于反映库存周转快慢程度。周转率越高表明存货周转速度越快,从成本到商品销售到资金回流的周期越短,销售情况越好。
库存周转天数是企业从取得存货开始,至消耗、销售为止所经历的天数。周转天数越少,说明存货变现速度越快,销售状况越良好

  • 周转率(次)=销售(营业)成本÷平均存货
  • 平均存货=(年初存货+年末存货)÷2
  • 存货周转率(天)=360÷存货周转率(次)

16、杜邦分析

杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效。
其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
杜邦分析用于评估公司股本回报率 (ROE) 的组成部分。
推动股本回报率 (ROE) 的三大财务指标:运营效率、资产使用效率和财务杠杆。

  • 运营效率以净利润率或净利润除以总销售额或收入来表示。
    净利润率是底线利润与总收入或总销售额的比率。这是衡量盈利能力的最基本指标之一。
  • 资产使用效率以资产周转率衡量。
    资产周转率衡量公司利用其资产创造收入的效率。想象一家公司拥有 100 美元的资产,去年的总收入为 1,000 美元。资产产生的总收入是其价值的 10 倍,这与资产周转率相同,可计算如下:Asset Turnover Ratio= Revenue / Average Assets = 1,000/100=10
  • 杠杆以权益乘数衡量,等于平均资产除以平均权益。
    财务杠杆或权益乘数是对公司使用债务为其资产融资的间接分析。假设一家公司拥有 1,000 美元的资产和 250 美元的所有者权益。资产负债表等式将告诉您该公司还有 750 美元的债务(资产 - 负债 = 权益)。如果公司借更多的钱购买资产,这个比率会继续上升。用于计算财务杠杆的账户都在资产负债表上,因此分析师将平均资产除以平均权益而不是期末余额,如下所示:Financial Leverage = Average Assets / Average Equity = 1,000/250=4

17、盈亏平衡分析

盈亏平衡分析又称保本点分析或本量利分析法,是根据产品的业务量、成本、利润之间的相互制约关系的综合分析,用来预测利润,控制成本,判断经营状况的一种数学分析方法。比如,当我们可以通过盈亏平衡分析分析控制各项成本的投入,从而使店铺经营利润能达到一个新台阶。
【总成本=固定成本+变动成本】【利润=月销售额-总成本】
固定成本:在一定范围内不随销售额的增减而变动的成本,例如:房租、水电、人工费等。
变动成本:指随销售额的增减大致成正比例关系变化的成本,例如:销售提成,商品进货成本等。

18、同环比分析

同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比的相对发展速度。
环比表示连续2个统计周期(比如连续两月)内的量的变化比。
计算公式:同比:(本期销售额-去年同期销售额)/去年同期销售额;环比:(本期销售额-上个周期销售额)/上个周期销售额

19、5W2H分析模型,又称为七何分析模型

image.png

What:何事—— 我要做一件什么事?
Why:何因——为什么要做?确定合理吗?
When:何时——什么时候要做?什么时候发生的?
Where:何地——在哪里做?依靠什么平台做?
Who:何人——需要什么人参与?主导人和对象是谁?
How:何法——具体干了什么?过程是什么?
How much:何量——投入与产出是多少?
通过这7个问题,找出某个行为和问题中可以被优化的地方,进一步改进。

举例:餐饮业用户流失分析
what:老用户近一个月流失了很多。
where:哪家门店流失最多?什么地段流失最多?
who:什么人流失了最多?用户画像如何?是否与年纪、职业、性别有关?
when:什么时候流失最多?某个星期?某一天?一天中的某段时间?
why:为什么流失?因为菜品难吃?价格过高?有了竞争对手?环境原因?
how:怎么流失的?阶梯式流失?断崖式流失?缓慢式流失?
how much:流失了多少?是否处于正常水平?

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容