一、数据指标体系建设的意义
1.通过指标体系的梳理搭建能够更加全面的监控业务发展,及时准确的发现业务机会/问题。
2.统一指标口径,降低公司内部数据对接时的沟通成本。
二、数据指标搭建模型
(一)osm-明确业务目标,数据赋能业务
▪ O(Objective):是指我们的业务目标。在这个环节我们需要思考或者回答的问题是,我们的业务、产品,甚至是其中的一个小的功能,它存在的目的是什么、能够解决用户什么问题、满足用户的什么需求?
▪ S(Strategy):是指清楚业务目标之后,为了达成上述目标,我们应当采取的业务策略。
▪ M(Measurement):是用来反映业务策略有效性、反映策略执行是否能达成业务目标的度量指标。
(二)AARRR模型和UJM模型--理清用户生命周期以及行为路径
1、ujm
梳理用户生命旅程,与业务目标耦合
我们需要为每一个阶段都设置对应的一个目标。在这一思路中设置出的目标就可以去反哺我们之前制定出来的 OSM 框架,判断其是否有遗漏。各阶段目标确定后,我们需要寻找到产品中为了达到这一目标,与用户产生的接触点,例如首页、搜索页面、商品类目页等就是用户逛产品时的接触点。了解接触点之后,我们紧接着就能够找到每个环节的痛点,而痛点的反面就是我们的机会点。同时,这里每一个机会点都可以反哺前面 OSM 框架中的 S,就是我们的策略,机会点是否与策略相互吻合。所以 UJM 的价值就在于,这样梳理了用户旅程之后,将 UJM 和 OSM 进行关联,就可以起到用户旅程与业务目标相互耦合、相互影响的作用,使得我们的业务目标能够满足用户需求,我们策略能够回答业务问题。
2、aarrr
AARRR模型是基于产品角度,简单地来说就是拉新,促活,留存,付费,推广。对于一款产品来说,我们首先要从各个渠道获取用户;其次需要激活这些用户并让他们留存下来;对于留存下来的用户引导他们付费以及推广产品。
(三)mece模型--指标体系分级治理
首先我们明确了业务核心目标;其次,我们将业务核心的KPI下钻到产品生命周期或者用户路径行为中;接下来我们需要对这些核心KPI向下进行三到五层的拆解,这个过程我们成为指标体系分级治理,用到的模型是MECE模型。MECE模型的指导思想是完全独立,相互穷尽,根据这个原则拆分可以暴露业务最本质的问题,帮助数据分析师们快速地定位业务问题。例如,客户总成交额GMV进行以及拆解可以是付费用户数与平均客单价的乘积。
(四)具体搭建思路
1、公司核心指标拆解——mece
基于公司核心净销售额指标进行拆解,对指标进行分级。
以下为部分样例,主要基于公式拆解对于公司指标进行分级。基于要素法对各个维度进行拆分。
2、各业务线指标拆解
由于每个业务线对平台产生的价值不一样,所以对于各个业务线具体的考核指标是不同的。
对于东家来说,0元拍是为了吸引用户参与拍卖;直播拍、专场拍是为了产生交易额;拍卖行是为了拍卖重器。针对每个业务线需要梳理对应业务线的指标体系。目前我们主要采用 osm * ojm的模型进行梳理。
例如下面针对榜单工具的指标梳理流程:
(一)osm模型
o目标:提升静态商品用户浏览转化率
s策略:榜单工具
m度量:①由榜单进入的静态商品详情页-付款转化率 与 普通静态商品详情页-付款转化率对比 —— 判断榜单对于商品详情页-付款转化的帮助。
②榜单页面的付款转换率与其他超级模板付款转化率对比 —— 判断榜单整体页面转化
度量一是本次看板需要制作关注的目标,度量二是可以通过已有看板查询。
(二)ujm模型
用户旅程地图见下图
[图片上传失败...(image-a91c73-1638794067131)]
重点关注商详-付款的转化数据,同时将榜单的上级来源页面的uv分别统计
三、数据指标中心
(一)概念
数据指标中心是规范化开发指标并对其进行管理维护的系统,将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义,在此基础上,后续可以按照一定规则进行自由拼装,实现自定义指标的功能。
(二)如何建立数据指标中心
1、首先定义指标并归集到对应的主题域
指标的本质是量化了的目标,比如常见的例子:
①我们要把用户的盘子做大,那对应的量化指标就是已注册用户数;
②我们要统计今天的销售额,那对应的量化指标就是总支付金额;
③我们要衡量一次活动的效果,那对应的量化指标就是下单率。
从上面的例子我们可以看到,我们比较常用的几个类型的指标就是,存量型指标(已注册用户数)、事务型指标(支付金额)、转化型指标(下单率),其它还有比例型、统计型、排名型等,这些比较不常用,就不在此赘述了。
这些不同类型的指标,分散在我们产品中的不同功能模块中,所以为了更好地规范与管理,我们需要将这些指标也按照主题域的方式归集起来。主题域在“仓库模型中心”进行创建与定义,在这里只需要将对应的指标划归到对应的主题域就行了。
图片
2、然后是拆分原子指标与派生指标
先来看看原子指标跟派生指标这两个概念具体是什么?
①原子指标:是事实表中,某一个字段的统计值(sum、count、max、min、avg),如下单用户数,下单金额等;
②派生指标:是基于原子指标,进行维度组合后产生的指标,如近1天商城下单用户数,本周商城黄金会员下单金额等。
原子指标无业务意义,它只是预定义的代码片段而已。业务中用到的指标基本都是派生指标。
3、接着定义原子指标与派生指标的生产逻辑
在本章的开头有提到这样一句话:“将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义”,这个解耦跟定义的过程,就是把一个派生指标拆解成原子指标、时间周期、限定维度、聚合粒度,然后再重新拼装,生成新的派生指标的过程:
在上面这个例子中可以这样来理解:
①统计周期是这个原子指标进行统计运算的时间范围,在这里是本周;
②聚合粒度是指标的主体,即按照哪个维度来来进行聚合,这里是黄金会员;
③限定维度是限制原子指标的计算范围,这里限定在商城,即只计算商城相关的数据;
④原子指标则是预定义的某个字段计算规则。在这里是下单金额的累加。
4、最后通过指标管理平台对指标进行规范生产
(1)规范化指标命名
命名规范对于后期大量的指标管理来说非常重要,因为当指标多起来的时候,你要找一个指标经常需要用到检索功能,而检索的前提是你对指标有一些前置的认知。这就需要我们对指标的命名进行规范化。
指标命名规范有三个重点:
①简洁明了,易懂:最好是只要看到指标名,不需要看注释就可以知道它的意思,归属等;
②格式统一:每个指标的格式都是一样的,通过组合不同模块的命名拼凑起来;
③生成统一:原子指标与继承自它的派生指标的规范是一致的。
以商城相关的指标为例:
①所有业务下单跟支付指标,默认以主单为统计口径,不用带“主单”相关字眼,如商城下单次数;当统计口径为“子单”时则需要在命名中标出,如:商城子单下单次数;
②所有与人相关指标默认以“注册用户”为统计实体,不需要带“用户”相关字眼,如访问次数;当统计主体为“游客”时则需要在命名中标出,如:游客访问次数;
③无指定业务范围的指标默认为平台指标,不需要带“平台”相关字眼,如近30天支付人数。如果有限定业务范围,则需要加上业务名称,如:商城-近30天支付人数;
④无指定时间周期的指标默认为“近1天”(但需要保存小时粒度,便于后续下钻),不需要带“时间”相关字眼,如注册人数。如果有限定时间范围,则需要加上时间周期:如:近7天注册人数。
完整的命名的规范为:商城(业务板块)+用户(实体)+近7天(统计周期)+新增(业务动作)+子单(类型)+单日(间隔周期)+平均(统计运算规则)+支付金额(原子指标),如:商城-用户近7天新增子单单日平均支付金额(没有的部位可留空,如:商城-汇总支付金额)。
⑵规范化统计口径
当指标主体为实体(名词):游客、用户、商品等,则只需定义单位为“人/个” 即可。如:游客人数、用户人数、商品个数。
当指标为业务动作(动词):如点击、支付、下单等,单位除定义为“次数” 外,还需考虑跟这个动作关联的实体的单位,如“商品”时需要定义多一个单位“笔数”;为“用户”时则需要定义多一个“人数”等;所以一个下单动作的指标,会有多个不同的统计口径:下单次数,下单人数,下单笔数,下单金额……
在定义指标名时需要详细列出,避免出现“下单数”这样模糊的指标。
⑶规范化指标等级
我们都知道,随着公司的发展,产品在不断地进行迭代,功能的增删与业务的变化势必也影响着指标的发展,一些旧的指标被不断更新或废弃,而新的指标也不断增加。这时对指标的管理也成了一个问题,哪些指标由谁开发?后续谁来维护……
一个比较好的解决方案就是对指标进行等级划分,可以划分为两个等级:
①一级指标:即原子指标与小部分全平台的核心指标,从各业务部门收集需求后,统一由数据中台来产出,有一套完整规范的开发流程:需求-评审-排期-开发-测试-验收-上线。所有维护管理工作都由中台负责;
②二级指标:即派生指标,由各业务部门自定通过指标中心生成,没有严格的开发流程,各业务部门根据需要自行创建,但需要遵守命名规范。所有维护管理工作由部门内部负责。
四、阿里体系架构
业务板块:由 于阿里巴巴集团业务生态庞大,所以根据业务的属性划分出几个相对独立的业务板块,业务板块之间的指标或业务重叠性较小。如电商业务板块涵盖淘系、B2B 系和 li Exp ess 系等。
规范定义: 阿里数据业务庞大,结合行业的数据仓库建设经验和阿里数据自身特点,设计出的一套数据规范命名体系,规范定义将会被用在模型设计中。后面章节将会详细说明。
模型设计: 以维度建模理论为基础,基于维度建模总线架构,构建致性的维度和事实(进行规范定义)。同时,在落地表模型时,基于阿里自身业务特点 设计出一套表规范命名体系。后面章节将会详细说明。
(一)规范定义
(二)操作细则
( 1 )派生指标的种类
派生指标可以分为 事务型指标、存量型指标和复合型指标。
按照其特性不同,有些必须新建原子指标,有些可以在其他类型原子指
标的基础上增加修饰词形成派生指标。
事务型指标 是指对业务活动进行衡量的指标。例如新发商品数、
重发商品数、新增注册会员数、订单支付金额,这类指标需维护
原子指标及修饰词,在此基础上创建派生指标。
型指标:是指对实体对象(如商品、会员)某些状态的统计。
例如商品总数、注册会员总数,这类指标需维护原子指标及修饰
词,在此基础上创建派生指标,对应的时间周期 般为“历史截
至当前某个时间”。
复合型指标:是在事务型指标和存量型指标的基础上复合而成
的。例如浏览 UV-下单买家数转化率 有些需要 建新原子指标,
有些则可以在事务型或存量型原子指标的基础上增加修饰词得
到派生指标。
(2 )复合型指标的规则
比率型 创建原子指标,如 TR 、浏览 UV 下单买家数转化率、
满意率等。例如,“最近 天店铺首页 TR”,原子指标为“ CT ”,时间周期为“最近 天”,修饰类型为“页面类型”,修饰词为“店
铺首页”。
比例型 创建原子指标,如百分比 、占 比。例如“最近 天无线
支付金额占比”,原子指标为“支付金额占比”,修饰类型为“终
端类型”,修饰词为“无线”。
·变化量型:不创建原子指标,增加修饰词,在此基础上创建派
指标。例如,“最近 天订单支付金额上 天变化量”,原子指标
为“订单支付金额”,时间周期为“最近 天”,修饰类型为“统
计方法”,修饰词为“上 天变化量”。
·变化率型:创建原子指标。例如,“最近 天海外买家支付金额
天变化率”,原子指标为“支付金额变化率”,修饰类型为“
家地域”,修饰词为“海外买家”。
·统计型 (均值、分位数等):不创建原子指标,增加修饰词,在
此基础上创建派生指标;在修饰类型 “统计方法”下增加修饰词,
如人均、日均、行业平均、商品平均 90 分位数 70 分位数等。
例如,“自然月日均 UV”,原子指标为“UV”,修饰类型为“统
计方法”,修饰词为“日均”。
排名型 创建原子指标, 一般为 top_xxx xxx ,有时会同时选择
rank top_xxx _xxx 组合使用。创建派生指标时选择对应的修饰
词如下:
〉统计方法(如降序、升序)。
》排名名次(如 TOP IO )。
》排名范围(如行业、省份、一级来源等)。
》根据什么排序(如搜索次数、 PV )。
示例如图 所示。
对象集合型 主要是指数据产品和应用需要展现数据时,将一些
对象以 k-v 对的方式存储在一个字段 中,方便前端展现。比如
势图、 TOP 排名对象等。其定义方式是,创建原子指标, 般为
xxx 串:创建派生指标时选择对应的修饰词如下:
其他规则
( I )上下层级派生指标同时存在时
如最近 天支付金额和最近 PC 端支付金额,建议使用前者,
PC 端作为维度属性存放在物理表中体现。
(2 )父子关系原子指标存在时
当父子关系原子指标存在时,派生指标使用子原子指标创建派生指
标。如 PV IPV (商品详情页 PV ),当统计商品详情页 PV 时,优先选
择子原子指标。