数据指标体系建设

一、数据指标体系建设的意义

1.通过指标体系的梳理搭建能够更加全面的监控业务发展，及时准确的发现业务机会/问题。
2.统一指标口径，降低公司内部数据对接时的沟通成本。

二、数据指标搭建模型
（一）osm-明确业务目标，数据赋能业务
▪ O（Objective）：是指我们的业务目标。在这个环节我们需要思考或者回答的问题是，我们的业务、产品，甚至是其中的一个小的功能，它存在的目的是什么、能够解决用户什么问题、满足用户的什么需求？

▪ S（Strategy）：是指清楚业务目标之后，为了达成上述目标，我们应当采取的业务策略。

▪ M（Measurement）：是用来反映业务策略有效性、反映策略执行是否能达成业务目标的度量指标。

（二）AARRR模型和UJM模型--理清用户生命周期以及行为路径
1、ujm
梳理用户生命旅程，与业务目标耦合

我们需要为每一个阶段都设置对应的一个目标。在这一思路中设置出的目标就可以去反哺我们之前制定出来的 OSM 框架，判断其是否有遗漏。各阶段目标确定后，我们需要寻找到产品中为了达到这一目标，与用户产生的接触点，例如首页、搜索页面、商品类目页等就是用户逛产品时的接触点。了解接触点之后，我们紧接着就能够找到每个环节的痛点，而痛点的反面就是我们的机会点。同时，这里每一个机会点都可以反哺前面 OSM 框架中的 S，就是我们的策略，机会点是否与策略相互吻合。所以 UJM 的价值就在于，这样梳理了用户旅程之后，将 UJM 和 OSM 进行关联，就可以起到用户旅程与业务目标相互耦合、相互影响的作用，使得我们的业务目标能够满足用户需求，我们策略能够回答业务问题。

2、aarrr
AARRR模型是基于产品角度，简单地来说就是拉新，促活，留存，付费，推广。对于一款产品来说，我们首先要从各个渠道获取用户；其次需要激活这些用户并让他们留存下来；对于留存下来的用户引导他们付费以及推广产品。

（三）mece模型--指标体系分级治理
首先我们明确了业务核心目标；其次，我们将业务核心的KPI下钻到产品生命周期或者用户路径行为中；接下来我们需要对这些核心KPI向下进行三到五层的拆解，这个过程我们成为指标体系分级治理，用到的模型是MECE模型。MECE模型的指导思想是完全独立，相互穷尽，根据这个原则拆分可以暴露业务最本质的问题，帮助数据分析师们快速地定位业务问题。例如，客户总成交额GMV进行以及拆解可以是付费用户数与平均客单价的乘积。

（四）具体搭建思路
1、公司核心指标拆解——mece
基于公司核心净销售额指标进行拆解，对指标进行分级。

以下为部分样例，主要基于公式拆解对于公司指标进行分级。基于要素法对各个维度进行拆分。

2、各业务线指标拆解

由于每个业务线对平台产生的价值不一样，所以对于各个业务线具体的考核指标是不同的。

对于东家来说，0元拍是为了吸引用户参与拍卖；直播拍、专场拍是为了产生交易额；拍卖行是为了拍卖重器。针对每个业务线需要梳理对应业务线的指标体系。目前我们主要采用 osm * ojm的模型进行梳理。

例如下面针对榜单工具的指标梳理流程：

（一）osm模型

o目标：提升静态商品用户浏览转化率

s策略：榜单工具

m度量：①由榜单进入的静态商品详情页-付款转化率与普通静态商品详情页-付款转化率对比 —— 判断榜单对于商品详情页-付款转化的帮助。

②榜单页面的付款转换率与其他超级模板付款转化率对比 —— 判断榜单整体页面转化

度量一是本次看板需要制作关注的目标，度量二是可以通过已有看板查询。

（二）ujm模型

用户旅程地图见下图

[图片上传失败...(image-a91c73-1638794067131)]

重点关注商详-付款的转化数据，同时将榜单的上级来源页面的uv分别统计

三、数据指标中心

（一）概念

数据指标中心是规范化开发指标并对其进行管理维护的系统，将指标的组成部分解耦拆分开来，并在逻辑表中进行规范性的定义，在此基础上，后续可以按照一定规则进行自由拼装，实现自定义指标的功能。

（二）如何建立数据指标中心

1、首先定义指标并归集到对应的主题域
指标的本质是量化了的目标，比如常见的例子：

①我们要把用户的盘子做大，那对应的量化指标就是已注册用户数；

②我们要统计今天的销售额，那对应的量化指标就是总支付金额；

③我们要衡量一次活动的效果，那对应的量化指标就是下单率。

从上面的例子我们可以看到，我们比较常用的几个类型的指标就是，存量型指标（已注册用户数）、事务型指标（支付金额）、转化型指标（下单率），其它还有比例型、统计型、排名型等，这些比较不常用，就不在此赘述了。

这些不同类型的指标，分散在我们产品中的不同功能模块中，所以为了更好地规范与管理，我们需要将这些指标也按照主题域的方式归集起来。主题域在“仓库模型中心”进行创建与定义，在这里只需要将对应的指标划归到对应的主题域就行了。

图片

2、然后是拆分原子指标与派生指标

先来看看原子指标跟派生指标这两个概念具体是什么？

①原子指标：是事实表中，某一个字段的统计值（sum、count、max、min、avg），如下单用户数，下单金额等；

②派生指标：是基于原子指标，进行维度组合后产生的指标，如近1天商城下单用户数，本周商城黄金会员下单金额等。

原子指标无业务意义，它只是预定义的代码片段而已。业务中用到的指标基本都是派生指标。

3、接着定义原子指标与派生指标的生产逻辑
在本章的开头有提到这样一句话：“将指标的组成部分解耦拆分开来，并在逻辑表中进行规范性的定义”，这个解耦跟定义的过程，就是把一个派生指标拆解成原子指标、时间周期、限定维度、聚合粒度，然后再重新拼装，生成新的派生指标的过程：

在上面这个例子中可以这样来理解：

①统计周期是这个原子指标进行统计运算的时间范围，在这里是本周；

②聚合粒度是指标的主体，即按照哪个维度来来进行聚合，这里是黄金会员；

③限定维度是限制原子指标的计算范围，这里限定在商城，即只计算商城相关的数据；

④原子指标则是预定义的某个字段计算规则。在这里是下单金额的累加。

4、最后通过指标管理平台对指标进行规范生产

（1）规范化指标命名

命名规范对于后期大量的指标管理来说非常重要，因为当指标多起来的时候，你要找一个指标经常需要用到检索功能，而检索的前提是你对指标有一些前置的认知。这就需要我们对指标的命名进行规范化。

指标命名规范有三个重点：

①简洁明了，易懂：最好是只要看到指标名，不需要看注释就可以知道它的意思，归属等；

②格式统一：每个指标的格式都是一样的，通过组合不同模块的命名拼凑起来；

③生成统一：原子指标与继承自它的派生指标的规范是一致的。

以商城相关的指标为例：

①所有业务下单跟支付指标，默认以主单为统计口径，不用带“主单”相关字眼，如商城下单次数；当统计口径为“子单”时则需要在命名中标出，如：商城子单下单次数；

②所有与人相关指标默认以“注册用户”为统计实体，不需要带“用户”相关字眼，如访问次数；当统计主体为“游客”时则需要在命名中标出，如：游客访问次数；

③无指定业务范围的指标默认为平台指标，不需要带“平台”相关字眼，如近30天支付人数。如果有限定业务范围，则需要加上业务名称，如：商城-近30天支付人数；

④无指定时间周期的指标默认为“近1天”（但需要保存小时粒度，便于后续下钻），不需要带“时间”相关字眼，如注册人数。如果有限定时间范围，则需要加上时间周期：如：近7天注册人数。

完整的命名的规范为：商城（业务板块）+用户（实体）+近7天（统计周期）+新增（业务动作）+子单（类型）+单日（间隔周期）+平均（统计运算规则）+支付金额（原子指标），如：商城-用户近7天新增子单单日平均支付金额（没有的部位可留空，如：商城-汇总支付金额）。

⑵规范化统计口径

当指标主体为实体（名词）：游客、用户、商品等，则只需定义单位为“人/个” 即可。如：游客人数、用户人数、商品个数。

当指标为业务动作（动词）：如点击、支付、下单等，单位除定义为“次数” 外，还需考虑跟这个动作关联的实体的单位，如“商品”时需要定义多一个单位“笔数”；为“用户”时则需要定义多一个“人数”等；所以一个下单动作的指标，会有多个不同的统计口径：下单次数，下单人数，下单笔数，下单金额……

在定义指标名时需要详细列出，避免出现“下单数”这样模糊的指标。

⑶规范化指标等级

我们都知道，随着公司的发展，产品在不断地进行迭代，功能的增删与业务的变化势必也影响着指标的发展，一些旧的指标被不断更新或废弃，而新的指标也不断增加。这时对指标的管理也成了一个问题，哪些指标由谁开发？后续谁来维护……

一个比较好的解决方案就是对指标进行等级划分，可以划分为两个等级：

①一级指标：即原子指标与小部分全平台的核心指标，从各业务部门收集需求后，统一由数据中台来产出，有一套完整规范的开发流程：需求-评审-排期-开发-测试-验收-上线。所有维护管理工作都由中台负责；

②二级指标：即派生指标，由各业务部门自定通过指标中心生成，没有严格的开发流程，各业务部门根据需要自行创建，但需要遵守命名规范。所有维护管理工作由部门内部负责。

四、阿里体系架构

阿里体系架构

业务板块：由于阿里巴巴集团业务生态庞大，所以根据业务的属性划分出几个相对独立的业务板块，业务板块之间的指标或业务重叠性较小。如电商业务板块涵盖淘系、B2B 系和 li Exp ess 系等。
规范定义：阿里数据业务庞大，结合行业的数据仓库建设经验和阿里数据自身特点，设计出的一套数据规范命名体系，规范定义将会被用在模型设计中。后面章节将会详细说明。
模型设计：以维度建模理论为基础，基于维度建模总线架构，构建致性的维度和事实（进行规范定义）。同时，在落地表模型时，基于阿里自身业务特点设计出一套表规范命名体系。后面章节将会详细说明。

(一)规范定义

规范定义实例

名词术语

常用时间修饰词

(二)操作细则

( 1 ）派生指标的种类
派生指标可以分为事务型指标、存量型指标和复合型指标。
按照其特性不同，有些必须新建原子指标，有些可以在其他类型原子指
标的基础上增加修饰词形成派生指标。
事务型指标是指对业务活动进行衡量的指标。例如新发商品数、
重发商品数、新增注册会员数、订单支付金额，这类指标需维护
原子指标及修饰词，在此基础上创建派生指标。
型指标：是指对实体对象（如商品、会员）某些状态的统计。
例如商品总数、注册会员总数，这类指标需维护原子指标及修饰
词，在此基础上创建派生指标，对应的时间周期般为“历史截
至当前某个时间”。
复合型指标：是在事务型指标和存量型指标的基础上复合而成
的。例如浏览 UV－下单买家数转化率有些需要建新原子指标，
有些则可以在事务型或存量型原子指标的基础上增加修饰词得
到派生指标。
(2 ）复合型指标的规则
比率型创建原子指标，如 TR 、浏览 UV 下单买家数转化率、
满意率等。例如，“最近天店铺首页 TR”，原子指标为“ CT ”，时间周期为“最近天”，修饰类型为“页面类型”，修饰词为“店
铺首页”。
比例型创建原子指标，如百分比、占比。例如“最近天无线
支付金额占比”，原子指标为“支付金额占比”，修饰类型为“终
端类型”，修饰词为“无线”。
·变化量型：不创建原子指标，增加修饰词，在此基础上创建派
指标。例如，“最近天订单支付金额上天变化量”，原子指标
为“订单支付金额”，时间周期为“最近天”，修饰类型为“统
计方法”，修饰词为“上天变化量”。
·变化率型：创建原子指标。例如，“最近天海外买家支付金额
天变化率”，原子指标为“支付金额变化率”，修饰类型为“
家地域”，修饰词为“海外买家”。
·统计型（均值、分位数等）：不创建原子指标，增加修饰词，在
此基础上创建派生指标；在修饰类型 “统计方法”下增加修饰词，
如人均、日均、行业平均、商品平均 90 分位数 70 分位数等。
例如，“自然月日均 UV”，原子指标为“UV”，修饰类型为“统
计方法”，修饰词为“日均”。
排名型创建原子指标，一般为 top_xxx xxx ，有时会同时选择
rank top_xxx _xxx 组合使用。创建派生指标时选择对应的修饰
词如下：
〉统计方法（如降序、升序）。
》排名名次（如 TOP IO ）。
》排名范围（如行业、省份、一级来源等）。
》根据什么排序（如搜索次数、 PV ）。
示例如图所示。
对象集合型主要是指数据产品和应用需要展现数据时，将一些
对象以 k-v 对的方式存储在一个字段中，方便前端展现。比如
势图、 TOP 排名对象等。其定义方式是，创建原子指标，般为
xxx 串：创建派生指标时选择对应的修饰词如下：
其他规则
( I ）上下层级派生指标同时存在时
如最近天支付金额和最近 PC 端支付金额，建议使用前者，
PC 端作为维度属性存放在物理表中体现。
(2 ）父子关系原子指标存在时
当父子关系原子指标存在时，派生指标使用子原子指标创建派生指
标。如 PV IPV （商品详情页 PV ），当统计商品详情页 PV 时，优先选
择子原子指标。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,271评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,275评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,151评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,550评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,553评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,559评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,924评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,580评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,826评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,578评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,661评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,363评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,940评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,926评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,872评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,391评论 2赞 342