用户画像建模
用户画像是对现实用户的数据建模
标签是一个符号,并且与业务紧密相连才有意义
谨记
构建用户画像,确定标签要与业务部门和产品部门共同商量确定,因为用户画像与业务紧密相连,标签体系是搜集所有业务方面的需求。
验证
验证需要两方面考究。
第一,标签是否准确
第二,标签是否齐全
但是无法保证这两者100%符合,尤其是后者,因为业务不断变化,导致最多在一段时间内标签的齐全,抑或多数情况下标签是不齐全的。所以我们通常判断的是准确性。
准确性的判断有两类。
第一类,以实时为依据,比如用户的性别,通过数据是可查究的。
第二类,无事实为依据,比如用户的忠诚度,只有通过线上数据的A/B Test来对比验证。
根据数据流处理划分用户画像
- 数据层:
用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录 - 算法层:
透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户分类的模型标识 - 业务层:
获客、粘客、留客的手段。打上“预测标签”,作为业务关联的结果。
美团外卖的用户画像该如何设计?
用户消费行为分析
- 用户标签:
性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道注册信息 - 消费标签:
餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级 - 行为标签:
点外卖时间段、使用频次、平均点餐用时、访问路径 - 内容分析:
基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等
一、什么是用户画像
用户画像,即用户信息标签化
用户画像是分析用户的人口属性、社会交往、行为偏好等数据,抽象出的多维度特征标签集合,可直观地描绘出用户的整体全貌。
二、标签体系建设
1、客户分群能力
基础标签,用户唯一标识:用户名,手机号,邮箱
- 用户标签:比如性别、年龄、收入、职业、学历、归属城市等;
- 行为标签:时间段、频次、时长、访问路径等
- 消费标签:消费习惯、购买意向、价格敏感等;
基于上述基础标签,可以形成用户画像标签,根据当前业务需求不断进行规则/模型的迭代:
- 用户的位置偏好特征
- 出行偏好特征
- 内容标签:浏览内容
- app使用偏好特征
基于画像标签和基础标签衍生出了营销标签:
- 口红购买推荐
- 奶粉需求推荐
用户生命周期标签:(业务价值)
- 获客:拉新、营销
- 粘客:个性化推荐、搜索排序、场景运营
- 留客:流失率预测
三、标签效果评估
1、基础标签、画像标签
这两个是供业务人员使用的,不参与营销,可以从使用的频次、收藏次数等使用者角度进行评估;
2、营销标签
因为营销标签是参与营销活动的,一个营销标签代表了一个营销用户群,那么可以从标签输出用户群数量,触达用户群的渠道、投放用户群的产品、用户群营销结果等各环节效果评价体系,实现各环节数据可视化呈现,助力营人员提升或改进运营策略,提高用户触达率和办理成功率。
四、标签生命周期管理
对于标签的上线,要经过评审,只做有意义的、正确的、口径合理的标签;
标签上线以后,监测标签的使用情况,避免标签沉没;
由于用户特征变化比较快,需要对于僵尸标签、过时标签或不合时宜的标签及时清理,节约维护成本和服务器内存。
标签主要有三个来源:
- 第一类:是在IT系统中可以取得的信息
比如办会员卡时留下的信息(性别,年龄,生日),购买渠道,积分情况等; - 第二类是可以通过计算或是统计所获得的
比如用户对某类促销活动的参与程度,对某种颜色/款式商品的偏好程度,是否进行过跨品牌的购买等; - 第三类则是通过推测所得
比如送货地址中出现“宿舍”,“学校”,“大学”等字样,则用户身份可以推测为学生,出现“腾讯大厦”,“科技园”等信息时,则可判断是上班族,并有很大概率是技术从业者。
在标签的设计上也带有较强的行业性:
- 是否偏好购买当季爆款或是新品多于经典款(时尚度);
- 是否更倾向购买低价或打折商品(价格敏感度);
- 是否喜欢购买高价商品或限量版(反向价格敏感度)
什么是标签体系?
简单说就是你把用户分到多少个类里面去。当然,每个用户是可以分到多个类上的。这些类都是什么,彼此之间有何联系,就构成了标签体系。标签体系的设计有两个常见要求,一是便于检索,二是效果显著。在不同的场景下,对这两点的要求重点是不同的。笔者见过很多做用户画像的产品经理,往往醉心于设计一个伟大、 光荣、正确的标签体系,这往往是形式主义的调调儿。
一般来说,设计一个标签体系有三种思路:
从信息索取的角度
结构化标签体系
可以做成下拉选项
简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。
结构化标签体系看起来整洁,又比较好解释,在面向品牌广告主开喷时比较好用。
性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。
不过,实践当中即使是面向品牌广告主,售卖非人口属性的受众也存在很大困难,原因又回到文章开头说的问题:这些标签从原理上就是无法监测的。
半结构化标签体系
行业内并列,但是随时可拓展
在用于效果广告时,标签设计的灵活性大大提高了。
标签体系是不是规整,就不那么重要了,只要有效果就行。
在这种思路下,用户标签往往是在行业上呈现出一定的并列体系,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签体系:
当然,标签体系太过混乱的话,投放运营起来就比较困难。因此,实践中往往还需要对一定程度的结构化做妥协,除非整个投放逻辑是机器决策的(比如个性化重定向)。
非结构化标签体系
随机化的标签
非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词,意思也一样。
半结构化标签操作上已经很困难了,非结构化的关键词为什么在市场上能够盛行呢?这主要是因为搜索广告的市场地位太重要了,围绕它的关键词选择和优化,已经形成了一套成熟的方法论。
面向品牌的结构化标签体系,设计的好坏似乎并不太重要;而彻底非结构化的标签,也没有太多设计的需求。产品狗们碰到的难点,往往是如果设计合理的半结构化标签体系以驱动广告的实效。这里面最关键的诀窍,是深入研究某个具体行业的用户决策过程。
站在上帝造万物的视角,以电视台分频道的方法将用户分到财经、体育、旅游……这样的框框里去,其实并不难,也没有太大意义。真正务实的思维,是不要关注那么多的行业,把目光聚焦在你目前服务的客户类型上。本来,你接的都是电商客户,关注教育行业用户分类有啥意义呢?