“相似人群的扩展,是人群应用中的一个重要场景。”
今天和大家一起分享什么是相似人群的扩展,以及如何基于选定的人群,进行相似人群的扩展。即行业中的Look-alike。
一、Look-alike的基本含义
首先聊一聊什么是Look-alike。
相似人群的扩展,正如字面上的含义,就是对人群进行展开,使扩展后的人群特征和选定的人群的特征保持一致或者尽可能的相近。这里有以下几个常见的概念。
【种子人群】即我们要基于哪个人群进行相似人群的匹配。种子人群的获得方式,可以是用户自己通过标签系统圈选的人群,也可以是一群完全自己上传的人群(前提是ID可以打通)。
【扩展倍数】即要将种子人群扩大的倍数。通常作为配置项让用户进行选择。
【扩展人群】即将种子人群按照扩展倍数扩充后,获得的人群。该人群的特征规律应该和种子人群的特征规律比较一致或者相近。
二、价值和应用场景
什么应用场景会需要进行人群扩展呢?
【场景1】在画像系统中,当用户通过一个标签或者一系列标签,完成了人群的圈选,此时经常出现的一个问题是:圈选出来的人群太少了。这对于人群包的应用(展现次数、点击次数、转化次数等)而言,无疑是巨大的影响。
【场景2】运营人员经过多次的效果测试和人群优化后,有个效果特别好的人群包。但是呢,往往越是精准的人群包,数量也越少。扩展人群包的数量,通常来讲肯定会降低投放效果,但是扩量一定是必走的营销之路。
因此,只有质量没有数量的投放,并不能称得上成功的投放。在不降低投放质量或者少降低投放质量的前提下,尽量扩展投放数量,是摆在投放人员面前的重要课题,也是画像系统、广告系统的重要内容。
三、一些常用的扩展方法
那如何将种子人群扩展呢?常见的方法主要有三种(这些是比较基础的一些方法,具体的扩展方法建议在这些方法的基础上,结合自己的业务场景,进行更科学的应用,尽量不要生搬硬套):
(1)通过标签的方式匹配
通过标签的方式是比较容易落地的方法。主要有这么几个步骤。
首先,识别种子人群的特征标签。关于如何识别人群的特征标签,在之前的文章《如何从海量特征中识别人群的突出特征》中有阐述过,大家可以参考查阅。
其次,就是基于识别的典型特征,进行人群的扩展。例如,我们识别出来种子人群有【高消费】、【偏好奢侈品】、【小镇中产】等标签。那么我们可以将包含这些特征的人群都先圈出来(交集或者并集)。这样就完成了相似人群的扩展。
这种方法比较直接,但相似效果比较难衡量。
(2)通过相似度的方式直接计算
通过相似度的方式,主要是将人群的特征进行向量化,然后计算向量之间的距离。
例如我们总共有100个标签、400个特征(所谓特征可以理解成标签取值)。那么,每个用户都可以用400维的向量进行标识。
基于每个用户的向量,计算种子人群的向量均值。然后用其余待匹配人群的特征向量,与种子人群的向量均值求距离。
最后,按照距离进行排序,获得距离最近的top取值即可。
(3)通过机器学习的方式训练
通过标签的方式,比较容易理解;用距离的方法,比较容易计算。除此之外,就是用算法的方式进行扩展了。
算法的具体实现就不说了,其实就是一个典型的分类问题。即判断一个人属不属于种子人群。而种子人群作为机器学习训练集。
04
—
产品化设计参考
关于产品设计,这里简单聊两句。
(1)在谷歌广告中的设计
首先看看谷歌广告的产品设计。下图是谷歌广告中的相似人群扩展的功能:
这里谷歌采取的是滑块的方式,进行不同程度的扩展。
这里补充一下,我简单了解了一下谷歌的扩展逻辑,有一种逻辑是基于的关键词的扩展。例如选定的关键词是“台灯”,扩展的时候是先扩相似相近关键词,例如“吊灯”、“床灯”等,然后基于扩展的关键词进行人群扩展。这算是上面没有提到的一种扩量逻辑吧。
(2)在阿里达摩盘中的设计
实在是没有达摩盘的账号了,就从介绍视频里截了个图:
从这个图里,也能看出一些端倪。达摩盘的人群扩展,是比较贴合业务场景的,加了很多业务层面的逻辑。这会提升扩展后人群的效果。应该是比较高阶的扩展逻辑了。
(3)在JD某产品中的设计
最后给个我们自己的产品中,关于人群缩放的内容吧:
我们这里除了支持人群的扩充,也支持人群的缩减。是自动基于用户填写的人数设置来的,这里的人数设置,就是上文提到的扩展人群的概念。即若填写的人数大于种子人群,则扩展;反之则缩减。扩充的方法是采取相似人群算法。
缩减的方式直接进行的随机抽取。
今天主要分享这些,感谢继续关注~