俗话说,有钱能使鬼推磨。为了保障下载量、使用量,企业通常会在 App 推广中投巨资给第三方渠道,用于引流买量。但在这一过程中,内鬼、羊毛党、刷量中介总会趁虚而入,成为刷量造假的核心群体。那么,今天就根据我的经验来谈谈怎么通过数据分析,辨别流量的真实性,揪出异常渠道。
做渠道数据分析的前提是拿到靠谱的第一手数据。数据如果不够准确,那么基于此数据进行分析也就没有任何意义。
渠道推广比较精准的统计平台我以 openinstall 为例,它能程序化生成渠道包以及海量渠道推广链接,各个渠道只需拿着对应的专属链接即可获取相应数据,即便是用户个体间的社交分享传播,也能实现自动识别渠道分享来源。
数据获取只是万里长征第一步,防作弊分析才是重中之重。目前市场上的作弊方法很多,作弊工作室可能采用分布式人肉刷量的方式来刷量(可以参考基于任务奖励形式的积分墙);也有可能采用更为智能的方式,通过编写程序脚本,修改真机参数,驱动真机运行。这些行为已经跟真实的用户行为几乎没有差别了,很难从技术上分辨这些数据。但我们还是能从数据上分析出一些蛛丝马迹,下面就讲讲具体的辨别方法。
一、先做渠道排重
第一步,先利用现成的工具和系统,从技术上将重复多余的数据剔除,现在许多第三方基于不同的方案,都有一套自己的排重机制,比如 openinstall 后台就能提供免费的排除重复功能,主要维度包括:安装量、注册量、1日/7日/30日留存、增长趋势、IP 分布、系统版本等,也可以根据业务需求自定义目标事件,精准的排重功能可以帮我们做一个初步数据筛选,也为后面的分析环节省去不少工作量。
二、渠道效果评估
1、留存率判断
从留存率看刷量的话,最简单的判断是观察1日、7日、30日这三个节点的数据波动,不少刷量工作室会选择在这三个节点定时导入或者批量导入大量用户数据。所以,如果在没有外在因素影响的情况下,数据出现过高或过低的波动,那么该渠道就有作弊嫌疑。
真实的用户留存曲线应该是平滑下降的,如果一个 App 的次日留存率能达到40%的话,那么7日留存率达到20%,30日留存率达到10%,这个 App 的留存率就高过业内标准了,需要警惕。一般高频类 App(如社交、外卖、工具类)留存率会大于低频类 App(如租房、旅游、电商类),其次,如果有签到奖励、沉默唤醒机制的 App 留存率或许会高一些,这些因素也要考虑进去。
2、终端设备判断
用户终端可以准确追踪到的包括:IP分布、系统版本、品牌/机型等,这些都有分析技巧。
IP分布关系到投放策略层面,一般我们都会根据产品调性做重点投放,比如一二线高消费城市、三四线等相对下沉城市,或者根据区域,比如华东、华南或省份等。查看数据时,如果有部分用户来自重点投放区域外,或者过于集中在某个地区,那么数据来源可能来自某个作弊工作室。
系统版本和操作系统占比也能看出些猫腻。事实上很多作弊渠道都是统一采购作弊设备,毕竟如果一直换新手机作弊成本也太高了,但真实用户不是,因此如果观察到的版本和系统都是比较落后的版本,或者是过于集中在某个时段的版本,那可能就有问题,比如现在2019年,而来自某个渠道的用户机型和操作系统基本都是2017年6月份发布的新机,那就值得怀疑。
品牌机型也是同理,尤其是 iOS 没有模拟机,必须用真机触发,因此刷量作坊会大量采购二手苹果手机,安卓方面,出于成本考虑,主要的刷量也都是由低价机、二手机、冷门机型完成,这些都是可以辨别的依据。
3、用户行为判断
即便如今的作弊工作室能模拟出连系统都无法辨别的逼真行为数据,但访问页面、使用时长、访问间隔、使用频率这些实际行为是很难和真实用户一模一样的。
想要辨别的话,一是跟日常数据做比较,在没有活动或重大更新之类的影响下,真实用户的行为数据应该是趋向平稳的,这个能从某个页面的访问或功能使用时长判断;二是参考权威数据,应用宝之类的应用市场或第三方评测平台,会根据市场大数据定期发布用户行为报告,这个也是参考标准之一。
4、转化率分析
分析一个 App 的流量转化率,不仅能帮助我们提高投放效率,还能判断引流渠道的价值。
通常用户行为都是可以做成漏斗模型的,我们可以把“访问-下载-安装-打开-注册-付费”等行为步骤做成沙漏,每经过一层,作弊难度就会大幅增加,观察每一层转化的异常,可以对渠道质量得出一个大致的结论。
以上这些方法在实际运用中还有很多发挥空间,可以自行根据产品性质做出调整,跟作弊行为斗智斗勇,是每个 App 推广中必须经历的,这些就需要经验积累和工具辅助运用才能实现。