补贴活动数据异常,抓出羊毛党

作业改编自真实的业务场景。

特别说明:为突出本次作业训练目标并规避数据风险,所有数据均经过处理,并只保留了相关事件。

业务背景

共享单车潮汐效应明显,上班高峰期单车大多堆积在地铁站,复用率不高;平台运力有限,难以缓解此趋势。

为解决这种情况,某单车推出了「众骑」活动,鼓励有闲暇时间的用户在早高峰期间反向骑行(也就是将车从地铁站骑回居住社区等地),希望缓解高峰期的单车供应问题。

此任务的完成的计算方式是:在「高峰」时间段,于指定地铁站附近 100 米「解锁活动车辆」;骑出地铁站 500 米范围后,「锁定活动车辆」,即可完成。考虑到单车成本,车辆上并未配备 GPS 装置,「解锁车辆」和「锁定车辆」时,会收集手机上的地理位置信息作为判断依据。

每完成一次任务,该用户均可以得到平台发放的红包奖励(1 - 20 元不等),以维持整个活动顺利运转。

活动上线后,红包不断被发放出去,越发越多;但从消费者的角度来看,早晚高峰的单车供应并没有显著的改善。负责这个活动运营的同事很纳闷,明明有这么多人在努力搬运,为什么却没有效果?综合多方面的信息,部分同事已经开始怀疑:活动多半是被羊毛党光顾了,但苦于没有证据。

此时,他们邀你出马。

作业要求

请观察该活动从 10 月 10 日上线后,到 10 月 31 日的数据表现,给出你的分析结论。

推荐步骤:

观察数据,找到异常用户,说明异常理由,推测“作弊”手段。

判断其是“团伙作战”还是“单打独斗”。如果是团伙作战,说明理由,并给出其行为模式(最好能给出基于当前数据平台筛选出这些用户的条件)。

结合实际,给出推荐的后续处置措施。基本原则是:尽量在不伤害现有用户的情况下,减少公司损失,保障活动效果。



找异常用户

分析思路:根据题目给的信息,用户开锁之后需要骑行超过500米范围并关锁成功才算完成,普通单车的速度最高约5米/秒,用户至少骑行100秒之后关锁才算正常,如果步行返回则需要约8-10分钟,如果有同行朋友用单车或电瓶车将其带回原地铁站可以缩短间隔,但是5分钟内完成2次对正常用户来说已经是极限。

根据以上分析,寻找异常用户可以从3个方面入手

①活动期间获得的红包金额

②每天解锁/锁定单车的总次数

③短时间内完成解锁-锁定单车的次数

事件分析-红包金额


事件分析-解锁单车次数


观察此类用户的行为特征

我们可以发现这两个事件的前几个ID都是一样的,搜索其中几个ID查看其行为可以发现他们的异常行为有:

①从解锁单车到锁定单车获得红包基本都在30s内,且在短期内频繁操作;

②有些用户同时解锁2~4辆单车,且解锁的地铁站非同一个,解锁的方式有扫码有蓝牙,

如下图3所示,该用户(ID309380)解锁第一辆车用的是扫码,接下来用蓝牙解锁了三辆,地铁站各不相同;

③部分用户扫码使用的设备为iPad Air2,不太符合常理;

图1↓

图2↓

图3↓


考虑到活动车辆没有安装GPS,仅依靠手机地理位置信息来判断骑行是否达标,而市面上有软件可以达到修改手机定位的目的,因此推测羊毛党的通用作弊手段为:通过软件修改手机定位从而获取红包。

找到羊毛党

高频次羊毛党

根据上述分析,这批异常用户的共同特征是短时间内高频次解锁-锁定单车,可以通过漏斗分析来找到这批用户。

①设定5分钟内完成3次活动的漏斗,并且限制每次锁定行为的触发条件为“红包金额不等于0”,以过滤掉连续扫到故障车的用户,找到一批数量为745的羊毛党用户

②点开这745名用户的用户列表,可以发现他们的ID是从309245到310000连续排列,推测为批量注册;

③抽查其中部分用户,观察他们使用的设备型号多样,解锁方式有扫码有蓝牙,说明有人在现场,操作手法非常相似,通过修改手机定位短时间内高频次获得红包,同一个ID下可以连续用扫码和蓝牙解锁的方式在不同的地铁站解锁两辆甚至更多的单车,结合他们的ID高度连续的特点,团队作战的可能性更大。


另一批羊毛党

①我在分布分析中观察用户在一天内解锁次数的趋势时发现了一个异常现象:从16号开始每天解锁次数在1-19次的数量明显增加,集中表现在5~10次

②在事件分析中观察总体趋势:从16号开始直到27号,用户数量猛增

但是查看任意事件的人均次数却发现在16-27号有明显的下降,说明该期间确实有批量用户加入,但是参与活动的次数并不多,造成了人均次数的下降,验证了之前的想法

再观察高频次羊毛党用户的趋势:在整个活动期间都有参与,16-27号期间没有明显的增长,与大盘趋势有出入,确定了这批非高频次羊毛党的存在


点击16号当天完成活动5-10次的325个用户列表,将之前找到的高频次羊毛党排除,在剩下的用户中寻找行为异常用户,可以发现这批羊毛党的特征是,每天解锁单车频次、解锁间隔与正常用户无异,但是每次解锁单车的地铁站都不一样,一天内出现在多个地铁站,且很多ID还存在同时解锁两辆单车,借助高德平台将某用户某天解锁单车的地理位置信息可视化,他的足迹遍布北京各个地方,解锁方式也是扫码和蓝牙并存。

考虑活动效果,用户并没有觉得高峰用车问题得到缓解,所以推测这批羊毛党也是用了修改定位的方式来获得红包,并没有真正搬运车辆。



找到这批低频次羊毛党用户的方法

这批用户的特点是一天内变换多个地铁站,考虑活动时间每天只有2个小时,地铁站之间的距离都不算太近,用户也不太可能特意乘坐交通工具去其他站点搬运,因此我们认为每天出现在3个及以上地铁站的用户有羊毛党嫌疑。

可以利用分布分析设定阈值查看,16号开始到27号每天解锁单车的地铁站在3个以上的用户猛增,可以把几天的ID导出排查。

后续措施

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,961评论 5 473
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,444评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,009评论 0 333
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,082评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,101评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,271评论 1 278
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,738评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,395评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,539评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,434评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,481评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,160评论 3 317
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,749评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,816评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,038评论 1 256
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,548评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,140评论 2 341

推荐阅读更多精彩内容