电商用户行为分析(MySQL+Power BI)

一、项目背景

随着电商行业的不断发展,获客成本显著上升,各大电商平台都不遗余力地开拓新的营销模式来刺激用户消费。如何获取高质量用户,精准营销,高效运营成为电商平台未来发展的关键。基于这样的背景,本文对电商用户行为进行分析,解读电商用户行为规律,理解用户需求,帮助平台提高销量,实现营收增长。

二、理解数据

本文基于国内热门电商网站淘宝网的用户行为数据进行分析。
数据来源于阿里云天池。
User Behavior Data from Taobao

数据集主要情况为:用户数量有近100万(987,994),商品数量约为416万(4,162,024),商品类目数量有近1万(9,439),所有行为数量超过1亿条(100,150,807).

数据集含义如下:




由于数据量较大,本文只导入10万条数据进行抽样分析。使用MySQL分析数据,获得分析结果,然后将分析结果导出到Power BI或者Excel进行可视化。

三、分析思路

本次分析的目的是提高销量,将采用对比分析、多维度拆解分析、漏斗模型、RFM模型等方法,并从以下四个维度进行分析和提出改进建议。

  • 用户行为习惯(时间):分析不同日期及时间段的用户行为习惯,找出用户最活跃的时期。
  • 用户行为转化(行为):分析用户从点击到购买整个环节中不同行为路径的转化率,并给出提高转化率的建议。
  • 用户购买偏好(产品):分析热销商品以及系统推荐产品,优化营销推荐策略。
  • 用户价值(用户):利用RFM模型进行客户群分类,建立评分机制,对不同价值的用户采用不同的运营刺激消费。
    以下是分析思路


    思维导图

数据清洗

  1. 选择子集
    源数据只导入10万条数据,列包含用户ID、商品ID、商品类目ID、行为类型、时间戳。
  2. 列名重命名


  3. 重复值处理
    发现无重复值。


  4. 缺失值处理
    将各字段设置成“not null”,确保每个字段中都没有缺失值,并且利用count函数进行计数查询,结果表明没有缺失值。



  5. 格式一致化
    数据集一共有五列,其中timestamp列为时间戳,需转化为时间格式。在原数据表增加4个新字段datetime,date,time,hour。






    格式一致化结果

    6.数据异常值处理
    由于我们利用2017年11月25日至2017年12月3日之间的用户行为数据进行研究,因此需要对该时间段外的数据进行删除。


查询日期
处理后结果

五、分析过程

(一)用户行为习惯分析

分别以日和小时为单位分析用户购买行为,找出用户活跃规律。

1.2017年11月25日至12月3日间的用户行为习惯分布



在研究日期内,11月25日、11月26日与12月2日、12月3日为周末,其余为工作日。从点击量来看,我们可以看出用户的活跃度在12月2日和12月3日有明显增幅。从加购数和收藏数看,相对于收藏,用户更爱直接加购,并且在12月2日及3日间两者都出现明显增长。从购买数看,整体相对平稳,但在后一个周末出现了大幅增长。
流量急剧增长的原因可能是双十二的预热活动导致,用户开始浏览商品,并进行收藏及加购,但却未下单。总体而言,周末的用户活跃度整体比工作日高。

2.一天内的用户行为习惯分布



从点击量看,我们可以发现每日0点至3点用户活跃度快速降低,凌晨3点为一天最低值。4点至10点活跃度逐步上升,10点至18点活跃度相对平稳。其中13点至16点是白天的活跃期。18点后活跃度急剧上升,并在20点至22点达到一天的高峰期,其中21点时为最高值。说明用户习惯在晚上7点至23点浏览并选择商品进行购买。
从加购、收藏、购买及转化率看,用户加购意愿较强,且与点击量变化趋势相关性最高。购买转化率则在中午12点至13点最高,说明用户在午休时下单意愿较强。

(二)用户行为转化分析

从用户行为习惯分布(时)图中,我们发现一天中的购买转化率最大值为3.4%,相对较低。下面我们来分析用户行为转化中的问题。

1.用户整体行为转化分析

(1)建立用户行为视图


(2) 提取数据


(3) 建模分析


先对整体用户行为进行描述性分析,从行为数量占比图中,我们发现点击行为占比89.7%,加购行为约为收藏行为的2倍。从用户行为转化漏斗图中,我们可以看到用户从点击到购买的转化率约为2.3%。那么是什么原因导致从点击到购买的转化率偏低呢?
针对转化率低的问题,从用户行为和商品两个维度来做出3种假设,来研究是什么原因导致转化率低。


思维导图

2.不同行为路径转化分析

行为路径指的是用户从点开商品到最终购买所经过的步骤。本文以点击、加购、收藏、购买为4个基本的步骤。通过分析不同行为路径的转化率,我们可以发现哪个环节产生了问题,而导致用户最终未购买。
假设一:不同的行为路径影响转化率。
可分为4种路径(收藏加购不分先后顺序):

  • 点击—购买
  • 点击—加购—购买
  • 点击—收藏—购买
  • 点击—收藏和加购—购买

(1)查询统计各行为路径用户数

(2)绘制转化漏斗图并分析


从上图,我们可以发现在点击商品后,48.58%的用户会进行加购,25%的用户会加购并收藏,12%的用户会进行收藏,而7.45%的用户会直接购买。
其次,我们发现收藏和加购-购买的转化率有80%,其次为加购-购买的转化率69%,收藏-购买的转化率60%,加购的转化率大于收藏。
经过分析,我们发现不同的购物行为路径对转化率存在影响。因此,假设一成立。

(三)用户商品偏好分析

现在从产品维度分析对转化率的影响。

1.商品类目数量

假设二:商品类目单一影响转化率。




查询商品类目发现有3128个,并不单一,用户的购买选择较为丰富。
因此假设二不成立。

2.热搜商品和热卖商品

假设三:推荐商品不符合用户偏好影响转化率。

(1)热搜与热卖TOP20商品ID



热搜与热卖TOP20商品ID

整理成表格可以发现两组数据的商品ID不存在重合。高点击的商品没有转化成高销量商品。由于商品ID较多,TOP20的样本数据较少,下面我们再从商品类目来进行分析。

(2)热搜与热卖TOP20商品类目



热搜与热卖TOP20商品类目

将数据整理成表格发现两组数据有12个相同类目,重合度达60%。说明商品类目存在明显的集中趋势。
而用户点击量最多的前5个类目在购买量中分别排名7,8,3,11,16。说明存在流量浪费,高流量并未直接对应高销量。
从商品ID和商品类目来看,高流量并没有带来高销量,推荐的商品未完全符合用户偏好,因此假设三成立。
综上所述,

  • 假设一:不同的行为路径影响转化率 成立
  • 假设二:商品种目单一影响转化率 不成立
  • 假设三:推荐商品不符合用户偏好影响转化率 成立

(四)用户价值分析

RFM模型是衡量客户价值和客户创利能力的重要工具和手段。

  • R:最近一次消费时间(最近一次消费到参考时间的间隔)
  • F:消费的频率(消费次数)
  • M:消费的金额(总消费金额)
    由于本次分析中没有提供金额,所以从R、F两个维度对客户群进行分析。

1.计算R和F的值


2.确定R和F的评分规则

整理后发现R值范围1-9,F值1-43。


3.给R和F价值打分


4.计算R价值分和F价值分的平均数

5.进行用户分类并分析




用户分类

由上图,我们可以发现91%用户为重要挽留用户和重要发展用户,两者分别占比52%和39%。而 重要价值用户和重要保持用户仅占约6%和3%。

六、总结与建议

(一)用户行为习惯

通过对用户行为习惯的分析,可以发现周末的用户活跃度整体比工作日高。一天中晚上7点至23点为高峰期。中午12点到下午1点则是白天的活跃时间段,并且购买转化率较高。

  • 可以将营销活动、直通车、钻展等安排在用户活跃时间段,来促进引流并转化;
  • 可以在中午12点左右设置各类限时促销或捆绑销售活动,缩短用户选择时间,促进转化率的提升,从而提高销量。

(二)用户行为转化

通过分析,发现用户收藏加购到购买的转化率达到80%,而流量行为从点击到购买的转化率仅为2.3%。说明从点击到其它环节中存在大量的流失,购买行为路径的优化是重要环节。

  • 引导加购及收藏,可以加强营销机制引导顾客加购以及收藏,比如加购送优惠券、加购送小样赠品、收藏抽奖等;
  • 优化人群画像,针对行为路径较短的人群,如占比7.45%的点击后即购买的用户 着重进行商品推荐,从而提高转化率,提升销量;
  • 优化界面设计,可以给客户提供同类产品比较的功能。让用户不需要多次返回搜索结果进行点击查看,方便用户确定心仪产品,增加点击到购买行为的转化。

(三)用户购买偏好

高浏览的商品并未对应高销量,存在流量的浪费。TOP20的热销类目和热搜类目存在60%的相同类目,即热门的商品类目存在集中的趋势。

  • 优化推荐机制,优先展示热销的商品和类目,满足用户的购买偏好;
  • 优化推荐商品的展示方式,如美化图片、评论管理等,提升用户的购买意愿;
  • 通过更完善的会员积分机制,促销活动等方式来降低流失率。

(四)用户价值

通过RFM模型对客户群进行划分,可以对不同的用户群体采用不同的策略,促进精准营销。

  • 针对重要挽留客户,有流失的风险,要想办法主动联系用户,明确流失原因,想办法挽回并再次激活用户购物;
  • 针对重要发展用户,消费频率较低,可以采取购物红包、每月会员日、限时优惠信息提醒等方式来提升消费频率;
  • 针对重要价值用户,需要重点关注并给予VIP待遇,不断提升用户满意度;
  • 针对重要保持用户,最近一次消费时间较长,可以采取短信推送、APP促销信息提醒等方式和客户保持联系,为其进行个性化推荐,以提高复购率。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,636评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,890评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,680评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,766评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,665评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,045评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,515评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,182评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,334评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,274评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,319评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,002评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,599评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,675评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,917评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,309评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,885评论 2 341

推荐阅读更多精彩内容