一、背景介绍:
双十一购物狂欢节,是指每年11月11日的网络促销日,源于淘宝商城(天猫)2009年11月11日举办的网络促销活动,当时参与的商家数量和促销力度有限,但营业额远超预想的效果,于是11月11日成为天猫举办大规模促销活动的固定日期。双十一已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业。
二、分析目的:
评估促销活动的结果,并根据活动结果,优化商品结构,以便让自己的商品卖的更好。
三、主要分析框架
四、ABC分类方法简介
ABC分类法(Activity Based Classification) ,全称应为ABC分类库存控制法。在ABC分析法中,先将目标数据倒序拍了,然后做累计百分比统计,最后将得到百分比按照如下划分为A,B,C三类:
A类:发生累计频率为0%~80%,是主要影响因素
B类:发生累计频率为80%~90%,是次要影响因素
B类:发生累计频率为90%~100%,是一般影响因素
ABC分析法常用语电商活动分析中。
商品ABC分级的关键指标是“支付传化率”,“商品库存”,根据这两个指标所制定的分级逻辑,以判定商品是属于哪一级的。
商品的ABC分级法需要将分析颗粒精细到每个款式,分析相对繁杂,所以一般只有在店铺进行大型促销活动时才会用到。也是因为只有店铺在大型促销活动时,每个单款商品所承载的流量与成交数据足够大,ABC分级才更有意义。
A级:高库存且高转化率。A类商品长效且库存有保障,可作为活动中的主推商品。
B级:转化率中等,且经过流量测试的商品。对方可有一定的吸引力,可以继续维持当前的销售定位
C级:转化率较低,且经过流量测试的商品。C类商品应处于店铺低端,基本属于被放弃的一类商品。但如果C类商品库存较高,则需要尝试改变策略如更换主图,降价等方式清除库存。
五、分析过程
准备工作:BlackFriday.csv 数据集,分析工具:Anaconda Jupyter Notebook
import pandas as pd
import numpy as np
1.读取数据并处理
dt1 = pd.read_csv("sales_info1.csv")
dt1.rename(columns={"sale_name":"商品名", "sale_price":"售卖价", "tag_price":"吊牌价", "discout":"折扣率", "stocks":"库存量", "stocks_value":"货值", "cost_price":"成本价", "profit_rate":"利润率", "skus":"SKU"}, inplace=True)
dt1.head()
dt2 = pd.read_csv("sales_info2.csv")
dt2.rename(columns={"sale_name":"商品名", "uvs":"UV数", "collections":"收藏数", "carts":"加购物车数"}, inplace=True)
dt2.head()
dt3 = pd.read_csv("sales_info3.csv")
dt3.rename(columns={"user_id":"用户id", "buy_date":"购买日期", "sale_name":"商品名", "buy_cons":"购买数量", "buy_price":"购买单价", "cost_price":"购买金额", "is_tui":"是否退货", "tui_cons":"退货件数", "tui_price":"退货金额"}, inplace=True)
# 将是否退货列的是否替换为1与0,方便后续计算
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})
dt3.head()
2. 活动整体情况分析
2.1 表合并处理
# 将商品信息表dt1与商品热度表dt2合并,生成商品信息表dt_product
dt_product = dt1.merge(dt2,how="left",on="商品名")
# 对用户销售明细表根据商品分组聚合,生成商品销售表product_sales
product_sales = dt3.groupby("商品名").agg({"购买数量":"sum", "购买金额":"sum", "退货件数":"sum", "退货金额":"sum", "购买单价":"mean", "用户id":pd.Series.nunique}).reset_index()
product_sales.rename(columns={"购买数量":"商品销售数量", "购买金额":"商品销售金额", "是否退货":"商品退货数量", "退货金额":"商品退货金额", "购买单价":"商品销售单价", "用户id":"购买用户数量"},inplace=True)
# 将商品信息表dt_product与商品销售表product_sales合并,生成一个汇总表dt_product_sales
dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")
dt_product_sales.head()
2.2 计算本次活动相关指标情况,与去年同期进行比较
通过分析,查看活动的GMV,销量,实际销售额,客单价,拒退量,拒退额,折扣率,备货值,SKU,SPU,售卖比,UV,转化率,收藏数,加购数
#1、GMV:销售额,包含退货的金额
gmv = dt_product_sales["商品销售金额"].sum()
#2、实际销售额=GMV - 退货金额
return_sales = dt_product_sales["商品退货金额"].sum()
return_money = gmv - return_sales
#3、销量:累计销售量(含拒退)
all_sales = dt_product_sales["商品销售数量"].sum()
#4、客单价:GMV / 客户数
custom_price = gmv / dt_product_sales["购买用户数量"].sum()
# 5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
# 6、转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量)
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= gmv / tags_sales
# 8、备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
# 9、售卖比:又称售罄率,GMV / 备货值。
sales_rate = gmv / goods_value
# 10、收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
# 11、加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
# 12、SKU数:促销活动中的最小品类单元(一般指货号)。
sku_cons = dt_product_sales["SKU"].sum()
# 13、SPU数:促销活动中的SPU计数(一般指款号)。
spu_cons = len(dt_product_sales["商品名"].unique())
# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
# 15、拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
2.3 将今年双十一与去年双十一的活动数据对比分析
# 将以上内容汇总到一张表
sales_state_dangqi = pd.DataFrame({
"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,], "UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],
"售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,]})
# 导入去年双十一活动数据
sales_state_tongqi = pd.DataFrame(
{"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],
"UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],
"售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],
"spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,]})
# 将两表转置并合并
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_dangqi_s.columns = ["指标","今年双11"]
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")
# 求各指标的同比情况
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state
3. 从价格区间来优化商品结构
3.1 对价格进行分区
# 根据价格区间进行切片分区
# 设定分区
listBins = [0,200, 400, 100000]
#设置切分后对应标签
listLabels = ['1_200','200_500','400及以上']
# 按照设定的分区,将数据切分成
dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
3.2 按照价格分区进行分组聚合
# 按照价格分区进行分组聚合
dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({"货值":"sum", "商品销售金额":"sum", "商品销售数量":"sum", "UV数":"sum", "购买用户数量":"sum", "收藏数":"sum", "加购物车数":"sum"}).reset_index()
# 货值占比、销售占比、客单价、转化率
dt_product_sales_info["货值占比"]=dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()
dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()
dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]
dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]
dt_product_sales_info.head()
3.3 取价格分组在400以上的部分进行分类
# 取价格分组在400以上的内容
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']
# 求转化率与售卖比
# 转换率=客户数 / UV
product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]
# 备货值=吊牌价 * 库存数
product_400["备货值"] = product_400["吊牌价"]*product_400["商品销售数量"]
# 售卖比=又称售罄率,GMV / 备货值
product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]
# 选取部分列
product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]
product_400.head()
3.4 优化方案
转化率大于0.7%的商品,暂时保留,用于下次促销活动;
转化率小于0.7%的商品,但是售卖比大于36%的商品予以保留参加下次促销活动;
转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。
# 1、保留商品:转化率大于0.7%的商品予以保留
stay_stocks571 = product_400[product_400["转换率"]>0.007]
# 2、保留商品:找出转化率小于0.7% 但是 售卖比大于36%的部分予以保留
stay_stocks573 = product_400[(product_400["售卖比"]>=0.36)&(product_400["转换率"]<0.007)]
# 3、清仓处理商品,找出转化率小于0.7%并且售卖比小于36%的部分
stay_stocks574 = product_400[(product_400["售卖比"]<0.36)&(product_400["转换率"]<0.007)]
4. 总结:
从整体来看:今年双十一活动GMV较去年同比增长65.7%,总销量较去年同比增长同比增长57%,整体趋势向好
通过本次活动,在价格大于400元区间的商品:
商品名为A006, B004, B006, C010, E007, F001, F002, G001, G003, H004, H006, H007商品,转化率大于70%,作为后续重点推广产品,加强在首页的布局,确保流量以提高销售额
商品名为A003, B001, B007, E003, E009, F007, G010商品转化率小于70%但售卖比大于36%,作为次级优先商品,尽可能保持当前销售策略
商品名为B008,C003,C007,D007商品转化率小于70%售卖比36%,这部分商品停止进货,通过降价等方式尽快清仓处理。