1、业务背景
唯品会是一个专门做特卖的网站,随着唯品会在电商领域的不断发展,唯品会货源中新品和专供品的占比不断提升,新品首发、定制包销、自有品牌均成为唯品会零售的可持续货源。
2、业务需求
在每次特卖活动中,我们可分析活动运营情况来挖掘对促销活动贡献度高的商品。其中,销售额、售卖比、UV、转化率等指标是考量业务成绩的几个重要指标。本项目的目的是建立促销活动的运营情况评估指标体系,找到最优的特卖商品结构,从而更好地卖出商品。
3、业务分析指标
- GMV:销售额,即到手价
- 实销:GMV-退货金额
- 销量:累计销量(含退货)
- 客单价:GMV/客户数,客单价与毛利率有关,客单价越高,毛利率越高
- UV:商品所在页面的独立访问数
- 转化率:客户数/UV
- 折扣率:GMV/吊牌总额(吊牌价* 销量)
- 备货值:吊牌价* 库存量
- 售卖比:即售罄率,GMV/备货值
- 收藏数:收藏某款商品的用户数量
- 加购数:加购物车人数
- SKU数:促销活动中的SKU计数(一般指货号)
- SPU计数:促销活动中的SPU计数(一般指货号)
- 拒退量:拒收和退货的总数量
-
拒退额:拒收和退货的总金额
其中,销售额、售卖比、UV、转化率为主要关注指标,其余为辅助指标。
具体的业务分析框架如下:
4、数据分析
4.1 数据源
sales_info1:商品信息表,数据结构如下:
sales_info2:商品热度信息表,数据结构如下:
sales_info3:用户销售明细表,数据结构如下:
以上数据来源MySQL数据库,通过Python读取。
4.2 数据汇总
- 统计每个商品的销售情况
#dt3为用户销售明细数据
product_sales = dt3.groupby('商品名').agg({'购买数量':'sum',
'购买金额':'sum',
'退货件数':'sum',
'退货金额':'sum',
'购买单价':'mean',
'用户id':pd.Series.nunique}).reset_index()
product_sales.rename(columns={
'购买数量':'商品销售数量',
'购买金额':'商品销售金额',
'退货件数':'商品退货数量',
'退货金额':'商品退货金额',
'购买单价':'商品销售单价',
'用户id':'商品购买用户数量'
},inplace=True)
product_sales.head()
得到每个商品的销售情况汇总数据
- 合并商品信息表、热度信息表和商品销售汇总表
#dt1为商品信息表、dt2为热度信息表
dt_product = dt1.merge(dt2,how='left',on='商品名')
dt_product_sales = dt_product.merge(product_sales,how='left',on='商品名')
得到最终的分析数据,数据结构如下:
4.2 计算业务分析指标
- 计算单个指标
#1、GMV,销售额
gmv = dt_product_sales['商品销售金额'].sum()
#2、实销:GMV-退货金额
return_money = gmv - dt_product_sales['商品退货金额'].sum()
#3、销量:累计销量(含退货)
all_sales = dt_product_sales['商品销售数量'].sum()
#4、客单价:GMV/客户数
custom_price = gmv/dt_product_sales['商品购买用户数量'].sum()
#5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales['UV数'].sum()
#6、转化率:客户数/UV
uv_rate = dt_product_sales['商品购买用户数量'].sum()/uv_cons
#7、折扣率:GMV/吊牌总额(吊牌价* 销量)
tag_sales = (dt_product_sales['吊牌价'] * dt_product_sales['商品销售数量']).sum()
discount_rate = gmv/tag_sales
#8、备货值:吊牌价* 库存量
goods_value = (dt_product_sales['吊牌价'] * dt_product_sales['库存量']).sum()
#9、售卖比:即售罄率,GMV/备货值
sales_rate = gmv/goods_value
#10、收藏数:收藏某款商品的用户数量
collect_cons = dt_product_sales['收藏数'].sum()
#11、加购数:加购物车人数
add_shop_cons = dt_product_sales['加购物车数'].sum()
#12、SKU数:促销活动中的SKU计数(一般指货号)
sku_cons = dt_product_sales['SKU'].sum()
#13、SPU计数:促销活动中的SPU计数(一般指货号)
spu_cons = len(dt_product_sales['商品名'].unique())
#14、拒退量:拒收和退货的总数量
reject_cons = dt_product_sales['商品退货数量'].sum()
#15、拒退额:拒收和退货的总金额
reject_money = dt_product_sales['商品退货金额'].sum()
- 合并分析指标
#当期数据
sales_state_dangqi = pd.DataFrame(
{"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],
"UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],
"售卖比":[sales_rate,],"收藏数":[collect_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],
"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],},
)
# 去年的数据是已经统计好了的,不需要计算
sales_state_tongqi = pd.DataFrame(
{"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],
"UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],
"售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],
"spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],},
)
#当期数据修改列名
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_dangqi_s.columns = ['指标','今年双十一']
#去年数据修改列名
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ['指标','去年双十一']
sales_state = pd.merge(sales_state_dangqi_s,sales_state_tongqi_s,on='指标')
#计算同比指标
sales_state['同比'] = (sales_state['今年双十一'] - sales_state['去年双十一'])/sales_state['去年双十一']
如上所示,客单价同比下降了,客单价与毛利率有关,需要追踪客单价下降的原因;客单价与GMV、UV数和UV转化率有关, 这三个指标同比都上升了,猜测客单价下降的原因是【高质量客户流失,买低价的客户较多;促销价格过低】。此外,折扣率同比也下降了,做特卖折扣是一个运营的关键点,通过比较不同折扣力度的运营效果,为折扣力度的设置提供数据参考。
4.3 根据价格区间来确定合适的促销商品结构
这部分的主要工作:根据价格区间划分数据,分析价格相对高的商品此次促销情况,以此来优化后期的促销结构。
- 根据价格划分数据
#划分价格区间
listBins = [0, 200, 400, 100000]
#设备切分后对应标签
listLabels = ['1_200', '200_400', '400及以上']
#进行数据切分
dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)
- 计算每个价格区间的业务分析指标
这里用到的业务分析指标如下:- 货值
- 货值占比
- 销售额
- 售卖比
- 销售占比
- 销量
- 客单价
- UV
- 收藏数
- 加购数
- 转化率
- 用户数
# 货值 销售额 销量 UV 用户数 收藏数 加购数
dt_product_sales_info = dt_product_sales.groupby(['价格分组']).agg({
'货值':'sum',
'商品销售金额':'sum',
'商品销售数量':'sum',
'UV数':'sum',
'商品购买用户数量':'sum',
'收藏数':'sum',
'加购物车数':'sum'
}).reset_index()
# 货值占比 售卖比 销售占比 客单价 转化率
dt_product_sales_info['货值占比'] = dt_product_sales_info['货值']/dt_product_sales_info['货值'].sum()
dt_product_sales_info['售卖比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['货值']
dt_product_sales_info['销售占比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品销售金额'].sum()
dt_product_sales_info['客单价'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品购买用户数量']
dt_product_sales_info['转化率'] = dt_product_sales_info['商品购买用户数量'] /dt_product_sales_info['UV数']
得到三个价格区间各自的业务指标值
如上图所示,价格在400以上的商品,销售额、售卖比均大于另外两个价格区间的商品,转化率与另外两个价格区间的商品势均力敌。虽然是促销活动,不一定只是看价格低这个因素,此处高价的商品也很值得分析,因此选取价格在400以上的商品单独分析。
- 选取高价商品分析
#取出价格400及以上的数据
product_400 = dt_product_sales.loc[dt_product_sales['价格分组'] == '400及以上']
#计算转换率 售卖比
#转换率=客户数/UV
product_400['转换率'] = product_400['商品购买用户数量']/product_400['UV数']
#备货值=吊牌价* 库存量
product_400['备货值'] = product_400['吊牌价'] * product_400['库存量']
#售卖比:售罄率,GMV/备货值
product_400['售卖比'] = product_400['商品销售金额']/product_400['货值']
得到高价商品的运营情况结果
根据上图所示,通过比较转换率和售卖比这两个指标,可以给出下面的优化方案:
- 转换率大于0.8%的商品(即A006、B006、C010、E007、F001),保留,用于下次促销活动;
- 转换率小于0.8%但是售卖比大于30%的商品(即G001、G010、H006),还是可以作为下次促销活动的备选商品;
- 转换率小于0.8%且售卖比不足30%的商品,给予清仓处理。
4.4 根据折扣区间来确定合适的促销商品结构
这部分的主要工作:根据折扣区间划分数据,分析折扣贡献度较高的商品此次促销情况,以此来优化后期的促销结构。
- 根据折扣划分数据
#划分折扣区间
#设置切分区域
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]
#设备切分后的标签
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']
#划分数据
dt_product_sales['折扣区间'] = pd.cut(dt_product_sales['折扣率'],bins=listBins,labels=listLabels,include_lowest=True)
- 计算每个折扣区间的业务分析指标
这里用到的业务分析指标如下:- 销售额
- 销量
- 客单价
- 客户数
- UV
- 转换率
- 库存
- 货值
- 售卖比
- 收藏数
- 加购数
- 货值占比
- 销售占比
# 货值 销售额 销量 UV 客户数 收藏数 加购数
dt_product_discount_info = dt_product_sales.groupby(['折扣区间']).agg({
'货值':'sum',
'商品销售金额':'sum',
'商品销售数量':'sum',
'UV数':'sum',
'商品购买用户数量':'sum',
'收藏数':'sum',
'加购物车数':'sum'
}).reset_index()
#客单价 转化率 货值占比 销售占比
dt_product_discount_info['客单价'] = dt_product_discount_info['商品销售金额']/dt_product_discount_info['商品购买用户数量']
dt_product_discount_info['转化率'] = dt_product_discount_info['商品购买用户数量']/dt_product_discount_info['UV数']
dt_product_discount_info['货值占比'] = dt_product_discount_info['货值']/dt_product_discount_info['货值'].sum()
dt_product_discount_info['销售占比'] = dt_product_discount_info['商品销售金额']/dt_product_discount_info['商品销售金额'].sum()
得到各个折扣区间的业务指标结果
如上图所示,除了转化率略低于其他折扣区间的商品,折扣在0.35_0.4的商品各项指标均优于其他商品,因此此处单独分析折扣在0.35_0.4的商品此次促销情况。
- 选取折扣在0.35_0.4的商品分析
#取出折扣区间在0.35_0.4的数据
discount_354 = dt_product_sales[dt_product_sales['折扣区间']=='0.35_0.4']
#售卖比 化率
discount_354['售卖比'] = discount_354['商品销售金额']/discount_354['货值']
discount_354['转化率'] = discount_354['商品购买用户数量']/discount_354['UV数']
得到折扣在0.35_0.4的商品各项指标结果
如上图所示,通过比较转化率和售卖比两个指标,可以给出以下优化方案:
- 折扣率大于37%的部分找出售卖比大于35%且转化率大于0.8%的商品(即G005)予以保留;
- 折扣率小于37%的部分找出售卖比大于25%且转化率大于0.5%的商品(即C005、G001)予以保留;
- 其余清仓处理。
5、流量分布
在一级入口中,首页的流量占比最高,我们可以将畅销款(上述分析中予以保留的商品)布局在首页档期流。在唯品会中,我们需要不断的增加商品来保证我们的SKU数。对于平销款(上述分析中予以清仓的商品),我们将其作为快抢和疯抢处理。