支持度:商品组合A、B出现的频数,记为S。
支持度很高的时候,代表商品A和B经常同时被购买,但不能说明A对B的影响。反例:所有订单都买了A,那么A与其他所有产品的支持度都很高。
置信度:购买商品A后,购买商品B的概率,即条件概率,记为P。
置信度很高的时候,代表B经常在A被买之后接着被购买。但没有考虑B本身的频率,也不能说明A对B的影响。反例:只有一个订单买了B,那么所有前序商品对B的置信度都很高。
提升度:购买商品A后购买B的概率与所有购买B的概率的比例,即P(A|B)/S(B),记为L。可以说明购买A之后,对购买商品B的提升程度。
例子:现有眼霜A与面膜B,买眼霜的人比买面膜的人多,S(眼霜)=10%,S(面膜)=5%,同时买眼霜和面膜的人很少,S(眼霜+面膜)=1%。由此可以算出:
P(眼霜|面膜) = S(眼霜+面膜) ÷ S(眼霜) = 10%
即10%的人会买眼霜,这10%中只有10%的人会继续买面膜。这个数字并不高,看起来似乎不能说明什么。但是,所有人中只有5%的人会买面膜,而买了眼霜的人群,就有10%的人会买面膜了!即:
L(眼霜→面膜) = P(眼霜|面膜) ÷ S(面膜) = 2
也就是说,如果想要促使人们买面膜,让他们先购买眼霜再购买面膜比直接让他们购买面膜要容易一倍。