频繁模式挖掘(关联规则挖掘)-Apriori方法

一句话总结:通过算概率,层层挖掘出的商品(元素)组合。

内容

  1. 关联规则基础
  2. Apriori方法

1. 关联规则基础

  1. 需要的数学知识
    概率:简单概率,联合概率,条件概率
    集合:并集、排列组合

  2. 什么是关联规则

关联规则是发现交易数据库中不同商品(项)之间的联系

  • 这些规则找出顾客购买行为的模式。 如购买了某一商品对购买其他商品的影响
  • 发现这样的规则可以应用于商品货架设计、存货。 安排以及根据购买模式对用户进行分类。
  1. 基本概念
  • 可信度和最小可信度
    购买x1,x2,…, xn 的情况下购买Y的可能性, 条件概率
  • 支持度和最小支持度
    同时购买x1,x2,…,xn 和Y的可能性
  • 频繁项目集
    满足最小支持度的项目集
  1. 支持度和可信度计算
  • 支持度:(并集的概率)
    support (A --> B ) = P(A∪B)
  • 可信度:(条件概率)
    confidence (A --> B ) = P(B|A)
  1. 计算支持度和可行度的一个例子

例如第一行的A-->D,
支持度:有五个购物篮,分母是5;购物篮中含有A和D的有两个,所以分子是2。支持度是2/5
条件概率:在有D的情况下,A出现的概率是多少。D出现的次数3是分母;此情况下A出现次数是2为分子。计算得到可信度是2/3

sample-1.png
  1. 因果关系
    定因和果,不好确定。
    一个例子: 如果商店降低尿布的价格而升高啤酒的价格,则会吸引尿布购买者,而这些购买尿布的人同时很可能会购买啤酒,这样商店在尿布上遭受的损失就会从啤酒中得以弥补,这是因为“尿布是因,啤酒是果”。相反,如果降低啤酒的价格而升高尿布的价格,买啤酒的人多了但买尿布的人并不会增多,商店就赔本了。

  2. 频繁集合公理

  • 公理:如果一个项目集S是频繁的(项目集S的出现频度大于最小支持度s),那么S的任意子集也是频繁的。
  • 怎么用:一般是反过来,如果某个集合A的所有(任意)子集都是频繁子集,那么A也是频繁集。
  1. 如何挖掘关联规则
    通常被分解为两个子问题,第二个问题比较简单,关键是解决第一个问题。
    (1) 根据用户输入的最小支持度,寻找频繁项目集
    (2) 根据用户输入的最小可信度,产生关联规则

2. Apriori算法

  1. 步骤简述:
    a. 寻找频繁项目集
    分层次计算每个子集的出现频度,筛选出符合条件的子集。然后根据频繁集合公理,筛选出下一层的频繁集合。
    b. 产生关联规则

  2. 寻找频繁项目集的步骤
    a. down-top,由底向上分层。宽度优先。
    b. 第一层:包含全部元素,并且集合模式为单元素子集。
    b. 第二层:由第一层的元素配列组合为新的集合,筛选出符合规则的集合。
    c. 第三层:根据公理,寻找所有子集均是频繁集合的新并集。
    d. 第四/n层:同上

Astep1.png
  1. 一个例子,设出现次数大于2的集合为频繁集合。
sample

参考资料:

  1. 中国大学MOOC,人大 数据库系统概论(新技术篇) 第六讲,频繁模式挖掘

2018.4.27

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容