关于(概率图模型)PGM在wiki上的定义:
在概率论、统计学及机器学习中,概率图模型是用图论方法以表现数个独立随机变量之关系的一种建模法。其图中的任一节点为随机变量,若两节点间无边相接则意味此二变量彼此条件独立。
两种常见的概率图模型是具有向性边的图及具无向性边的图。 若为具有向性边的图,该图显示了所有随机变量的合成概率函数的因子分区。
概率图模型被广泛地应用于概率论,数理统计等学科,特别是贝叶斯概率与机器学习中。
所以当我看到这个概念时,我内心很小激动感觉看到自己适合的路,苦苦的图论有了用武之地又是ML重要的内容,所有的知识开始会与一点,而且仔细了解后这是个很有潜力和厉害的方向。
关于pgm理论的综述个人感觉这篇概率图模型(PGM)综述很好,是MIT林达华博士写的,高屋建瓴总结了PGM的主要分之和发展趋势。
概率图模型大致可以分为两种,directed graphical model(又称贝叶斯网络)和undirected graphical model(又称马尔可夫随机场)。贝叶斯网络由Judea Pearl 教授发明于上世界80年代,这项工作获得了2011年图灵奖。马尔可夫随机场最早被物理学家用于对原子进行建模,其中的代表作Ising model获得过诺贝尔奖。图灵奖+诺贝尔奖,PGM的重要性可见一斑。另外,PGM是将人工智能(AI)的研究热点从传统AI(如逻辑、推理、知识表示)转向机器学习的重要工作(其他起到这一作用的工作有支持向量机、决策树、boosting等)。概率图模型在实际中(包括工业界)的应用非常广泛与成功。这里举几个例子。隐马尔可夫模型(HMM)是语音识别的支柱模型,高斯混合模型(GMM)及其变种K-means是数据聚类的最基本模型,条件随机场(CRF)广泛应用于自然语言处理(如词性标注,命名实体识别),Ising模型获得过诺贝尔奖,话题模型在工业界大量使用(如腾讯的推荐系统)
大致我也就是了解到这里,推荐一下我搜集和对比后的资料:
CMU Eric Xing教授每年开的10708 PGM课程
Koller公开课(时间比较长)
另外书籍推荐 《概率图模型:原理与技术》
就这些了,贪多不烂。