机器学习笔记3

李宏毅机器学习任务四】

负责人:王佳旭

课程设计人:王佳旭

#任务时间#

请于5月25日22:00前完成,逾期尚未打卡的会被清退

学习视频内容:

观看观看李宏毅课程内容:p8

视频连接:

https://www.bilibili.com/video/av35932863/?p=8

学习Datawhale整理笔记

https://datawhalechina.github.io/Leeml-Book/#/chapter8/chapter8(目前已100%复现)

https://datawhalechina.github.io/Leeml-Book/#/chapter8/chapter8

说明:

笔记内容将会随着学习任务进行放出

学习打卡内容:

从基础概率推导贝叶斯公式,朴素贝叶斯公式(1)

学习先验概率(2)

学习后验概率(3)

学习LR和linear regreeesion之间的区别(4)

推导sigmoid function公式(5)

要求:

我将将会对打卡链接进行查看,要求打卡学习任务不得少于3个(上述学习内容序号)

如果少于3个学习任务将会被清退

可以晚点提交并说明情况,如果出现假打卡情况,立即清退。



(1)从基础概率推导贝叶斯公式,朴素贝叶斯公式

给定一个场景,假设两个盒子,各装了5个球,还得知随机抽一个球,抽到的是盒子1的球的概率是P(B1),是盒子2的球的概率是P(B2)。从盒子中蓝色球和绿色球的分配可以得到:

在盒子1中随机抽一个球,是蓝色的概率为P(blue|B1),绿的的概率为P(green|B1)

在盒子2中随机抽一个球,是蓝色的概率为P(blue|B2),绿的的概率为P(green|B2)

现在需要求解:如果从两个盒子中随机抽一个球,结果是从盒子1中抽到蓝色球的概率是多少。


问题可分两步解决:1)求抽到蓝色球的概率;2)这个蓝色球是从盒子1中抽到的概率。

1)求抽到蓝色球的概率。

从两个盒子中随机抽一个球,抽到蓝色球的可能性有两个:

a.从盒子1中抽到蓝色的球,其概率为:

P(B1)*P(blue|B1)

b.从盒子2中抽到蓝色的球.,其概率为:

P(B2)*P(blue|B2)

因而,从两个盒子中随机抽取1个球,抽到蓝色球的概率为:

P(blue)=P(B1)*P(blue|B1)+P(B2)*P(blue|B2)

2)这个蓝色球是从盒子1中抽到的概率:

P(B1|blue)=\frac{P(B1)*P(blue|B1)}{P(blue)}                 =\frac{P(B1)*P(blue|B1)}{P(B1)*P(blue|B1)+P(B2)*P(blue|B2}

将上面的例子一般化,即球的颜色即为样本的特征x,盒子1和盒子2为样本的分类C1和C2,可以将上式改写为:

P(C1|x)=\frac{P(C1)*P(x|C1)}{P(x)}

上式即为朴素贝叶斯公式。

(2)学习先验概率

先验概率即根据训练样本获得一个样本分布的概率模型,实现当输入一个样本x时,可以计算出P(x).

我们想得到样本分布的概率分布假定为高斯分布,这里需要理解高斯分布(Gaussian Distribution)。

关于高斯分布(正态分布)需要知道多为高斯分布的公式,以及里面涉及到的μ(均值)和∑(协方差),参考https://www.cnblogs.com/jermmyhsu/p/8195588.html,这篇博客把协方差讲的很清楚,我边看博客边记笔记,把多维协方差和多维高斯分布的求解方式给理解。


在李宏毅机器学习课程中,老师提到,给出一个样本,满足这个样本的高斯分布有很多,原因是高斯分布是在整个空间范围内,所以需要用最大似然估计方法,来求得一组μ和∑的高斯分布,使得样本分布的可能性最大。

其中似然函数为:L(μ,∑)=f(x_{1} )*f(x_{2} )*...*f(x_{n} )

通过对μ和∑求偏微分并等于0,求得L的最大似然估计对应的μ和∑为:

μ^* =\frac{1}{n} \sum\nolimits_{i=1}^n x^i       ∑^*=\frac{1}{n} \sum\nolimits_{i=1}^n(x^i -μ^* ) (x^i -μ^* )^T

而通常来说,不会给每个高斯分布都计算出一套不同的最大似然估计,协方差矩阵是和输入feature大小的平方成正比,所以当feature很大的时候,协方差矩阵是可以增长很快的。此时考虑到model参数过多,容易Overfitting,为了有效减少参数,给描述这两个类别的高斯分布相同的协方差矩阵。

此时,似然函数为:L(μ1,μ2,∑)=L(μ1,∑)*L(μ2,∑)

同样,求得最大似然估计对应的μ1,μ2和∑为:

μ1和μ2的求解公式一样,求各自的平均值;

∑不一样,∑^*=P(C1)*∑^1 +P(C2)*∑^2

(3)学习后验概率

情景一:已知从两个箱子里面抽了一个蓝色的球,问这个蓝色的球是从盒子1拿出来的概率是多少。

分析过程是:根据以往的经验(样本数据),求一个使得样本发生概率最大的高斯分布函数。即先验概率,然后再利用贝叶斯公式求得蓝色球是从盒子1拿出来的概率。

情景二:根据天上有乌云(原因或者证据/观察数据),下雨(结果)的概率。

后验概率即条件概率,即在当前特征情况下计算结果发生的概率。

(4) 学习Logistic Regression和linear regression之间的区别

a.logistic regression通过sigmoid 方程,所以输出是0~1,而linear regression的输出是R;

b.Logistic regression的目标是利用最大似然法,求w和b,而linear regression是通过最小二乘法求w和b;

c.liner regression期望拟合训练数据,通过feature的线性加权来预测结果; logistic regression是在训练一个最大似然分类器。

(5)推导sigmoid function公式


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,723评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,080评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,604评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,440评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,431评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,499评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,893评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,541评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,751评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,547评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,619评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,320评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,890评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,896评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,137评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,796评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,335评论 2 342

推荐阅读更多精彩内容