2019-07-24

Mechanical learning-Lecture4

Lecturer: Liming

1 统计机器学习

2 深度学习->连接主义(暗箱,易学,但解释)调包侠

拟合(连续)eg,横坐标:面积,纵坐标:房价,找到一条回归函数
分类(离散)eg,垃圾邮件分类,垃圾分类
Hypothesis,h(x)=sign(W”T”+b) = {1, W”T”+b>0
{0, W”T”+b<0
注:T是转置

感知机,SVM,逻辑回归的本质一样,只是最优分界面不一样。
优的标准:不好的尽量小

1感知机

分错到分界面的加和距离min,对0xx0误解
W”T转置”+b=0的一条线,法向量是W(->),

点到直线的距离=向量A·向量B/|向量B|=|向量A||向量B|cos<向量A , 向量B>/|向量B|=|向量A| cos<向量A , 向量B>
所以,
O是线外一点,P是线上的某点,点O到这条线的距离=<向量PO>乘<法向量W>/||法向量W||=(x01-x11, x02-y12)(W1,W2)/( W1,W2)

| W”T”+b|/ ||向量W||
Min求和{ | W”T”+b|/ ||法向量W|| }
优化目标化简,min-求和 { | W”T”+b| y}, y∈(-1,1)
梯度是导数,gradient decent梯度下降
求导梯度△W =偏导数J/偏导数W = 求和xy

普通的梯度下降再求解时是有问题的:只获得局部最优解,找到的是半山谷

解决方法:批量梯度下降,当目标函数为凸函数时,BGD一定能够得到全局最优解。
随机梯度下降。步子大一点,增加解的不确定性和震荡性,所以可能跳出局部最优解。
相关数学背景,参考:https://www.cnblogs.com/lliuye/p/9451903.html

感知机只能做线性的,不能求解析解(只能通过迭代完成)。

2 SVM支持向量机

斜率是w算的,取离这条线最近的左右2点,来使margin尽可能大,在两个最近点的中间
几何间隔r=max(r(i))=max{ | W”T”+b|/ ||法向量W|| }
函数间隔r^(i)=| W”T”+b|

几何间隔=Max{函数间隔/ ||法向量W||}
函数间隔=||W||几何间隔

使||W||>1,r(i))=(W”T”+b)y,即(W”T”+b)y >1, 即max=1/|w|,即min1/2||W||

多分类,是多个二分类。
多个不等约束

扩展--拉格朗日:

假设模型:求原点到y=1/x 曲线的距离
等高线理论,f(x,y)=x2+y2
根据等高线理论,相切这一点(○和曲线),方向一致。
▽梯度
▽f(x,y)= λ▽g(x,y),这样就把方向一致的信息描述进去了。

偏导数的值=0
满足s.t(subject to)g(x,y)=0
优化m,约束n,转变成无约束,但是需要优化的变量是m+n个,没有约束,就可以求导求解析解。

So,用拉格朗日求解min1/2||W||

对偶问题,KKT问题

逻辑回归

原始的阶跃函数不连续,不可导,所以转换成概率的拟合,使用sigmoid function分选,早期机器学习activation function
P(y=1|x)和P(y=0|x)可以整合在一起。
P(y|x)=h(x)^y*(1- h(x))^(1-y)
累乘
机器学习的人喜欢min,所以加了一个负号
根据链式求导法则,求导,化简特别简单的▽W=求和x(i)(h(x)-y(i))

找到好的模型,最具有样本代表性,联合概率分布尽可能大。累乘形式的优化目标,对数化,累乘变累加,链式求导法则求导,好看的结果,梯度下降,得到最优解。

逻辑回归是后验概率。

H(x)拟合的是判别为1的概率,如果大于0.5,说明可以判别的1类。这是分的开,分的好不好取决于你相信的阈值,0.2-0.8。用验证集去验证。
概率的cutoff,是根据样本的两种已知情况的比例。

数据处理,理解数据,特征向量找的好,决定了结果的上限。方法决定了结果的下限。

AUC分类问题评估。0.7以上入门,0.8可以接受,0.9好

补充

Q:SVM 离群点处理问题?
A:https://www.jianshu.com/p/81eee8b1d374

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容