感知机

感知机对应于输入空间中将实例划分为正负梁磊的分离超平面,属于判别模型

感知机

基础神经网络,其实就是多层感知机……

感知机模型

感知器要解决的问题是二分类(很简单),对于输入的实例,感知机要给出其正确的分类,而总的分类只有两个,正例和负例。

数学上来说,输入空间是X\subseteq \bf{R}^n,输出空间为Y=\{+1,-1\}。输入x\in X表示实例的特征向量,输出y\in Y表示实例的类别。这样的一个函数:
f(x)={ \rm sign} (wx+b)
这里的\rm sign函数是符号函数。

从解析的角度来说,感知机作为一个函数,以实例为自变量产生一个+1或者-1的结果,从而实现分类。

从几何上来理解,感知机就是输入空间中的一个超平面,之所以是“超”,因为输入空间常常是高维的。这个超平面把整个空间一分为二,从而对空间中的点(实例)进行分类。

由解析几何,超平面的方程是:
wx+b=0
这里,w是平面法向量,b是截距。

对于超平面上方的点,有:
wx+b>0
而对于超平面下方的点,有:
wx+b<0

感知机学习策略

我们需要一个损失函数来度量模型的好坏,或许可以使用误分类点的总数来作为损失函数,当损失函数值为零时,所有的点就都被正确分类了,但是,这个函数很显然不是关于w,b的可导函数,那么也就没办法用梯度下降函数来找到它的最小值了。

我们选择另外一种方式来定义损失函数。

我们选择从误分类点到超平面的总距离来度量。

在输入空间中,任何一点x_0到超平面的距离是:(话说这玩意不就是几何间隔函数间隔)
\frac{1}{||w||}|wx_0 +b|
||w||就是向量w的模(或者叫长度、L_2范数)。对于误分类的点(x_i,y_i)来说:
-y_i (wx_i +b)>0
所以我们可以去掉距离表达式中的绝对值:
-\frac{1}{||w||}y_i(wx_i+b)
作为一个方向向量,||w||可以直接丢掉,我们得到损失函数的表达式:
L(w,b)=-\sum_{x_i\in M}y_i(wx_i+b)
其中M为误分类点的集合。

L(w,b)是关于w,b的连续可导函数,于是就可以使用梯度下降了。

感知机学习算法

损失函数的梯度:
\nabla_wL(w,b)=-\sum_{x_i\in M}y_ix_i\\ \nabla_bL(w,b)=-\sum_{x_i\in M}y_i
那么,我们就得到一个可以直接写在代码中的赋值表达式,通过这个表达式来更新w,b的值,从而找到正确的分类超平面:
w\leftarrow w+\eta y_ix_i\\ b\leftarrow b+\eta y_i

\eta是学习率,用来调节梯度下降的步长。

最后,给出算法的描述:

1. 选取初始值w_0,b_0

2. 在训练集中选取数据(x_i,y_i)

3. 如果y_i(wx_i+b)\leq 0
w\leftarrow w+\eta y_ix_i\\ b\leftarrow b+\eta y_i

4. 转至第二步,循环直至训练集中没有误分类点

感知机学习算法的对偶形式

假定w_0=0,b_0=0
已知:
\begin{array}{l} w = \sum\limits_{i = 1}^N {{n_i}\eta {y_i}{x_i}} = \sum\limits_{i = 1}^N {{\alpha _i}} {y_i}{x_i}\\ b = \sum\limits_{i = 1}^N {{n_i}\eta {y_i}} = \sum\limits_{i = 1}^N {{\alpha _i}} {y_i} \end{array}
\alpha_i=n_i\etan_i代表对第i个样本的学习次数,感知机对偶形式的完整形式即为(6)式:
f(x) = sign(\sum\limits_{j = 1}^N {{\alpha _j}} {y_j}{x_j} \cdot x + b)

1. 选取初始值\alpha=0,b=0

2. 在训练集中选取数据(x_i,y_i)

3. 如果 y_i(\sum\limits_{j = 1}^N {{\alpha _j}} {y_j}{x_j} \cdot x_i + b)\le0 x_i + b)\le0
\begin{array}{1} \alpha_i\leftarrow \alpha_i+\eta\\ b_i\leftarrow b_i+\eta y_i \end{array}

4. 转至第二步,循环直至训练集中没有误分类点

如果留意的话,会发现\alpha_i只会增加。别担心,大家都在一起增长。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 【概述】 1、感知机模型特征:感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。 2、感知机策...
    sealaes阅读 3,097评论 2 3
  • 感知机 概述 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机学...
    _Joe阅读 5,143评论 2 7
  • 感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值...
    多了去的YangXuLei阅读 1,338评论 0 3
  • 最近在工作闲暇中也在追赶时代的潮流,于是就打起了机器学习的注意,通过网上查阅资料还有询问相关的从业人员,发现机器学...
    哇塞田阅读 3,229评论 8 25
  • 一、在工作中学习 萧秋水说过最重要的学习方式就是在工作中学习,虽然领导交办的工作不是我喜欢的,但我还是要努力去做,...
    刘金玉阅读 431评论 0 2