经典机器学习系列之【线性判别分析LDA】

线性判别分析，英文名称Linear Discriminant Analysis(LDA)是一种经典的线性学习方法。本文针对二分类问题，从直观理解，对其数学建模，之后模型求解，再拓展到多分类问题。

大体思想

给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离；在对新样本进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定新样本的类别。

LDA二维示意图

数学原理

道理是这么个道理，我们现在需要在数学上对其进行分析。我们接下来先建立求解上述问题的数学模型，之后再求解。

数学模型建立

那我们怎么从数学上去实现上述的思想呢？这里我们以二分类为例，对其展开叙述：

给定数据集 $D=\{(x_{i},y_{i})\}_{i=1}^{m}$ ， $y_{i} \in \{0,1\}$ ，令 $X_{i}$ 、 $\mu_{i}$ 、 $\sum_{i}$ 分别表示第 $i \in \{0,1\}$ 类示例的集合、均值向量、协方差矩阵。

如果将样本投影到直线 $w$ 上，那么样本所对应的均值和方差也将做一个线性变换，也即是投影之后的均值和方差。依据投影的数学关系，我们可以知道，原始样本的均值在 $w$ 上的投影为 $w^{T}\mu_{i}$ ；原始样本的协方差在 $w$ 上的投影为 $w^{T}\sum_{i}w$ ；由于直线在一维空间上，所以 $w^{T}\mu_{0}$ 、 $w^{T}\mu_{1}$ 、 $w^{T}\sum_{0}w$ 、 $w^{T}\sum_{1}w$ 均为实数。

让同类样本的投影点尽可能接近这句话在数学上就可以表示为，让同类样本的协方差尽可能地小。即 $w^{T}\sum_{0}w$ + $w^{T}\sum_{1}w$ 尽可能地小；
让异类样本投影点尽可能地远离，所表示的意思就是，让两类样本的均值之间的距离尽可能地大。即 $||w^{T}\mu_{0}-w^{T}\mu_{1}||_{2}^{2}$ 尽可能大。

综合以上两点，组合一个最大化的目标函数 $J$ ：

$J=\frac{||w^{T}\mu_{0}-w^{T}\mu_{1}||_{2}^{2}}{w^{T}\sum_{0}w+w^{T}\sum_{1}w} \\ =\frac{w^{T}(\mu_{0}-\mu_{1})(\mu_{0}-\mu_{1})^{T}w}{w^{T}(\sum_{0}+\sum_{1})w}$

这个式子看起来符号有点多，我们将其化简一下，定义两个量：类内散度矩阵和类间散度矩阵：

类内散度矩阵(within-class scatter matrix)：

定义类内散度矩阵 $S_{w}=\sum_{0}+\sum_{1}$ 将其展开可得：

$=\sum_{x\in X_{0}}(x-\mu_{0})(x-\mu_{0})^{T}+\sum_{x\in X_{1}}(x-\mu_{1})(x-\mu_{1})^{T}$

类间散度矩阵(between-class scatter matrix)：

定义类间散度矩阵 $S_{b}=(\mu_{0}-\mu_{1})(\mu_{0}-\mu_{1})^{T}$ 。

此时，最大化的目标函数 $J$ 可重写为：

$J = \frac{w^{T}S_{b}w}{w^{T}S_{w}w}$

把上式称为 $S_{b}$ 与 $S_{w}$ 的广义瑞利商(generalized rayleigh quotient)。

数学模型求解

现在的问题就变成了，我们怎么来求这个投影方向 $w$ ，使得目标函数最大。

优化目标函数 $J$ 的分子和分母都是关于 $w$ 的二次项，因此求解最大化 $J$ 与 $w$ 的长度无关，只与其方向有关。那么我们将分母约束为1，将原问题转换为带有约束的最优化问题，再利用拉格朗日乘子法对其求解即可，原问题等价为：

$min_{w} \ \ -w^{T}S_{b}w$

$s.t. \ \ w^{T}S_{w}w =1$

由拉格朗日乘子法可知，上式等价于：

$S_{b}w=\lambda S_{w}w$

其中 $\lambda$ 是拉格朗日乘子。由于 $(\mu_{0}-\mu_{1})^{T}w$ 是标量，所以 $S_{b}w$ 的方向恒为 $\mu_{0}-\mu_{1}$ ，不妨令：

$S_{b}w=\lambda(\mu_{0}-\mu_{1})$

这里之所以可以令参数为 $\lambda$ ，是因为整个问题我们都在求解方向，且 $S_{b}w$ 的方向恒为 $\mu_{0}-\mu_{1}$ ，所以长度设置怎么好算怎么来。将 $S_{b}w=\lambda(\mu_{0}-\mu_{1})$ 带入 $S_{b}w=\lambda S_{w}w$ 可得：

$w=S_{w}^{-1}(\mu_{0}-\mu_{1})$

到这里投影方向 $w$ 的求解就完事了。但上述解涉及到求逆矩阵，考虑数值解的稳定性，实践过程中通常将 $S_{w}$ 进行奇异值分解。 $S_{w}=U\sum V$ ，这里 $\sum$ 是一个实对角矩阵，其对角线上的元素是 $S_{w}$ 的奇异值，再求解，得出 $S_{w}^{-1}=V \sum^{-1} U^{-1}$ 。

LDA推广到多分类

将 $LDA$ 推广到多分类问题中，假定存在 $N$ 类，且第 $i$ 类示例数为 $m_{i}$ 。定义“全局散度矩阵” $S_{t}$ ：

$S_{t}=S_{b}+S_{w} \\ = \sum_{i=1}^{m}(x_{i}-\mu)(x_{i}-\mu)^{T}$

$\mu$ 是所有样本的均值向量。

将类内散度矩阵 $S_{w}$ 重定义为每个类别的散度矩阵之和：

$S_{w}=\sum_{i=1}^{N}S_{w_{i}}$

其中：

$S_{w_{i}}=\sum_{x \in X_{i}}(x-\mu_{i})(x-\mu_{i})^{T}$

由此可求解出 $S_{b}$ ：

$S_{b}=S_{t}-S_{w} \\ = \sum_{i=1}^{N}m_{i}(\mu_{i}-\mu)(\mu_{i}-\mu)$

用 $S_{b}$ ， $S_{w}$ ， $S_{t}$ 三者中的任意两者都能够构造优化目标。常见的一种构造如下所示：

$max_{W}\frac{tr(W^{T}S_{b}W)}{tr(W^{T}S_{w}W)}$

其中 $W \in R^{d \times (N-1)}$ ， $tr(·)$ 表示矩阵的迹(trace)。上式通过广义特征值问题求解：

$S_{b}W=\lambda S_{w}W$

$W$ 的闭式解为 $S_{w}^{-1}S_{b}$ 的 $d^{'}$ 个最大广义特征值所对应的特征向量组成的矩阵， $d^{'} \leq N-1$ 。

若将 $W$ 视为一个投影矩阵，则多分类 $LDA$ 将样本投影到 $d^{'}$ 维空间， $d^{'}$ 通常小于原有属性数 $d$ 。于是，可通过这个投影来减少样本点的维数，且投影过程中使用了类别信息，因此 $LDA$ 也常被视为经典的监督降维技术。

与PCA降维不同LDA降维会保留类的区分信息。在LDA二分类中，第一类的均值与第二类的均值如果重叠在一起，将会找不到投影方向。PCA与LDA并没有某一种比另外一种更好的这种说法。

本文主要参考书目，周志华机器学习。以前都没发现这书居然写地这么好。emmmm。

我的微信公众号名称：深度学习与先进智能决策
微信公众号ID：MultiAgent1024
公众号介绍：主要研究强化学习、计算机视觉、深度学习、机器学习等相关内容，分享学习过程中的学习笔记和心得！期待您的关注，欢迎一起学习交流进步！

最后编辑于：2020.02.04 15:21:56

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,980评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,178评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,868评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,498评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,492评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,521评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,910评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,569评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,793评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,559评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,639评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,342评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,931评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,904评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,144评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,833评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,350评论 2赞 342