[关闭]
@w460461339 2018-08-25T18:57:43.000000Z 字数 4212 阅读 1952

西瓜书——3.3 LDA(线性判别分析)

MachineLearning


0、参考

LDA:
西瓜书3.3
http://www.cnblogs.com/pinard/p/6244265.html#!comments
https://blog.csdn.net/liuweiyuxiang/article/details/78874106
http://www.cnblogs.com/engineerLF/p/5393119.html

拉格朗日乘子法:
https://blog.csdn.net/lijil168/article/details/69395023

协方差矩阵:
http://pinkyjie.com/2010/08/31/covariance/

正定矩阵:
https://baike.baidu.com/item/%E6%AD%A3%E5%AE%9A%E7%9F%A9%E9%98%B5

1、瑞利商与广义瑞利商

化简,得到:

即又得到了我们的瑞利商的形式,同样,我们取表示矩阵的最大最小特征值,来表示我们的R(x)的取值范围。

2、二分类LDA问题

2.1 符号含义

x : 表示训练样本,使用列向量表示,假设有n维
:表示第i类中的第j个样本
:表示有C类样本
:表示第i类训练样本的均值,也是列向量 (i=1,2,…,C)
:表示第i类训练样本的数目
M:表示训练样本的总数目
μ:是所有样本的均值向量,也是列向量
:表示第i类样本集合
:表示类内散度矩阵,w是within的简写
:表示类间散度矩阵,b是between的简写
:这里指超平面参数,即也是一个列向量或由列向量构成的矩阵。

2.2 推导过程

image_1cllg7c0l101v1nfi1sth17sa1km419.png-51.4kB

类间距离

类内距离

调优式

3、多类别LDA

当只有两个类别的时候,我们可以将其投影在一条线上,当我们有K个类别的时候呢?

虽然不是不可以投影在一条直线上,但是有没有更好的选择,比如投影在其他平面上?

3.1 符号定义

x : 表示训练样本,使用列向量表示,假设有n维
:表示第i类中的第j个样本
:表示第类样本,假设
:表示第i类训练样本的均值,也是列向量 (i=1,2,…,C)
:表示第i类训练样本的数目
M:表示训练样本的总数目
μ:是所有样本的均值向量,也是列向量
:表示第i类样本集合
:表示类内散度矩阵,w是within的简写
:表示类间散度矩阵,b是between的简写
:这里指超平面参数,即也是一个列向量或由列向量构成的矩阵。【这里的w大概率是一个矩阵了,因为除了线以外,其他超平面都需要一组基来描述,假设基是d维的】

3.2 推导
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注