[关闭]
@dongxi 2017-07-29T18:46:48.000000Z 字数 1570 阅读 1831

马氏距离

机器学习 统计学


前言

       马氏距离是一种表示数据的协方差距离的方式,它是一种有效的计算两个位置样本及的相似度的方法。与欧氏距离不同的是它考虑到了各种特性之间的联系并且是尺度无关的,即独立于测量尺度。

马氏距离

       对于一个均值为,协方差为的多变量向量,其马氏距离为:


       马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为的随机变量的差议程度:

       如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离;如果协方差矩阵为对角矩阵,其也可称为正规化的欧式距离:

其中的标准差。

几何解释

       上面的公式之类的还是比较容易理解的,但是这其中的原理到底是什么?首先,我们先对协方差矩阵进行奇异值分解:


       那么,我们有:

       根据马氏距离的定义有:

       在这里我们定义一个矩阵,其中,由于之前的定义我们可以知道是一个旋转矩阵,所以上述过程只改变了向量的方向并未对大小产生影响。
       我们将新矩阵的记为,那么很显然我们会有:

所以,我们可以求出矩阵的协方差矩阵:

       对于我们在之前推导的式子有:

       我们再来简述一下上述的过程,在马氏距离的计算过程中,首先通过旋转矩阵进行了旋转,再根据方差进行放缩,最后就是简单的欧式距离的计算就可以得到我们需要的马氏距离了,基本的过程如下图所示,不过需要注意的是除下图一外其他的图片都已经发生了坐标的变换。
image_1bm6uoqaefdc1c2d1o0c10moo9.png-48.7kB
image_1bm6up25h1r91el61m4g1h3fgtkm.png-46.6kB

结语

       本篇文章基本上就先聊到这里,关于协方差矩阵是奇异矩阵事情还没有遇到过,等遇到了可能会在本篇文章补充一下相关内容,基本就是这样子。

参考

马氏距离
旋转矩阵
马氏距离及其几何解释
马氏距离+协方差公式+无偏估计

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注