@galaxy-0
2019-07-22T19:37:44.000000Z
字数 6203
阅读 927
learning
假设我们有若干个高斯分布模型,每个模型会以一定的概率被选择,然后根据被选择的模型的概率分布产生一个结果。我们希望可以在只有输出序列的情况下,对模型的参数进行估计。
我们把观察序列记为,将模型总数记为,第个高斯分布模型会以的概率被选择,
根据上面的定义,我们可以得到完全数据的似然函数(联合概率):
接着,我们可以写出对数似然函数:
根据EM算法的框架,我们先来求解Q函数
我们可以直接对对数似然函数求期望得到Q函数(第一行),也可以使用第二行的表达式,利用概率分布来直接求得Q函数。下面两种方法都会列出。
我们直接求解对数似然函数的期望,注意此时我们的随机变量是
在这个式子中,是直接根据当前参数计算的,是第个模型待更新的参数。我们来计算,记为:
我们由
代入上面的概率分布定义得到
我们分别求Q函数对参数的偏导并使偏导数为0可以得到新的参数的表达式。
对于,求导求极值过程无特别难点,结果如下:
对于参数,我们需要利用额外的约束来求解。
构造拉格朗日函数
至此,高斯混合模型推导完毕。
输入:观测数据,高斯混合模型
输出:高斯混合模型参数
(1)初始化参数开始迭代
(2)E步:根据当前模型参数计算分模型对观测变量的响应度:
(3) M步:更新参数
(4) 重复(2)(3)直到收敛