[关闭]
@zsh-o 2018-06-28T17:43:25.000000Z 字数 4004 阅读 1641

LDA变分EM 与 指数分布族

机器学习


LDA的变分EM解法中有提到用指数分布族归一化项的一阶导数就是期望值,这里整理一下

指数分布族

指数分布族符合如下形式:

多维情况下(参数和随机变量均为向量)可表示为

狄利克雷分布


对应上面的形式

指数分布族 性质

对指数族分布对积分


对上式取 的导数

得,

多维情况下形式相同

应用于上面的狄利克雷分布

LDA - 变分EM

回到LDA模型,里面有三个中间隐含变量,分别用三个辅助变量来估计
image.png-22.1kB

EM的E-step用以确定出分布的形式,这里也就是求出

首先来看看单纯的EM
从两个方向均可推出EM的公式,从对数似然出发和从KL散度出发
从对数似然出发,


在EM中需要找到函数的形式,使最小,也就是要使上式变为等号,而且当为凸函数时,,当且仅当为常数时为等号,故

由此得出在现有观测值下的的形式


遇到了一个问题:为什么EM不能直接求出来而是用变分EM,在E-step的时候用变分的方法求出三个分布的最优估计值,其实求出来的是具体的值


Reference

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注