@BruceWang
2018-04-05T10:58:42.000000Z
字数 2832
阅读 1370
数学
p(x;theta),p(x|theta),p(y|x;theta),p(y|x;theta) 分别是什么意思?
;后表示参数
,表示联合概率
| 条件概率
p(x,theta):联合概率 p(d = 1, f = 0) = n(d=1) / n(f=0)
p(x;theta) : 一般可以看作是p(x),待估参数(是固定的,不是随机的,只是当前未知)
p(x|theta) : 条件概率,是随机变量,theta条件下(成立)x的概率,如果不表示条件概率时是和p(x;theta)等价的
p(y|x;theta): 表示基于 下的 分布。
p(y|x,theta):和p(y|x;theta)不一样,(因为在这里theta不是随机变量?)
样本空间:所有可能情况
概率是随机事件发生的可能性的大小
全概率公式(B1、B2、...相互独立):
条件概率:P(A|B) = P(AB)/P(B) A在B条件下发生的概率----> P(AB)= P(A|B)P(B)
贝叶斯公式:
任一随机变量都有一个分布函数(无论是离散还是连续)
X | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
P | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
期望
期望就是:可以理解为物理中的重心,
正态分布期望:
注:期望和均值是不一样的,如果p(x)都相同,期望等于均值,期望可以理解为 加权平均
期望反映X值在E(X)附近波动、方差反映大小(程度)、
标准差
标准差也称均方差、,它表示各数据偏离平均数的距离(离均差)的平均数
注意期望存在、方差不一定存在的喔~!
方差与我们要处理的数据的量纲是不一致的
均方误差
均方误差是各数据偏离真实值的距离平方和的平均数
均方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系
举个例子:我们要测量房间里的温度,很遗憾我们的温度计精度不高,所以就需要测量5次,得到一组数据[x1,x2,x3,x4,x5],假设温度的真实值是x
数据与真实值的误差 那么均方误差
协方差
协方差矩阵
n 维正态随机变量的概率密度
均值
方差
标准差
二项分布
只有两种可能,重复n次伯努利实验,X~b(n,p)
大数定律
表达了随机现象最根本的性质:平均结果的稳定性
中心极限定理
均值为 方差为的独立同分布的随机变量 的算数平均 ,当n足够大时,这是数理统计的基础。
X是离散值,其分布律 的形式已知,是来自X的样本,那么 的联合分布律为
那么发生的概率是:似然函数
则
那么这个就是最大似然估计值