[关闭]
@BruceWang 2018-04-05T10:58:42.000000Z 字数 2832 阅读 1370

统计学

数学


p(x;theta),p(x|theta),p(y|x;theta),p(y|x;theta) 分别是什么意思?

;后表示参数
,表示联合概率
| 条件概率

p(x,theta):联合概率 p(d = 1, f = 0) = n(d=1) / n(f=0)

p(x;theta) : 一般可以看作是p(x),待估参数是固定的不是随机的,只是当前未知)

p(x|theta) : 条件概率,是随机变量,theta条件下(成立)x的概率,如果不表示条件概率时是和p(x;theta)等价的

p(y|x;theta): 表示基于 下的 分布。
p(y|x,theta):和p(y|x;theta)不一样,(因为在这里theta不是随机变量?

1. 什么是概率

样本空间:所有可能情况

概率是随机事件发生的可能性的大小

全概率公式(B1、B2、...相互独立)

条件概率P(A|B) = P(AB)/P(B) A在B条件下发生的概率----> P(AB)= P(A|B)P(B)

贝叶斯公式

2.离散型随机变量和抽样分布的:期望(清楚),方差、标准差

2.1 离散型随机变量

任一随机变量都有一个分布函数(无论是离散还是连续)

概率分布举例

X 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6


注:连续函数就求积分 p(x) = f(x) 是x的概率密度函数

正态分布期望:

注:期望和均值是不一样的,如果p(x)都相同,期望等于均值,期望可以理解为 加权平均

期望反映X值在E(X)附近波动、方差反映大小(程度)、


举个例子:我们要测量房间里的温度,很遗憾我们的温度计精度不高,所以就需要测量5次,得到一组数据[x1,x2,x3,x4,x5],假设温度的真实值是x
数据与真实值的误差 那么均方误差

n 维正态随机变量的概率密度


就是计算各维度之间的相关性(前提是已经经过白化),由于样本特征均值白化后为0,各特征方差一样,计算得到的协方差矩阵,其中元素的值越大,则说明对应下标的特征之间相关性越高(PCA典型应用)

2.2 对于抽样分布:

只有两种可能,重复n次伯努利实验,X~b(n,p)


4. 中心极限定理与大数定律

5. 最大似然估计

X是离散值,其分布律 的形式已知,是来自X的样本,那么 的联合分布律为

那么发生的概率是:似然函数

那么这个就是最大似然估计值

6. 估计量的评选标准

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注