@lyc102
2018-10-16T11:20:49.000000Z
字数 2581
阅读 5336
统计
设是取自总体的样本, 其分布函数为, 是未知的. 为了估计分布函数, 使用如下统计量
如果用表示集合的特征函数, 即
将样本理解成样本值时, 是一个分布函数.
设随机变量, 则服从离散分布, 在内取值, 如果各 互不相同则服从上的离散均匀分布, . 如果中有相同的观测值则其相应的取值概率是 乘以重复次数.
对样本从小到大排序得到, 称为样本的次序统计量. 如果, 易见
将样本看成随机变量时, 是样本统计量.
是独立同分布的随机变量, 其共同分布为两点分布. 由Glivenko-Cantelli定理可知, 当时,
如果随机变量, 显然的期望
直方图 (histogram) 是估计分布密度非常直观简单的方法.
直方图作法
确定分组数, 用划分点: 将区间 分割成个小区间;
计算样本值落入第个小区间的个数和频率;
以为底,为高画长方形, 这个长方形的顶部为密度估计值.
由直方图的作法可知其对应的密度函数为
在直方图作法中, 估计处的密度时其所在区间的所有都估计成同一个值, 这些分点是预先取好的,与要估计的自变量的位置无关.
我们可以针对每一个, 以为中心、为半径做小区间, 用
如果把上面的区间改为左开右闭区间, 与经验分布函数恰好满足如下关系: