[关闭]
@ybtang21c 2025-01-06T18:16:23.000000Z 字数 19828 阅读 7538

6.1 样本与抽样分布

高等工程数学 讲义 2024AU



第二部分 数理统计与数据分析


数理统计

数理统计学的任务,统而言之,是如何获得样本(观察或试验结果)和利用样本,以对事物的某些未知方面进行分析、推断以至作出一定的决策.
-- 陈希孺,《高等数理统计学》[1]


第二部分主要内容

  1. 抽样分布
  2. 参数估计
    • 矩估计
    • 极大似然估计
    • Bayes 估计 *
    • 区间估计 *
  3. 假设检验
    • 正态总体参数的假设检验
    • 非参数假设检验
  4. 数据分析
    • 单因子方差分析
    • 主成分分析
    • 多元线性回归

6.1 样本与抽样分布


6.1.1 数理统计的基本概念


设随机变量 ,若 相互独立,且与 同分布[3],则称

为来自总体 简单随机样本(Simple Random Sample,简称 随机样本),称 样本容量(Sample Size).


为了考察某种器件的寿命,从一批产品中随机抽取 件产品进行了寿命试验,得到试验结果如下:


样本的联合分布

是来自总体 的简单随机样本


6.1.2 统计量及其分布

是来自总体 的简单随机样本,若 元连续函数,且不含任何未知参数,则称随机变量

统计量 (Statistics).


是来自总体 的简单随机样本,其中 均未知,则下列随机变量中哪些是统计量?

, , , ,

注: 尽管统计量的取值不依赖于未知参数,但是它的分布一般还是依赖于未知参数的.


常用的统计量

  1. 样本均值(Sample Mean)
  2. 样本方差(Sample Variance)
  3. 样本标准差(Sample Standard Deviation)
  4. 修正的样本方差(Modify Sample Variance)



样本均值


提示: 对任意 ,


中心极限定理

定理 是来自某个总体的随机样本, 为样本均值.

  1. 若总体分布为 ,则 精确分布.
  2. 若总体分布未知或不是正态分布,总体均值 和总体方差 均存在,则当 较大时 渐进分布.

[4] 当样本容量 时,

  1. ,则
    • 近似服从
  2. 的密度函数为
    • 近似服从
  3. ,则
    • 近似服从


样本方差与样本标准差


次序统计量

定理[6] 设总体 的密度函数和分布函数分别为 ,且 为来自 的简单随机样本,则从小到大排列的第 个次序统计量 的密度函数为


样本分位数

样本 分位数 (Quantile):


一些相关的计算公式



6.1.3 抽样分布与抽样分布定理


常用的抽样分布

  1. 正态分布(Normal Distribution)
  2. -分布
  3. t-分布
  4. F-分布

常用分布一:卡方分布

是来自总体 的简单随机样本,称随机变量

服从 自由度(Degree of Freedom) 为 -分布 (Chi-Square Distribution),记为 .


正态分布的基本性质

  1. 正态分布随机向量的任意线性变换仍为正态随机向量,即:正态性在线性变换之下保持不变.
  2. 利用线性变换可以将任何正态分布化为标准正态分布,即:若 ,则 .
  3. ,则

卡方分布的密度函数(PDF)


关于 Γ-函数[7]


    • -函数也叫 Euler 第二积分,是阶乘在实数与复数域上的扩展

452535-20180916015434520-859440437.png


gamma-complex.jpg

-函数在复平面上的图像


基本性质:卡方分布

  1. ,则
    • .
    • .
  2. ,且 相互独立,则 .
    • 注意: 已知 ,不一定能推出 .

性质2的证明:



相互独立,求如下统计量的分布:


History of Chi-Square Distribution[^6]


抽样分布定理一:抽样分布基本定理

定理 是来自 的简单随机样本,则

  1. .
  2. .
  3. (以及 ) 相互独立.

证明概要:,于是





抽样分布基本定理的现实意义

  1. .
    • 随着样本容量的增加, 的总偏差将越来越小
    • 或者说:大量重复试验有助于提高均值的估计精度.
  2. (以及 ) 相互独立.
    • 样本均值和样本方差(以及修正的样本方差)之间相互独立,
    • 或者说:总体均值和方差可以分别进行估计.

如何避免噪声淹没速度?


常用分布二:t-分布

相互独立,则称随机变量

服从自由度为 t-分布,记为 .


t-分布的密度函数

t-density.jpg


History of t-Distribution[8]


抽样分布定理二

定理 是来自正态总体 的简单随机样本,则


抽样分布定理三

定理 是来自正态总体 的简单随机样本, 是来自正态总体 的简单随机样本,且两组样本相互独立,则

其中 , 分别为两组样本对应的样本方差.


常用分布三:F-分布

相互独立,则称随机变量

服从自由度为 F-分布.


F-分布的密度函数

f-density.jpg


Histroy of F-Distribution[9]


抽样分布定理四

定理 是来自正态总体 的简单随机样本, 是来自正态总体 的简单随机样本,且两组样本相互独立. 分别表示两样本的样本均值和修正样本方差,则有


分位点

是连续型随机变量,其密度函数为 ,对任意给定的 ,必存在唯一的一个实数 使得

为分布 分位点(Percentiles),或 分位数.


常用的分位点符号

  1. 标准正态分布 分位点记为 .
    • .
  2. 分位点记为 .
    • .
  3. 分位点记为 .
  4. 分位点记为 .
    • .

是来自正态总体 的简单随机样本,试确定常数 ,使得


解:

chi2-dist-table.jpg


是来自总体 的样本,已知 是非零常数,试确定如下统计量的分布,并求出常数 .


提示:


三大抽样分布的密度函数及其数字特征

sampleDist.jpg


补充例题

为来自总体 的简单随机样本. 求 的分布.


是独立同分布的 随机变量. 若


为总体 的两个独立的随机样本,且


是来自正态总体 的简单随机样本,记

证明:.


提示



是来自总体 的简单随机样本, 是来自总体 的简单随机样本,两组样本相互独立,记

求概率 .


提示


小结

  1. 总体与样本
    • 样本的二重性
  2. 统计量及其分布
    • 样本均值、样本方差、修正的样本方差
    • 基本抽样分布
    • 抽样分布定理

[1] 陈希孺,高等数理统计,中国科技大学出版社,2009,合肥.
[2] 抛开问题的实际背景,总体就是一堆数,用一个概率分布去描述和归纳总体是恰当的,从这个意义上看,总体就是一个分布. (茆诗松 等,概率论与数理统计(第二版),高等教育出版社,2011,北京.)
[3] 独立同分布常常缩写为 i.i.d.,即 Independent Identical Distribution/Distributed
[4] 茆诗松 等,概率论与数理统计(第二版),高等教育出版社,2011,北京.
[5] 茆诗松 等,概率论与数理统计(第二版),高等教育出版社,2011,北京.
[6] 茆诗松 等,概率论与数理统计(第二版),高等教育出版社,2011,北京.
[7] https://www.cnblogs.com/coshaho/p/9653460.html
[8] https://en.wikipedia.org/wiki/Student%27s_t-distribution
[9] https://en.wikipedia.org/wiki/F-distribution
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注