第二十讲 统计量及其分布
概率论与数理统计
讲义
NUDT
2023SP
数理统计
数理统计学的任务,统而言之,是如何获得样本(观察或试验结果)和利用样本,以对事物的某些未知方面进行分析、推断以至作出一定的决策.
- 试验设计(Experimental Design)、抽样调查(Sampling Survey) 研究如何收集样本
- 统计推断(Statistical Inference) 在已有样本的情况下进行统计分析
数理统计部分的主要内容
- 抽样分布
- 参数估计
- 参数假设检验
20.1 数理统计的基本概念
- 总体 (Population):研究对象的全体
- 数理统计中的总体通常是指:
满足某个分布
的随机变量的全体
- 例如:总体 或 总体 或 总体
- 个体 (Individual): 组成总体的每一个考察对象,例如:某个服从 的随机变量
- 随机变量 (Random Variable,简写 r.v.):被研究对象的数量指标
- 样本 (Sample):所有被抽取的个体(随机变量)所组成的集合
简单随机样本
设随机变量 ,若 相互独立,且与 同分布,则称
为来自总体 的 简单随机样本(Simple Random Sample,简称 随机样本 或 样本),称 为 样本容量 (Sample Size).
样本的二重性
- 试验前,样本是独立同分布的
随机变量
,记为
- 试验后,样本是一组确定的数据(
样本观测值
,Sample Observation),记为
例 为了考察某种器件的寿命,从一批产品中随机抽取 件产品进行了寿命试验,得到试验结果如下:
- 样本容量 .
- 二重性
- 统计推断问题的基本要素:总体及其分布、样本容量、样本观测值.
20.2 统计量及其分布
设 是来自总体 的简单随机样本,若 是 元连续函数,且不含任何未知参数
,则称随机变量
为 统计量 (Statistics).
- 统计量是且仅是样本的函数.
- 统计量的分布称为 抽样分布 (Sample Distribution).
例 设 是来自总体 的简单随机样本,其中 均未知,下列随机变量中哪些是统计量?
- 统计量的取值不依赖于未知参数,但其分布一般还是和未知参数相关的.
常用的统计量
- 样本均值(Sample Mean)
- 样本方差(Sample Variance)
- 样本标准差(Sample Standard Deviation)
- 修正的样本方差
- 第 k 个次序统计量 (k-th Order Statistics) 表示从小到大的第 个值对应的随机变量
- 样本极小值 (Minima of the Sample)
- 样本极大值 (Maxima of the Sample)
- 样本极差 (Sample Limit Error)
- 样本中值 (Sample Median)
- 样本 k 阶(原点)矩 (k-th Moment of the Sample)
- 样本 k 阶中心矩 (k-th Central Moment of the Sample)
- 样本偏度(Sample Skewness)
- 样本峰度(Sample Kurtosis)
- 反映总体分布密度曲线在其峰值附近的陡峭程度和尾部粗细
样本均值
- 偏差:样本中的数据与样本均值之差,即:.
- 定理:样本的总偏差之和为零,即
- 定理:数据观测值整体与均值的均方误差(偏差平方和)最小.
20.3 抽样分布
- 正态分布
- -分布
- t-分布
- F-分布
Chi 方分布
设 是来自总体 的简单随机样本,称随机变量
的分布为 自由度 (Degree of Freedom) 为 的 -分布 (Chi-Square Distribution). 记为
Chi 方分布的密度函数
Chi 方分布的性质
- 若 ,则
- 若 ,且 与 相互独立,则
例 设 相互独立,问
服从什么分布?
t-分布
设 , 相互独立,则称随机变量
的分布称为自由度为 的 t-分布,记为
t-分布的密度函数
F-分布
设 , 相互独立,则随机变量
的分布称为自由度为 的 F-分布.记为
F-分布的密度函数
抽样分布的分位点
- 标准正态分布 的 分位点记为
- 的 分位点记为
- 的 分位点记为
- 的 分位点记为
证明:
例 设 是来自正态总体 的简单随机样本,试确定常数 ,使得
解:
查表求分位点
20.4 抽样分布定理
定理 设 是来自总体 的简单随机样本,则
-
- 与 相互独立.
定理 设 是来自 的简单随机样本,则
定理 设 和 分别为来自总体 和 的简单随机样本,且两者相互独立,则
其中 , 分别为两个样本对应的样本方差.
定理 设 和 分别为来自总体 和 的简单随机样本,且两者相互独立, 分别为其样本方差,则
例 设 是来自总体 的简单随机样本,问 取何值时,统计量
服从 t-分布,该分布的自由度是多少?
分析:
例 试验 A, B 两种型号的导弹,分别试射了 8 次和 10 次,落点距离靶点的距离分别如下:
A:
B:
假定数据均服从正态分布,问:
- 若判断两种型号的导弹命中精度是否存在差异,应采用何种抽样分布?
- 若判断两种型号的导弹的精度稳定性是否存在差异,应采用何种抽样分布?
例 设 是来自总体 的样本,则当 时,.
例 设 是来自总体 的简单随机样本,令 ,若统计量 服从自由度为 4 的 -分布,求常数 的值.
小结
- 统计量
- 理解统计量的概念
- 熟练掌握样本均值和样本方差的各种性质
- 抽样分布
- 熟练掌握四个基本抽样分布的性质和构造特点
- 熟练掌握和运用四个抽样分布定理
The scientist only imposes two things, namely truth and sincerity, imposes them upon himself and upon other scientists.
--Erwin Schrödinger
附录:一些相关的计算公式
- 抽取两个容量分别为 的样本,样本均值分别为 ,修正的样本方差分别为
- 设总体的四阶中心矩 存在, 为总体方差,则