第二十三讲 区间估计
概率论与数理统计
讲义
NUDT
2023SP
23.1 区间估计的基本概念
- 在很多实际问题中,为了作出某种推断,人们更关心某个参数的取值范围,而不需要特别强调参数的精确值.
- 点估计: 对参数取值给出直接的估计.
- 区间估计: 给出参数的某个取值区间 (置信区间,confidence interval) 以及其真值落在该区间内的概率 (置信水平,confidence level),从而帮助形成某种统计推断.
置信区间
设 是来自某个总体的样本,分布函数为 ,其中 未知.
给定 ,若存在统计量 和 , 使得
则称区间 为参数 的一个 (双侧)置信区间, 分别称为 的 双侧置信上、下限.
单侧置信区间
给定 , 若存在统计量 , 使得
则称区间 为参数 的一个 单侧置信区间, 称为 的 单侧置信上限.
例:理想的键盘高度
人机工程学设计师希望设计出一款工作效率和舒适度最理想的键盘. 为此,他们将关注的重点放在了键盘托架的高度上. 为了得到最理想的高度范围,设计师邀请了 31 位熟练的打字员,分别获取了对他们来说最为理想的托架高度. 结果得到的平均值为 cm. 假设打字员所钟意的托架高度服从方差为 4 均值为 的正态分布. 试给出 的一个 置信区间.
分析:
- 设 为来自总体 的样本.
- 于是 , 进而 .
- .
- 即 .
- 代入本例中的数值计算,可得 是 的一个 置信区间.
置信区间的含义
上面的例子中,
- 因为 是一个常数(但取值未知),以上求得的置信区间的意义并不能理解为 .
- 而只能理解为置信区间 中包含 的概率为 .
置信区间不具有唯一性
前例中, 的 置信区间为
- 为了方便,可以简写为
- 显然,置信区间并不具有唯一性,也不一定要求两侧具有对称性.
- 例如: 也是一个满足要求的置信区间.
例:双侧置信区间的宽度
- 某计算机系统上特定的编辑指令的响应时间服从标准差为 25 毫秒的正态分布.
- 安装新的操作系统后,希望对其平均响应时间的均值 重新进行估计.
- 假设安装新的操作系统后,响应时间仍服从正态分布,且标准差不变.
- 为了使得 的 置信区间宽度不超过 10,样本的容量至少要有多大?
分析: 参考前例,置信区间为 ,依题意须满足
即 ,故 .
- 注: 在样本容量不变的前提下,如果提高置信水平,置信区间的宽度将会增加. 此时,可以说:估计的可靠性 (reliability) 提高了,但估计的精度 (precision) 有所下降.
枢轴变量
设 为对未知参数 进行区间估计所需的样本. 所谓枢轴变量 (pivotal quantity) ,是指:
- 是 和 的函数.
的分布与 或其他的任何未知参数均无关.
用枢轴变量法求置信区间
- 构造样本的函数 ,也即 枢轴变量 (Pivotal Quantity).
- 对置信度 ,确定 的分布的两个分位点 和 , 使得
- 注: 在没有事先声明的情况下,默认地按以上方式取两侧的分位点,所得到的的置信区间称为 等尾置信区间.
- 解不等式 , 得到置信区间:.
Jerzy Neyman (1894-1981)
- Polish mathematician and statistician
- Neyman first introduced the modern concept of a confidence interval into statistical hypothesis testing
- and co-revised Ronald Fisher's null hypothesis testing (in collaboration with Egon Pearson).
例:理想的键盘高度
已知 , 理想高度服从 的正态分布,求 的 置信区间.
- 枢轴变量:.
- 思考: 如果本例中 也是未知的,以上的 还是枢轴变量吗?
- 如果不是,应该如何定义枢轴变量?
- 枢轴变量的选择是唯一的吗?
23.2 单个正态总体的区间估计
已知 为来自正态总体 的样本, 分别考虑如下四个区间估计问题:
- 已知,求 的置信区间.
- 未知,求 的置信区间.
- 已知,求 的置信区间.
- 未知,求 的置信区间.
单正态总体的 置信区间
提示: 求 的 置信区间(假设 已知)
1. 求双侧置信区间
2. 求单侧置信下限
例:灯泡的寿命
从灯泡厂随机抽取 只灯泡,进行寿命试验,测得数据如下(单位:小时)
设灯泡寿命服从正态分布,给出这批灯泡的平均寿命及方差的置信度为 的置信区间.
解:
- 设 为灯泡的寿命,设 ,其中 均未知.
- 的置信度为 置信区间是 .
- 利用抽样数据进行计算,.
- 查表 ,故 的置信度为 的置信区间为 .
- 的置信度为 的置信区间为 .
- .
- .
- .
- 的置信度为 的置信区间为
23.3 双正态总体的区间估计
- 设 和 分别为来自 和 的样本,且二者相互独立.
- 试对其均值的差 和方差的比值 给出区间估计.
双正态总体的 置信区间
例:比较子弹的初速度
为了比较两类子弹的初速度,进行了如下的抽样试验. 任取 10 发 A 类子弹,测得其平均初速度及其标准差分别为 (m/s) 和 (m/s);任取 20 发 B 类子弹,测得其平均初速度及其标准差分别为 (m/s) 和 (m/s). 假设两类子弹的初速度服从方差相同的正态分布,试求两者均值之差的 置信区间.
解:
- 由实际情况,可认为分别来自两个总体的样本是相互独立的.
- 由于它们的方差相等且未知,故 的置信度 的置信区间为 .
- 其中 , , .
- 故 的置信度为 的置信区间为 .
The whole of science is nothing more than a refinement of everyday thinking.
--Albert Einstein
例:飞机的飞行高度
为了提高可靠性和测量精度,飞机通常安装了若干个高度仪. 设飞机实际飞行高度为 时每个高度仪测量值 ,而飞机仪表上显示的飞行高度是所有的高度测量值的平均值. 在置信水平 下,求解下列问题:
- 若要保证飞行仪表上显示的飞信高度的绝对误差不超过 m,问飞机上至少安装多少个高度仪?
- 若飞机装有 个高度仪,飞行仪表上显示的飞行高度是 m,问飞机实际飞行在什么高度范围?
提示:
- 假设有 个高度仪,高度测量值分别为 ,则 .
- 问题等价于,要使 , 至少需要取多大?
- 上式也即 .
- 由此可得 ,即 .
结论:
安装至少 个高度仪就可以满足要求.
- 此时 ,进而 .
- .
- 故
- 已知 ,故此时飞机的实际高度范围为 .
- 思考: 真的可以确定飞机在以上的高度范围内飞行吗?