第二十四讲 假设检验的基本概念
概率论与数理统计
讲义
NUDT
2023SP
24.1 什么是假设检验?
- 提出某种假设,然后利用统计数据判断其真伪.
- 需要回答的问题:
如何(定量地)表达假设?
真伪的标准是什么?
用什么样的方法进行判定?
如何表达/理解检验的结果?
两类假设检验问题
- 参数假设检验
- 总体分布形式 已知,对总体分布中的参数 进行检验
- 例如:次品率(
均值检验
)、质量的对比(方差检验
)
- 非参数假设检验
- 总体的分布未知,对总体的分布或总体间的关系进行检验
- 例如:判断总体的分布(
拟合优度检验
)、判断两随机变量是否独立(独立性检验
)
24.2 参数假设检验
例(产品质量检验) 某车间用一台自动包装机装化肥,每袋的标称重量规定为 kg. 某日开工后随机抽检 袋产品,测得净重如下(单位:kg)
设化肥的实际重量服从正态分布,标准差为 kg,试判断该包装机是否工作正常?
- 数据的平均值:.
- 从以上的数据来看,均值(平均重量)没有达标.
- 考虑到设备和测量可能存在的误差,这样的结果是否一定是不可接受的?
问题的背景
- 理论上讲,只有完整地了解了整个总体之后,才能做出正确无误的判断.
- 但这在实际中常常是不可能的.
- 很多情况下,只能根据样本进行 推断.
由于样本未必能够严格反映总体的完整特征,最终推理得到的结论也可能是错误的!
- 因此,
统计推断的结果,只能说是在一定的概率下是正确的.
提出假设检验问题
- 已知条件:每袋化肥重量的分布 ,理论上,包装机工作正常,当且仅当 .
- 待检验的假设
- 原假设(零假设,Null Hypothesis)::,即:包装机工作正常
- 备择假设(Alternative Hypothesis)::,即:包装机工作不正常
- 可能的结论
- 拒绝 ,认为包装机工作不正常.
- 接受 ,认为包装机工作正常.
假设检验的思想出发点
- 小概率事件在一次试验中是不会发生的.
- 如果发生了小概率的事件,则意味着原来的判断(原假设)可能是错误的.
- 在假设检验中,如果事实(样本)支持原来判断的反面(备择假设),则拒绝原假设.
- 统计推断的目的是证伪,也就是要尝试验证备择假设是否成立.
- 如果不能证伪,则接受原假设.
错误与风险
产品质量检验问题的分析
- 待检验的假设:.
- 任务:判断所获得的样本是否支持了 ,从而决定是否接受 .
- 因为 是 的无偏估计是 ,因此 .
- 若 成立, 应该较小.
- 反之,若 较大,则有理由认为 不成立.
- 检验的规则:确定某个阈值
- 当 时,拒绝 ,否则接受 .
- 满足 的样本取值范围称为检验的拒绝域,一般记为 .
问题:
如何确定 ?
假设检验原则
- 检验原则一:犯 I 类错误的概率要足够小.
- 对给定的 (显著性水平, Level of Significance), 满足:
- 除非有足够的证据能够支持备择假设,否则不轻易拒绝原假设.
- 检验原则二:在满足检验原则一的条件下,使 II 类风险尽可能小.
- 通常先利用检验原则一构造检验的拒绝域,再利用检验原则二对其进行优化.
产品质量检验的拒绝域
- 根据假设检验原则一
- 成立时,,故
- 任取 ,即可满足假设检验原则一.
- 例如,可以取一个拒绝域为 .
- 显然,若只考虑检验原则一,拒绝域的取法并不唯一
产品质量检验的解答
解: 检验假设
拒绝域为
取 ,计算得到: , .
因为 ,故应拒绝 ,也即认为今天的设备运转不正常.
设备真的不正常吗?
- 准确的说法:认为设备运行不正常而实际设备运行正常的可能性不超过 5%.
- 不拒绝原假设可能有两种含义:
- 原假设的确是正确的,应当接受.
- 样本提供的信息不足以拒绝原假设(支持备择假设),只好接受原假设.
- 从这个意义上说,假设检验的原则一可以理解为:保护(不随意否定)原假设.
无罪推定原则
- 《刑事诉讼法》第十二条:“未经人民法院依法判决,对任何人都不得确定有罪.”
- 控方需要列举证据证明嫌疑人有罪.
- 如果证据确凿,则推翻无罪假设,嫌疑人被判有罪.
- 如果证据不足,则维持无罪判定,宣布嫌疑人无罪.
关在监狱中的人基本上都是有罪的.
监狱外面的人并不全是好人.
假设检验的一般步骤
- 提出待检验的假设:原假设 vs 备择假设.
- 给出拒绝域的形式.
- 选择检验统计量,根据显著性水平确定拒绝域.
- 根据样本数据进行计算,作出判断.
1. 提出待检验的假设
- 其中 ,但不要求一定有 .
- 如果 (或 ) 只含有一个点,则该假设称为 简单假设,否则称为 复合假设.
- 注意:
- 原假设中应该包含等号.
- 通常情况下,应该将不应该/不希望轻易加以否定的假设作为原假设.
单边假设与双边假设
- 设原假设为 ,可能的备择假设通常有三种
- vs 称为 双侧(边)假设.
- vs 或 vs 称为 单侧(边)假设.
2. 给出拒绝域的形式
- 假设检验等价于把样本空间划分为两个不相交的部分 和 ,其中 称为 拒绝域 (Rejection Region).
- 当样本 时,则拒绝 ,否则接受 .
- 拒绝域确定了,检验的判断准则也就确定了.
- 假设检验就是要证伪(尝试证明备择假设),因此拒绝域的形式完全由备择假设决定.
3. 选择检验统计量,根据显著性水平确定拒绝域
- 根据对 I 类风险的要求,由检验统计量的分布确定分位点.
- 检验统计量不具有唯一性,拒绝域也不具有唯一性.
4. 根据数据进行计算,作出判断.
- 不同的显著性水平可能意味着不同的检验结论.
交换原假设和备择假设可能导致判断的结论相反.
例:交换原假设和备择假设(1)
某工厂规定特定产品的质量不能低于 kg,否则视为不合格. 已知该产品的质量服从 . 现抽检 100 件样品,测得样本均值 ,试判断该批产品是否达到质量标准.
例:交换原假设和备择假设(2)
某工厂规定特定产品的质量不能低于 kg,否则视为不合格. 已知该产品的质量服从 . 现抽检 100 件样品,测得样本均值 ,试判断该批产品是否达到质量标准.
检验的 p 值
例 某厂生产的合金强度服从正态分布 ,其中的设计值为不低于 (Pa). 为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行. 某天从生产的产品中随机抽取 块合金,测得其强度值均值为 (Pa),问当日生产是否正常?
不同显著性水平之下的检验结论
- 检验的 p 值 是指在一个假设检验问题中,利用样本观测值能够做出拒绝原假设的最小的显著性水平. 以上例子中,.
置信区间与假设检验的关系
- 设 是来自总体 的样本, 是总体参数 的取值范围.
- 设 是参数 的一个置信水平为 的置信区间. 也即:对任意 ,有
- 考虑显著性为 的双边检验:
- 注意到
- 故拒绝域可以取为
利用置信区间进行假设检验
对于显著性为 的双边检验:
- 先求出 的置信水平为 的置信区间 .
判断 是否落在 中.若 ,则接受 . 反之,拒绝 .
- 类似地,可以通过求以上假设检验问题的拒绝域来求得 的 置信区间.
小结
The scientist only imposes two things, namely truth and sincerity, imposes them upon himself and upon other scientists.
--Erwin Schrödinger