[关闭]
@ybtang21c 2024-12-17T05:57:09.000000Z 字数 26539 阅读 8444

7.1 参数假设检验

高等工程数学 讲义 2024AU



第七章 假设检验


假设检验关注的问题

提出某种假设,然后利用统计数据判断其真伪.


两类假设检验问题

  1. 参数假设检验
    • 总体分布形式 已知,对总体分布中的参数 进行检验.
    • 例如:次品率(均值检验)、质量对比(方差检验)、...
  2. 非参数假设检验
    • 总体的分布未知,对总体的分布或总体间的关系进行检验.
    • 例如:判断总体的分布(拟合优度检验)、判断两随机变量是否独立(独立性检验)、...

7.1 参数假设检验


7.1.1 基本概念

例(产品质量检验) 某车间用一台自动包装机装化肥,每袋的标称重量规定为 kg. 某日开工后随机抽检 袋产品,测得净重如下(单位:kg)

设每袋化肥的实际重量服从正态分布,标准差为 kg,试问该日包装机工作是否正常?


统计推断的出发点


例(产品质量检验) 某车间用一台自动包装机装化肥,每袋的标称重量规定为 kg. 某日开工后随机抽检 袋产品,测得净重如下(单位:kg)

设每袋化肥的实际重量服从正态分布,标准差为 kg,试问该日包装机工作是否正常?


提出假设检验问题


假设检验的思想出发点


错误与风险

SHT-error.png


产品质量检验问题的分析


假设检验原则


产品质量检验

分析:根据题设,需要检验假设



解:检验假设

拒绝域(即拒绝的条件)为

,计算得到: , .

因为 ,即 ,故应拒绝 ,也即认为今天的设备运转不正常.


设备真的不正常吗?


司法中的“无罪推定原则” (Presumption of Innocence)


假设检验的基本步骤

  1. 提出待检验的假设:原假设 vs 备择假设 .
  2. 分析得到拒绝域的形式.
  3. 选择 检验统计量,根据显著性水平确定拒绝域.
  4. 根据样本数据进行计算,作出判断.

注:1. 待检验的假设


单边假设与双边假设


注:2. 拒绝域


注:3. 检验统计量


注:4. 检验的结论


例:交换原假设和备择假设(1)

某工厂规定特定产品的质量不能低于 kg,否则视为不合格. 已知该产品的质量服从 . 现抽检 100 件样品,测得样本均值 ,试判断该批产品是否达到质量标准.


例:交换原假设和备择假设(2)

某工厂规定特定产品的质量不能低于 kg,否则视为不合格. 已知该产品的质量服从 . 现抽检 100 件样品,测得样本均值 ,试判断该批产品是否达到质量标准.


检验的 p 值

某厂生产的合金强度服从正态分布 ,其中的设计值为不低于 (Pa). 为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行. 某天从生产的产品中随机抽取 块合金,测得其强度值均值为 (Pa),问当日生产是否正常?


不同显著性水平之下的检验结论


p 值与检验的显著性


置信区间与假设检验的关系


利用置信区间进行假设检验

对于显著性为 的双边检验:

  1. 先求出 的置信水平为 的置信区间 .
  2. 判断 是否落在 中.若 ,则接受 . 反之,拒绝 .

    • 类似地,可以通过求以上假设检验问题的拒绝域来求得 置信区间.

7.1.2 正态参数总体假设检验


假设检验问题的进一步讨论

回顾:设总体 ,其中 已知,检验假设


进一步的讨论

设总体 ,其中 已知,检验假设


再进一步

设总体 ,其中 已知,检验假设


为什么使用相同的检验统计量?


小结

  1. 对于同样的备择假设(),无论原假设是什么(),都有相同的拒绝域.
  2. 当原假设不是简单假设时,使用的检验统计量与简单假设时相同.

    • 使用简单假设时
    • 使用非简单假设时

    • 对于任意的假设检验问题,总可以把原假设视为简单假设来处理.


单正态总体均值的检验(方差未知)

是来自总体 的简单随机样本, 均未知,在显著水平 下,检验假设


单正态总体均值的单边检验(方差未知)

是来自总体 的简单随机样本, 均未知, 已知,在显著水平 下,检验假设


单正态总体均值的检验:检验统计量与拒绝域


例:污水处理问题

某地环保部门规定,废水处理后其中某有毒物质的平均浓度不得超过 mg/l. 现从某废水处理厂随机抽取了 份样本,测得样本均值 mg/l ,样本标准差 mg/l . 假设废水处理后有毒物质的浓度服从正态分布. 试在显著性水平 下,分析该厂处理后的水是否达标?



单正态总体方差的检验:检验统计量与拒绝域


例:产品质量检验

某切割机若正常工作,切割出的金属棒平均长度为 cm, 标准差不超过 cm. 现从一批产品中随机抽取 段,测量得到数据如下:

假设金属棒的长度 服从正态分布. 在显著性水平 下,问该切割机是否工作正常?




双正态总体均值差的假设检验

是来自总体 的简单随机样本, 是来自总体 的简单随机样本, 其中 均未知,在显著水平 下,检验假设


双正态总体均值差的检验:检验统计量与拒绝域


例:NBA 球队胜率比较

右表是马刺队和湖人队历年常规赛成绩,问马刺队的胜率是否明显高于湖人队?()


分析


注: 以上解答过程中存在的问题

  1. 二者胜率的方差相等吗?
    • 未知!
  2. 二者胜率服从正态分布吗?
    • 未知!
  3. 二者的胜率相互独立吗?
    • 未知!

是来自总体 的简单随机样本, 是来自总体 的简单随机样本, 其中 均未知,在显著水平 下,检验假设


回到前面的例子,比较两队胜率的稳定性


双正态总体方差比的检验:检验统计量与拒绝域


7.1.3 非正态总体大样本参数检验


某县早稻收割面积为 100 万亩,现随机抽取 150 亩,得到平均亩产量 kg,样本的标准差 kg,问在显著性水平 下,能否预计这 100 万亩早稻的平均亩产量为 340 kg?


在两种工艺条件下纺出一批细纱,现随机地各抽取 个样品测试其能承受的最大拉力(单位:N). 经计算得到在这两种工艺条件下样本均值和样本标准差为

问在 下,两种工艺条件纺出的细纱的平均强度有无显著差异?


解: 分别表示甲、乙两种工艺条件纺出的细纱总体. 检验假设

取统计量 . 当 成立时, 的渐近分布为 . 在显著性水平 下,拒绝域为 .

根据观测值进行计算得到 . 因而不能拒绝 ,即认为在这两种工艺条件下纺出的细纱的平均强力无显著差异.


7.1.4 功效函数与最大功效检验


是来自总体 的样本, 未知,在显著水平 下,检验假设问题

  1. 检验1:
  2. 检验2:
  3. 检验3:

    • 都满足了 I 类风险要求的情况下,哪一个检验(拒绝域)更好?
    • 或者说,如何量化地比较不同的检验?

功效函数

对假设检验问题

的一个检验 (拒绝域为 ),称

为该检验的 功效函数势函数, Power Function).


注: 拒绝 .

  1. 成立.
    • 等于犯第 I 类错误的概率,即 I 类风险.
    • 检验准则一:.
  2. 成立.
    • 等于根据样本观测值作出拒绝原假设的判断是正确的概率.
    • 等于犯第 II 类错误的概率,即 II 类风险.
    • 检验准则二:满足 的同时,使得 尽可能小(或 尽可能大).

例:功效函数的计算

是来自总体 的简单随机样本,其中 未知. 在显著水平 下,检验假设

得到的拒绝域为

试求该检验的功效函数 .


解:


分析: 本例中

  1. 的图形关于 对称.
  2. 时,.
  3. 的最小值.

PowerFunc.png


II 类风险的控制


增大样本容量以降低 II 类风险

本例中,若已知 ,对于给定的 ,要使 II 类风险不超过 应该取多大?


例:单边检验的功效函数

是来自总体 的简单随机样本,其中 已知, 未知. 在显著水平 下,检验假设

采用 检验,试求该检验的功效函数 .


分析



例:工厂产品质量抽验方案


提示:



N-P准则


最大功效检验(MPT)

对显著水平为 的假设检验问题

如果检验 ,使得对于任意一个检验 ,均有

则称 为这个假设检验问题在显著性水平 下的 一致最大功效检验UMPT, Uniformly Most Powerful Test). 当 为简单假设时,称为 最大功效检验(MPT)


Neyman-Pearson 引理

设总体 的概率密度为 , 对显著水平为 的假设检验问题 , 如果存在临界值 , 使

那么,以

为拒绝域的检验 是该假设检验问题的 MPT.


似然比


证明:



例:求最大功效检验

是取自总体 的简单随机样本,其中 未知,要检验

其中 ,在显著性水平 下,求最大功效检验的拒绝域.


解:



例:求一致最大功效检验

是取自 的样本,其中 未知,证明对于单侧假设检验问题

前例给出的拒绝域为

-检验 是显著性水平 下的一致最大功效检验(UMPT).


证明:



小结

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注