[关闭]
@ybtang21c 2024-12-10T04:22:16.000000Z 字数 42614 阅读 9812

6.2 参数估计

高等工程数学 讲义 2024AU



参数估计的数学描述


参数的点估计(Point Estimation)

  1. 矩估计
  2. 最大似然估计
  3. Bayes估计
  4. 最小二乘估计

6.2.1 矩估计(Method of Moments)


Pafnuty Chebyshev


是来自总体 的样本


矩估计的求解

是来自总体 的简单随机样本,其中 是待估的未知参数.

  1. 求总体 的前 阶矩
  2. 求样本的前 阶矩 .
  3. 解方程(组):,
    • .
    • 矩估计量 (Moment Estimator).
    • 矩估计值 (Moment Estimate).

Poisson 强度的矩估计

是来自总体 的样本,求参数 的矩估计.


总体方差的矩估计

引理 是来自总体 的样本,设总体 的二阶矩存在,则

  1. 样本均值是总体均值 的矩估计.
  2. 样本方差 是总体方差 的矩估计.

袋中有红球和黑球共 只. 现从袋中有放回地次取个球出来观测其颜色,直到取到红球为止,此时记取球的总次数为 . 若这样的试验一共进行了 次,得到的数据分别是

试求袋中红球数的矩估计.


解: 设袋中共有 个红球. 表示第一次摸到红球时摸球的总次数. 则

进而 .

样本矩 .

,即 ,解得 .

综上,袋中的红球数约为 .


对矩估计法的评价

  1. 原理直观,是一种古老的参数估计方法.
  2. 只用到总体矩,方法简单.
    • 如果总体矩不存在,则无法求参数的点估计.
    • 例如,设总体服从Cauchy分布,其密度函数为 ,因为总体的数学期望不存在,故 的矩估计不存在!
  3. 没有用到总体的分布形式,总体包含的信息没有得到充分利用.
  4. 基于大数定律,在大样本下矩估计才有较好的效果.

均匀分布参数的矩估计

是来自总体 的简单随机样本,其中 是未知参数,求 的矩估计.


讨论: 假设有如下来自 的观测值


6.2.2 最大似然估计


最大似然


最大似然估计(Maximum Likelihood Estimation)


R. A. Fisher


一老战士与一新战士的射击命中率分别为 ,在射击训练中每人各打三枪. 训练结束后现场留有一张靶纸. 如果靶纸上有 个弹孔,试问这张靶纸最有可能是谁的?如果靶纸上只有 个弹孔,试问这张靶纸又最有可能是谁的?


分析: 设靶纸上出现的弹孔数为 ,则 服从二项分布

shootingResultDecision.png


最大似然估计

是来自总体 的样本, 为其观测值,记

似然函数 (Likelihood).

  1. 若统计量 满足 ,则称其为 最大似然估计(量) (Maximun Likelihood Estimator,简写:MLE).
    • 最大似然的思想用一句话可以概括为:参数看上去最像什么值,就用这个值作为参数的估计.

均匀分布参数的极大似然估计

是总体 的简单随机样本,试求参数 的 MLE.

提示:


指数分布参数的最大似然估计

是来自总体 的简单随机样本,其中 是未知参数,试求 的 MLE.

提示:


正态总体参数的最大似然估计

是来自总体 的简单随机样本,求 的 MLE.

提示:


求 MLE 的一般步骤

  1. 根据总体的分布,写出似然函数 ;
  2. 写出 对数似然函数 ;
  3. 写出 对数似然方程(组)
    • .
  4. 解出 即为 的MLE.
    • 如果由对数似然方程(组)无法确定 MLE,则结合参数取值的边界条件,对似然函数进行讨论.

是来自总体 的简单随机样本,其中 为未知参数,求 的矩估计 和最大似然估计 .

提示:




设总体 的密度函数为

其中 为未知参数. 设 是来自总体 的简单随机样本,求 的矩估计 和最大似然估计 .


提示


设总体 的分布律为

是来自总体 的样本,试求 的矩估计和最大似然估计.


提示:


假设某电子器件的寿命 (单位:小时)服从参数为 的指数分布,现从这批器件中任取了 只进行独立寿命试验,试验进行到预定时间 时结束,此时恰好有 只器件失效,试求 的MLE.


提示:


6.2.3 参数估计的评判标准


一个“好的”估计应该满足什么条件?

  1. 无偏性 (Unbiasedness)
    • 估计量的波动应以真值 为中心.
  2. 有效性 (Efficiency)
    • 估计量与真值的距离总体来说应该较小.
  3. 相合性/一致性 (Consistency)
    • 估计量的精度随样本容量 的增加而不断提高.

1. 无偏性

若估计量 的数学期望存在,且对任意

则称 无偏估计 (Unbiased Estimation), 否则称为 有偏估计 (Biased Estimation).


是取自总体 的样本, 总体 的数学期望 未知, 则下列统计量均为 的无偏估计:

  1. .
  2. ,其中 .
  3. .

定理 是来自总体 的简单随机样本,则

  1. 样本均值 是总体均值的无偏估计;
  2. 修正的样本方差 是总体方差的无偏估计.

注:


是来自总体 的简单随机样本,其中 是未知参数.

  1. 试求 的矩估计 与最大似然估计 ;
  2. 是否是 的无偏估计;
  3. 证明 的无偏估计.

分析:



军力评估问题

在“二战”中, 盟军在多个战场缴获德军共计 辆虎式坦克. 这些坦克都带有数字编号, 假定坦克编号 上的等可能取值, 问如何估计虎式坦克总数

  1. 矩估计:.
  2. 极大似然估计:.
  3. 修正的 MLE:.

tankEstimate.png

取真值 次仿真的结果显示,修正的 MLE 具有最好的精确度和稳定性.


2. 有效性

若估计量 的方差存在,称

为估计量 均方误差 (Mean Square Error, MSE).


估计量的“波动”与“偏差”


定理证明:


无偏估计的有效性

均为 的无偏估计量,若

则称估计量 更为 有效.


是来自总体 的简单随机样本.

  1. 证明 都是 的无偏估计;
  2. 判断 哪个更有效.

分析



最小方差无偏估计(MVUE)

是未知参数 的无偏估计量,若对 的任一无偏估计量

则称无偏估计量 最小方差无偏估计 (Minimum Variance Unbiased Estimate).


Cramér–Rao 下界

设总体 的密度函数为 是来自总体 的简单随机样本, 为待估变量,其中 是未知参数,统计量 的无偏估计.


定理 为总体 的密度函数, 为似然函数,若

  1. .
  2. 几乎处处存在,且 .
  3. 几乎处处存在,且

    • .

证明:




Cramér–Rao 下界


Fisher 信息


推论 在前述定理条件下,若还有 ,则


证明思路


例:均匀分布参数的 C-R 下界

求均匀分布 中未知参数 的无偏估计的 C-R 下界.


讨论


事实上, 的密度函数不满足 C-R 下界的条件2:


证明某个统计量是未知參数的 MVUE 的一般过程

  1. 证明估计量 的无偏估计量;
  2. 计算估计量 的方差 ;
  3. 计算 Fisher 信息量 ;
  4. ,则 的 MVUE.

    • 注:有时候,C-R 下界是无法达到的.
    • 例如:对于 的 MVUE.
    • 但是,.

是来自总体 的简单随机样本,证明 的 MVUE.


是来自总体 的简单随机样本,总体 的密度函数为

证明 的最小方差无偏估计.


优效估计

是待估参数 的一个无偏估计量.


是取自总体 的简单随机样本 ( 未知). 试以均方误差的大小为准则,比较 的估计 中哪一个较优?


提示:




3. 相合性

是未知参数 的点估计,若对任意 ,有

则称 相合估计 (Consistent Estimator).


无偏估计必是相合估计吗?


Chebyshev 不等式

是随机变量 非负连续函数,如果 存在,则对于任一正常数 ,均有

证明:


相合估计的判定

是未知参数 的估计量,


定理 无论总体 服从什么分布,若

都存在,则

  1. 样本均值 是总体均值 的相合估计;
  2. 样本方差 与修正的样本方差 都是总体方差 的相合估计.

证明思路



非正态总体的极限分布[2]

为来自总体 的简单随机样本, 均存在,则当 充分大时:

  1. 近似服从 .
  2. 近似服从 .

设总体 服从 上的均匀分布,其中 未知,证明 的 MLE 是相合估计量.

提示:


6.2.4 Bayes 估计


统计的经典学派与 Bayes 学派


先验分布

每天抽检 件产品以确定质量是否满足要求. 产品质量可用不合格品率 来度量,也可用 件产品中的不合格品件数 表示.


Bayes 学派


Bayes 公式的概率函数形式

为样本, 为未知参数,则


Bayes 估计

由后验分布 估计 有三种常用的方法.

  1. 最大后验估计 使用后验分布概率函数的最大值点作为 的点估计.
  2. 后验中位数估计 使用由后验分布概率函数确定的中位数作为 的点估计.
  3. 后验期望估计 使用由后验分布概率函数确定的均值(期望)作为 的点估计.

例:成功率的估计

设事件 在一次试验中发生的概率为 ,为估计 ,对试验进行了 次独立观测,其中事件 发生了 次. 试给出 估计值.


Bayes 方法



使用 的后验期望估计得到


6.2.5 区间估计


区间估计 (Interval Estimation)


置信区间

是来自某个总体的样本,分布函数为 ,其中 未知.

给定 ,若存在统计量 , 使得

则称区间 为参数 的一个 (双侧)置信区间 (confident interval,缩写 CI), 分别称为 双侧置信上、下限. 称为该区间的置信度.


单侧置信区间

给定 , 若存在统计量 , 使得

则称区间 为参数 的一个 单侧置信区间 称为 单侧置信上限.


例:理想的键盘高度


分析:


置信区间的含义

上面的例子中,


置信区间不具有唯一性

前例中, 置信区间为


例:双侧置信区间的宽度


分析: 参考前例,置信区间为 ,依题意须满足

,故 .


Jerzy Neyman (1894-1981)


枢轴变量

为对未知参数 进行区间估计所需的样本. 所谓枢轴变量 (pivotal quantity) ,是指:

  1. 的函数.
    • 不是统计量.
  2. 的分布与 或其他的任何未知参数均无关.

    • 无论 如何取值, 的分布不变.

    • 利用枢轴变量推导参数置信区间的方法称为枢轴变量法.


用枢轴变量法求置信区间

  1. 构造样本的函数 ,也即 枢轴变量 (Pivotal Quantity).
  2. 对置信度 ,确定 的分布的两个分位点 , 使得
    • 注: 在没有事先声明的情况下,默认地按以上方式取两侧的分位点,所得到的的置信区间称为 等尾置信区间.
  3. 解不等式 , 得到置信区间:.

例:理想的键盘高度

已知 , 理想高度服从 的正态分布,求 置信区间.


单个正态总体的区间估计

已知 为来自正态总体 的样本, 分别考虑如下四个区间估计问题:

  1. 已知,求 的置信区间.
  2. 未知,求 的置信区间.
  3. 已知,求 的置信区间.
  4. 未知,求 的置信区间.

单正态总体的 1-α 置信区间


提示: 置信区间(假设 已知)

1. 求双侧置信区间


2. 求单侧置信下限


例:飞机的飞行高度

为了提高可靠性和测量精度,飞机通常安装了若干个高度仪. 设飞机实际飞行高度为 时每个高度仪时测量值 ,而飞机仪表上显示的飞行高度是所有的高度测量值的平均值. 在置信水平 下,求解下列问题:

  1. 若要保证飞行仪表上显示的飞信高度的绝对误差不超过 m,问飞机上至少安装多少个高度仪?
  2. 若飞机装有 个高度仪,飞行仪表上显示的飞行高度是 m,问飞机实际飞行在什么高度范围?

提示:



例:灯泡的寿命

从灯泡厂随机抽取 只灯泡,进行寿命试验,测得数据如下(单位:小时)

设灯泡寿命服从正态分布,给出这批灯泡的平均寿命及方差的置信度为 的置信区间.


解:



双正态总体的区间估计


双正态总体的 1-α 置信区间


例:比较子弹的初速度


解:


小结

  1. 点估计
    • 矩估计与最大似然估计
    • 点估计的评估准则
      • 无偏性有效性、相合性
  2. 区间估计
    • 枢轴变量法
    • 单正态和双正态总体的区间估计
    • 单侧置信区间

[1] https://en.wikipedia.org/wiki/Maximum_likelihood_estimation
[2] 参见:何迎晖,闵华玲,《数理统计》,北京:高等教育出版社,1989.
[3] 概率函数即指离散型随机变量的分布律(列)或连续型随机变量的密度函数
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注