第十三讲 随机变量函数的分布
概率论与数理统计
讲义
NUDT
2023SP
复习回顾
概念
- 样本空间, 样本, 样本点数
- 事件, 互斥, 独立
- 概率的公理与性质
- 条件概率
- 随机变量
- Bernoulli, 二项, Poisson
- 均匀, 正态, 指数
- 概率分布: PMF, PDF, CDF, 分位点
- 期望, 方差
公式与方法
- 古典概型
- 几何概型:
- 乘法公式:
- 全概率公式:
- Bayes 公式:
- 当 是,
- 对离散型 rv
- 对连续性 rv :
- 分位点:
常用的随机变量
随机变量的函数
给定随机变量 和函数 , 也具有随机性,因此也是一个随机变量.
- 问题1: 求 的概率分布.
- 问题2: 求 的期望和方差.
13.1 离散型随机变量的函数
例:已知 rv 的 pmf 为
设 , 求 的 pmf.
解: 由已知
故 的分布律为
求 g(X) 的 pmf
- 列表给出 的所有取值
- 合并 的相同取值对应的表项,得到 的 pmf
13.2 利用连续型 rv 构造离散型 rv
例: 已知 rv , 令
求 的 pmf.
解:
- 用计算机生成具有指定分布的离散随机数
- 先生成某个连续区间内的伪随机数(pseudo random numbers),一般假设其服从该区间上的均匀分布
- 将连续区间分段,每段对应一个离散值,每段长度占区间总长度的比例为取该离散值的概率
- 根据生成的伪随机数所在的分段,将其映射为对应的离散值
13.3 连续型 rv 的函数
例: 已知 rv 的 pdf 为
求 的 pdf.
解: 的 cdf 为
于是
例: 设 rv 的 cdf 为 , . 以下哪一个函数是 的 cdf
(A)
(B)
(C)
(D)
单调函数的情形
定理: 已知连续型 rv 的取值范围 和 pdf , 若函数 可微且严格单调,则 可逆 (设反函数为 ),进而 的 pdf 为
例: 已知 rv , 求 的 pdf.
- 记 为 的反函数.
- 的 pdf
- 思考:如果改为 ,结果有哪些边变化?
例: 已知 rv , 求 的 pdf.
对数正态分布
若 ,则称 服从参数为 的对数正态分布(logarithmic normal distribution)
利用对数变换观察数据的分布类型
生成服从指定连续分布的随机数
任务:生成以 为 cdf 的随机数
- 不妨设 是连续且严格单调递增的, 则其存在反函数
- 设 ,令 .
- 随机生成 区间内的伪随机数 ,将其代入 ,即得到 cdf 为 的随机数
数据正态性的检验
定理:设连续型 rv 的 cdf 可微且严格单调,则 .
- 在 QQ 图(Quantile-Quantile Plot)上,如果数据的分布接近于一条直线,则可以初步推断数据来源服从正态分布.
- 类似的方法也可以用于其他分布的初步检验以及对两组数据分布类型的比较
非单调函数的情形
定理:已知连续型 rv 的 pdf . 若在不相交的区间 上, 函数 分段可微且严格单调,且值域均为 , 则 在每个小区间上均可逆 (反函数记为 ), 进而 的 pdf 为
证明思路:以有三个单调区间的情况为例,
如图,
例: 已知 rv , 求 的 pdf.
- 在 上严格单调递减,反函数为 , 在 严格单调递增,反函数为
-
小结
给定 rv 和函数 , 求 的概率分布
- 若 为连续型,且 可微、严格单调
- 若 为连续型,且 可微、分段严格单调
Pure mathematics is, in its way, the poetry of logical ideas.
-- Albert Einstein
Rayleigh 分布
设 ,则 服从 Rayleigh 分布
- pdf: ,其中
- 期望、方差:, .
- Rayleigh 分布是实部、虚部均为 的独立正态随机变量构成的复正态随机变量的模的分布.
Weibull 分布
设 ,则 服从 Weibull 分布.
- pdf:
- 期望、方差: ,
- Weibull 分布在可靠性研究总居于重要地位,其刻画了一种失效率为 的寿命的分布. 时,Weibull 分布退化为指数分布.
Laplace 分布
设 ,则 服从 Laplace 分布.
- pdf:
- cdf:
- Laplace 分布适合描述所谓的“重拖尾”噪声,也即异常值(野值)较多的噪声.
Logistic 分布
设 ,则 服从 Logistic 分布.
- pdf:
- cdf:
- 由于 Logistic 函数的 形状有很强的表现力,所以 Logistic 分布在诸多领域有着重要应用.
反正弦分布
设 ,则 服从反正弦分布.
- pdf:
- cdf:
- 反正弦分布式是 Beta 分布的特例,后者是定义在有限集合上的分布,其密度函数具有非常丰富的形状.
Pareto 分布
设 ,则 服从 Pareto 分布.
- pdf:
- cdf:
- Pareto 分布广泛用于描述资源(例如收入和财富)的分布,是微观经济学中最重要的概率分布之一.