[关闭]
@donghanyuan0609 2021-01-04T13:58:44.000000Z 字数 27218 阅读 596

概率统计A 期末总结

前五章 概率论部分

概率

事件的交并差(跟集合运算差不多),条件概率,相互独立

"n次抽取,放回与不放回"问题:不论放回与否,第n次抽中红球的概率都和第一次一样。(用全概率来推)

例:r个红球b个黑球,每次抽一个,然后补充c个与抽中颜色相同的球,问第n次抽中红球的概率
(答案是,与n和c无关,可以用归纳法,由全概率公式去递推)

看一下全概率公式,还有贝叶斯公式。(全概率比较好理解,贝叶斯最好看一下免得突然考)

随机变量

离散型随机变量,连续型随机变量。

牢记一下分布函数的概念:。有时候求分布函数要从概率意义出发用定义来求。
(2020考研题,双路独立用MUX(服从二点分布)选出一路,,求分布函数以及证明

分布函数的性质:单调不减,.

分布律(分布列),概率密度函数。

二维联合分布函数:
联合分布(函数),边沿分布(函数);联合密度函数,边沿密度函数;条件分布函数/条件分布律/条件概率密度。

联合分布函数:;边沿分布函数:;联合密度函数;边沿密度函数:

边沿与联合的关系:, .

条件分布律:
条件分布函数: ; ;(注意这是个极限,书P84)
条件概率密度:条件,需要;反过来 ;

符号表示:在的条件下的条件(分布律/分布函数/概率密度)。注意"在条件下"暗含的限制。

相互独立:。(密度函数乘积只需"几乎处处相等")

多个随机变量的函数的独立:若相互独立,则相互独立(两个式子不共用相同的随机变量,就可以相互独立)
,且相互独立,则相互独立

标准化随机变量,满足

正态分布

一维概率密度函数:


标准正态分布密度函数:,分布函数
表示标准正态分布的分布函数,可以直接写)

标准正态分布分位点:下侧分位点;上侧分位点双侧分位点

欧拉泊松积分:

数字特征:
中心2k阶矩():,例如

正态分布的绝对值:对于,其概率密度函数
(原本的密度函数只保留一边且翻倍),其数字特征可以记住: .
中心2k+1阶绝对矩():

二维正态分布:。其中为相关系数。


密度函数不好背可以记其矩阵形式:(n维正态分布)

式子中,为随机列向量,为期望列向量,为协方差矩阵。

(对于二维)其中

正态分布的性质:

  1. 线性性质,正态分布的线性组合仍然是正态分布,期望和方差分别按照各自的性质。
  2. 在正态分布中"独立"等价于"不相关",即

几种常见的随机变量分布

离散型随机变量

。其中
要会计算(合并,二项式定理),参考结果: (18-19,16-17往年题里均有)

求和性质:

。其中
与二项分布关系:当n很大p很小时,用于逼近二项分布。

求和性质:

正品件,次品件,从中取件,正品数量件:。其中 .
(公式不要记,用古典概型-事件空间角度理解,自己推)
注意看清N是总数还是次品!(黑球白球问题同理)

数学期望:为次品数则为总数则

连续型随机变量

概率密度函数:,分布函数

数字特征:

随机变量函数的分布

离散型没什么好说的,列出分布列然后合并同类项就可以。

连续型主要是找对积分区间,对自变量的概率密度求积分,得到因变量的分布函数。先有分布函数再求导就可以得到概率密度函数。
即:

P105定理:一维随机变量,密度函数单调函数,则


其中的反函数,有
应用上述定理时必须是单调函数。如果是分段单调也可分割区间分别处理。

绝对值,对于正态分布,其概率密度函数变两倍,只取右边。

几个二维随机变量函数的分布(P111-114)

,积分区域为直线以下的区域。如果是无穷区域,用换元后Fubini换序积分,得 ,此积分可转化为曲线积分 计算,其中直线 沿增加的方向。同理
对于有限区域直接(分段)算二重积分或者曲线积分就行,不用背公式。


分布函数,对于n个独立同分布变量,


分布函数,对于n个独立同分布变量,

随机变量的数字特征

随机变量的期望:连续型,离散型 .

随机变量函数的期望:连续型 ,离散型
(直接在期望公式中把X替换即可,概率/概率密度项不动。)

离散型随机变量函数的期望,计算时可能涉及级数(几何级数,泰勒级数,逐项积分/求导),二项式定理。

例:已知几何分布,求。(几何级数)

解: .
其中最后一步依据为几何级数,收敛半径为1,而 在收敛域内。

例:已知二项分布,求。(二项式定理)

解:

例:已知泊松分布,证明期望,且判断的关系(的泰勒级数)

解:
,其中最后一步由指数函数的泰勒级数得到。

下面比较的大小关系:,由于 ,所以,即 。(18-19上)

方差的计算公式:

期望的线性性质:
数乘
相加 不需要相互独立),
线性组合 (不用独立)

乘积的期望(要求相互独立

方差性质:(并不保线性)
系数平方
平移不变
相加 (此时要求相互独立
线性组合 (相互独立)

矩的概念

原点矩,中心矩;k阶矩;绝对矩;混合矩;

协方差

协方差定义:

计算公式:
用期望:
用方差:,(别忘了公式里有个2倍)

性质:
对称
倍乘
相加
方差

相关系数

定义:

表示两随机变量的线性相关程度,恒成立。是无量纲数。
:正线性;:负线性;:正相关;:负相关;:不相关。
注意:不相关不一定相互独立。反例:非矩形形状的均匀分布,不满足
对于正态分布 不相关即为相互独立。

代入标准化随机变量有:

协方差矩阵

二维随机向量:,n维:

几个不等式

六七八九章 数理统计部分

第六章

切比雪夫不等式

导出形式:
意义:用二阶偏差"控制"一阶偏差。

大数定律

切比雪夫大数定律

一列相互独立的随机序列,令
由方差一致有界()得:,或

注:方差一致有界的条件可以放松,只要的低阶无穷大即可()。

依概率收敛,记为

辛钦大数定律

独立同分布,,则

伯努利大数定律

伯努利n次独立重复试验,表示事件A发生的次数,p为A发生的概率,则

中心极限定理

随机序列独立同分布,
,当n充分大时,近似地有:

棣莫弗-拉普拉斯定理

伯努利n次独立重复试验,表示事件A发生次数,p是事件A发生的概率,则


理解:由二项分布,;由中心极限定理,,即得上式。

一个便于记忆的形式:


(其中M和N均为整数,代表一个"事件发生次数";
上面这个约等式也可以是单边概率,即

本部分题型主要参考课后题,一般就是用定理去估计一件事的概率,或者是给定概率求N之类的。

第七章 统计总体与样本

样本统计量

样本均值:
样本方差:,(注意分母是)!!!
(k阶原点、中心矩:)注意

样本统计量的数字特征:。(任何分布的总体都可以)

样本统计量的分布(正态,卡方,t,F)

此处只针对正态总体。

四种分布

n路标准正态分布()之和服从自由度为n的卡方分布,
,则

标准正态的平方是卡方分布:

形式:,期望和方差不用知道。

形式:,t分布的平方是F分布(

统计量的分布

正态:
标准正态:

卡方:
一对自由度差异:。(用正态线性函数的结论)

t分布:

F分布:

对于正态总体 ,设其样本均值为 ,样本方差为 ,则有 相互独立。

参数的点估计

矩估计

一个参数:直接用EX。注意:如果能直接估计出来,不要先估计再平方,会有累积误差。

两个参数:,或都可以(第一种最好,第二种不是无偏估计)

极大似然估计

构造似然函数,找到使得取最大值的。一般情况下令,也有特殊情况无法求导处理。

似然函数的构造:离散型 ,连续型
(把所有样本的概率/概率密度全乘起来)

可以求导的典型例子:指数分布;不能求导的典型例子:均匀分布

常考的可以求导的形式:,其中P,Q均为含的仅乘除的式子(单项式或者分式),例如指数分布。

不能用求导的例子P203:

点估计的优良性

一些结论:(设总体期望为,总体方差为

区间估计与假设检验

我把这两块写到一起了,因为他们的本质和用到的方法都是一样的。

区间估计里的"置信概率":;假设检验里的"检验水平(显著性水平)":;这两者里的是等价的。

假设检验要按步骤写,写原假设和备择假设;选取检验用的统计量;确定检验水平和拒绝域;代入样本值检验。

假设检验的两类错误:错误拒绝H0(第一类),错误接受H0(第二类)。第一类错误的概率要会算(和有关)

大体上分为三类:知(总体)方差检验期望,未知方差检验期望,检验方差。(选取的统计量和分布不同)
每种检验/估计分为双边、左边、右边。(选取双侧分位点或下侧/上侧分位点)

选取的统计量:,服从的分布:

双侧假设检验:,双侧置信区间:

左边检验():;置信区间:.
右边检验():;置信区间:.

选取的统计量:,服从的分布:。(注意自由度,是n-1)

双侧假设检验:,双侧置信区间:

选取的统计量:,服从的分布:。(注意自由度,是n-1)

双侧假设检验:,双侧置信区间:,双侧置信区间:

卡方这里分位点选取并不唯一,也可以选,只要保证两个的系数(的绝对值)加起来等于一就可以。(或者两个系数相减等于,本质一样)

此部分考试的注意要点

根据往年题经验,一般是考一个选择题,让判断一个随机变量(统计量)在某区间里的概率对不对。判断起来并不难,主要就是看选取的统计量和采用的分位点分布种类是否匹配。比如说如果统计量搭配了正态分布分位点肯定是不对的。然后就是双侧分位点选取的灵活处理。题目有可能不是用的两边对称的双侧分位点,这时候可以简单画图验证一下。
(正态分布和t分布都是单峰对称的,,而卡方分布是单峰不对称的,。)
先排除统计量与分布对应不上的,再看分位点选取是否正确。

最后三章 随机过程部分

随机过程

随机过程,相当于"一族"随机变量,与样本和时间有关()。
样本(函数):固定保留时间变化,即;是个关于t的函数
状态(变量):固定t保留样本变化,即;是个随机变量

状态空间:,即的值域。样本空间;参数集:参数取值范围。

随机序列:参数离散的情况,即

n维分布函数;两个随机过程的有限维联合分布函数;要会写一维和二维

独立过程(任何n个状态都独立)

数字特征

单个过程
(对于二阶矩存在的过程,只要知道就可以确定其他三个)

两个过程

两过程相互独立:
任意时刻不相关。

平稳过程

严平稳

条件:
(1)一维分布函数不依赖于参数t;
(2)二维分布函数仅依赖于参数间距

性质:
(1)与时间t无关;
(2)只与间距有关,与的原点选取无关。

严平稳过程举例:伯努利序列。

广义平稳

条件:
(1)原点二阶矩存在
(2)期望为常数
(3)自相关函数只与有关,与无关

性质:前三个数字特征都是常数;后两个数字特征只与间距有关。
; 均为偶函数.

平稳(时间)序列:参数为整数或者可列;

两个平稳的关系:
严平稳+二阶矩存在=广义平稳;广义平稳不一定严平稳;严平稳不一定广义平稳(二阶矩不一定存在)

两个平稳过程之间的关系:
(1)联合平稳过程:;此时
(2)标准互协方差:,等于零时则两个平稳过程不相关。

注:检验(广义)平稳过程,一定要说明二阶矩存在且有限(直接代说明即可,但不能不写)!

正态(平稳)过程

正态过程:都有服从正态分布;
正态序列;独立正态过程;

正态平稳过程:正态过程为(广义)平稳过程。

记个结论:正态过程其中,满足,则:

  1. 一维分布:
  2. 二维分布:.

遍历过程

时间均值和时间相关函数的概念

对于单边的情况(),将换成即可。

平稳过程的各态遍历性

满足两个各态遍历性:遍历过程

确定遍历过程的数字特征:只需获得一个样本函数即可。

书上的例子:

  1. 随机相位正弦波.
  2. 随机相位周期过程,周期为.

例4:平稳过程以T为周期,则

不是遍历过程的平稳过程:是个随机变量。

各态遍历性判别定理

给一个随机过程

随机正弦波的性质

随机正弦波基本形式:,其中都是随机变量(随机振幅,随机相位)或者常数。
(这里写成sin和cos都等价,书上都写的余弦,这里就写余弦了)

随机相位:

其中为随机变量,一般题目会给均匀分布,也可能是其他的。

如果是,则数字特征(即)里出现的地方换成 (要相互独立),时间均值和时间相关函数里的换成(当心,如果振幅是随机的,则自相关函数不一定具有各态遍历性!)

随机振幅:

一般来说会给正态分布或者均匀分布,然后一般还会给

三角函数和差化积与积化和差

这里因为用到了,就稍微提一下,能背下来最好,实在背不下来可以现场推导。

如果要推导的话首先要牢记和角差角公式:


还有变换:

对于和差化积,以为例,令,套cos的和差角公式,
得到,然后由.

对于积化和差,以为例,令,还是套cos的和差角公式,
.

马尔可夫链

本章讨论的随机过程的状态空间是有限或可列集(或者说是离散型随机变量)
为一个状态;状态数就是看j有几个取值,题目可能给转移矩阵问状态数,就是阶数)

马尔可夫链定义(马尔可夫性):也称"无后效性",将来时刻只与现在时刻有关,与过去无关


转移概率,角标表示n步转移,表示起始时刻。
书上写的含义:在时刻时由状态经过步转移到达状态的(步转移)概率。

性质:非负性 ,规范性:.

齐次马尔可夫链:一步转移概率不依赖于起始时刻.

转移矩阵,其元素均非负,且每行和为1.

例:伯努利序列,,转移矩阵为

科尔莫戈罗夫-查普曼方程.
对于齐次马尔可夫链,通常使用矩阵形式,,n步转移矩阵就是1步转移矩阵的n次方。

有限维概率分布:由初始时刻分布与转移概率确定。

平稳分布:(存在)满足,且.
求法:为转移矩阵的特征值为对应的特征向量。(可能多于一个,也可能没有)
求出特征向量后注意要归一化(所有元素之和为1)。(这部分有点类似于线性代数)

求平稳分布的一个例子(2018-2019春 解答题五),转移概率矩阵 .
解:将为特征值的特征矩阵为 写出,并进行初等变换:


为自由变量,可得 ,即,基础解系只有一个线性无关的向量,将其"归一化"并转置得:
平稳分布为 .

几个齐次马尔可夫链模型(书上的例题):

  1. 伯努利独立重复试验
  2. 一维粒子随机游走
  3. 01电报机

补充

这部分内容也不知道放哪比较好,就是做往年题时记下来的一些点。

例:(18-19春 解答题三)客车载20人,一共10个车站。如果某站没人下车则客车通过该站不停车,每位乘客在各个车站下车是等可能的,且下车与否相互独立 不受别人影响。记为停车次数,求
(本题并非伯努利独立重复试验,但依旧可以采用类似于伯努利的做法,先求每个子事件,再合并)
解:设表示第站是否有人下车(是则取1否则取0),则某站没人下车的概率为,而,所以
某一站没人下车:即每一个人(20次方)都选择其他车站(),所以是
这道题的并非伯努利独立重复序列,即不是相互独立的,
因为,但是由于此题只让计算期望,而期望的可加性不需要相互独立,,所以依旧可以拆分子事件算期望最后求和。

orz

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注