@donghanyuan0609
2021-01-04T21:58:44.000000Z
字数 27218
阅读 678
事件的交并差(跟集合运算差不多),条件概率,相互独立。
"n次抽取,放回与不放回"问题:不论放回与否,第n次抽中红球的概率都和第一次一样。(用全概率来推)
例:r个红球b个黑球,每次抽一个,然后补充c个与抽中颜色相同的球,问第n次抽中红球的概率
(答案是,与n和c无关,可以用归纳法,由全概率公式去递推)
看一下全概率公式,还有贝叶斯公式。(全概率比较好理解,贝叶斯最好看一下免得突然考)
离散型随机变量,连续型随机变量。
牢记一下分布函数的概念:。有时候求分布函数要从概率意义出发用定义来求。
(2020考研题,双路独立用MUX(服从二点分布)选出一路,,求分布函数以及证明)
分布函数的性质:单调不减,,.
分布律(分布列),概率密度函数。
二维联合分布函数: 。
联合分布(函数),边沿分布(函数);联合密度函数,边沿密度函数;条件分布函数/条件分布律/条件概率密度。
联合分布函数:或;边沿分布函数:、;联合密度函数或;边沿密度函数:、;
边沿与联合的关系:, ;, .
条件分布律: ; ;
条件分布函数: ; ;(注意这是个极限,书P84)
条件概率密度:条件下的 ,需要;反过来 ;符号表示:在的条件下的条件(分布律/分布函数/概率密度)。注意"在条件下"暗含或的限制。
相互独立:,。(密度函数乘积只需"几乎处处相等")
多个随机变量的函数的独立:若相互独立,则,相互独立(两个式子不共用相同的随机变量,就可以相互独立)
若,,且相互独立,则与相互独立
标准化随机变量:,满足。
一维概率密度函数:
标准正态分布分位点:下侧分位点,;上侧分位点, ;双侧分位点, 。
欧拉泊松积分:
数字特征:,, 。
中心2k阶矩():,例如 。
正态分布的绝对值:对于 且 ,其概率密度函数 ,
(原本的密度函数只保留一边且翻倍),其数字特征可以记住:, .
中心2k+1阶绝对矩():。
二维正态分布:。其中为相关系数。
(对于二维)其中 ,,,, 。
正态分布的性质:
,,,。其中,。
要会计算(和合并,二项式定理),参考结果: (18-19,16-17往年题里均有)
求和性质:。
,,。其中。
与二项分布关系:当n很大p很小时,用于逼近二项分布。
求和性质:。
正品件,次品件,从中取件,正品数量件:。其中 .
(公式不要记,用古典概型-事件空间角度理解,自己推)
注意看清N是总数还是次品!(黑球白球问题同理)
数学期望:为次品数则,为总数则。
概率密度函数:,分布函数 。
数字特征:, 。
离散型没什么好说的,列出分布列然后合并同类项就可以。
连续型主要是找对积分区间,对自变量的概率密度求积分,得到因变量的分布函数。先有分布函数再求导就可以得到概率密度函数。
即:,。
P105定理:一维随机变量,密度函数,,为单调函数,则
绝对值,对于正态分布,其概率密度函数变两倍,只取右边。
几个二维随机变量函数的分布(P111-114)
,积分区域为直线以下的区域。如果是无穷区域,用换元后Fubini换序积分,得 ,此积分可转化为曲线积分 计算,其中直线 沿增加的方向。同理
对于有限区域直接(分段)算二重积分或者曲线积分就行,不用背公式。
,
分布函数,对于n个独立同分布变量,。
,
分布函数,对于n个独立同分布变量, 。
随机变量的期望:连续型,离散型 .
随机变量函数的期望:连续型 ,离散型
(直接在期望公式中把X替换即可,概率/概率密度项不动。)
离散型随机变量函数的期望,计算时可能涉及级数(几何级数,泰勒级数,逐项积分/求导),二项式定理。
例:已知几何分布,求。(几何级数)
解: .
其中最后一步依据为几何级数,收敛半径为1,而 在收敛域内。例:已知二项分布,求。(二项式定理)
解: 。
例:已知泊松分布,证明期望,且判断与的关系(的泰勒级数)
解:
,其中最后一步由指数函数的泰勒级数得到。
而 ,
下面比较和的大小关系:,,由于, ,所以,,,即 。(18-19上)
方差的计算公式:
期望的线性性质:
数乘 ,
相加 (不需要相互独立),
线性组合 (不用独立)
乘积的期望: (要求相互独立)
方差性质:(并不保线性)
系数平方 ,
平移不变 ,
相加 (此时要求相互独立)
线性组合 (相互独立)
原点矩,中心矩;k阶矩;绝对矩;混合矩;
协方差定义:
计算公式:
用期望:,
用方差:,(别忘了公式里有个2倍)
性质:
对称 ,
倍乘 ,
相加 ,
方差
定义: 。
表示两随机变量的线性相关程度,恒成立。是无量纲数。
:正线性;:负线性;:正相关;:负相关;:不相关。
注意:不相关不一定相互独立。反例:非矩形形状的均匀分布,不满足。
对于正态分布: 不相关即为相互独立。
代入标准化随机变量有: 。
二维随机向量:,n维:。
导出形式: 。
意义:用二阶偏差"控制"一阶偏差。
一列相互独立的随机序列,令。
由方差一致有界()得:,或 。
注:方差一致有界的条件可以放松,只要是的低阶无穷大即可()。
依概率收敛:,记为。
独立同分布,,,则 ()
伯努利n次独立重复试验,表示事件A发生的次数,p为A发生的概率,则。
随机序列独立同分布,,。
令,当n充分大时,近似地有:, 。
伯努利n次独立重复试验,表示事件A发生次数,p是事件A发生的概率,则,
一个便于记忆的形式:
本部分题型主要参考课后题,一般就是用定理去估计一件事的概率,或者是给定概率求N之类的。
样本均值:,
样本方差:,(注意分母是)!!!
(k阶原点、中心矩:,)注意。
样本统计量的数字特征:,;。(任何分布的总体都可以)
此处只针对正态总体。
n路标准正态分布()之和服从自由度为n的卡方分布,。
若,则,。。
标准正态的平方是卡方分布:则。
形式:,期望和方差不用知道。
形式:,t分布的平方是F分布(,)
正态:, ,
标准正态:,,
卡方:,。
一对自由度差异:,。(用正态线性函数的结论)
t分布: ,
,,
F分布:
对于正态总体 ,设其样本均值为 ,样本方差为 ,则有 与 相互独立。
一个参数:直接用EX。注意:如果能直接估计出来,不要先估计再平方,会有累积误差。
两个参数:,,或都可以(第一种最好,第二种不是无偏估计)
构造似然函数,找到使得取最大值的。一般情况下令,也有特殊情况无法求导处理。
似然函数的构造:离散型 ,连续型 。
(把所有样本的概率/概率密度全乘起来)
可以求导的典型例子:指数分布;不能求导的典型例子:均匀分布
常考的可以求导的形式:,其中P,Q均为含与的仅乘除的式子(单项式或者分式),例如指数分布。
不能用求导的例子P203: , 。
一些结论:(设总体期望为,总体方差为)
我把这两块写到一起了,因为他们的本质和用到的方法都是一样的。
区间估计里的"置信概率":;假设检验里的"检验水平(显著性水平)":;这两者里的是等价的。
假设检验要按步骤写,写原假设和备择假设;选取检验用的统计量;确定检验水平和拒绝域;代入样本值检验。
假设检验的两类错误:错误拒绝H0(第一类),错误接受H0(第二类)。第一类错误的概率要会算(和有关)
大体上分为三类:知(总体)方差检验期望,未知方差检验期望,检验方差。(选取的统计量和分布不同)
每种检验/估计分为双边、左边、右边。(选取双侧分位点或下侧/上侧分位点)
选取的统计量:,服从的分布:。
双侧假设检验:,双侧置信区间:。
左边检验():;置信区间:.
右边检验():;置信区间:.
选取的统计量:,服从的分布:。(注意自由度,是n-1)
双侧假设检验:,双侧置信区间:。
选取的统计量:,服从的分布:。(注意自由度,是n-1)
双侧假设检验:,双侧置信区间:,双侧置信区间:。
卡方这里分位点选取并不唯一,也可以选,只要保证两个的系数(的绝对值)加起来等于一就可以。(或者两个系数相减等于,本质一样)
根据往年题经验,一般是考一个选择题,让判断一个随机变量(统计量)在某区间里的概率对不对。判断起来并不难,主要就是看选取的统计量和采用的分位点分布种类是否匹配。比如说如果统计量搭配了正态分布分位点肯定是不对的。然后就是双侧分位点选取的灵活处理。题目有可能不是用的两边对称的双侧分位点,这时候可以简单画图验证一下。
(正态分布和t分布都是单峰对称的,,而卡方分布是单峰不对称的,。)
先排除统计量与分布对应不上的,再看分位点选取是否正确。
随机过程,相当于"一族"随机变量,与样本和时间有关()。
样本(函数):固定保留时间变化,即;是个关于t的函数
状态(变量):固定t保留样本变化,即;是个随机变量
状态空间:,即的值域。样本空间;参数集:参数取值范围。
随机序列:参数离散的情况,即。
n维分布函数;两个随机过程的有限维联合分布函数;要会写一维和二维 。
独立过程(任何n个状态都独立)
单个过程
(对于二阶矩存在的过程,只要知道和就可以确定其他三个)
期望:;
二阶矩:;;
两个过程
两过程相互独立:;
任意时刻则与不相关。
条件:
(1)一维分布函数不依赖于参数t;
(2)二维分布函数仅依赖于参数间距;
性质:
(1),,与时间t无关;
(2),只与间距有关,与的原点选取无关。
()
严平稳过程举例:伯努利序列。
条件:
(1)原点二阶矩存在
(2)期望为常数
(3)自相关函数只与有关,与无关
性质:前三个数字特征都是常数;后两个数字特征只与间距有关。
注 ,; 与均为偶函数.
平稳(时间)序列:参数为整数或者可列;
两个平稳的关系:
严平稳+二阶矩存在=广义平稳;广义平稳不一定严平稳;严平稳不一定广义平稳(二阶矩不一定存在)
两个平稳过程之间的关系:
(1)联合平稳过程:;此时。
(2)标准互协方差:,等于零时则两个平稳过程不相关。
注:检验(广义)平稳过程,一定要说明二阶矩存在且有限(直接代说明即可,但不能不写)!
正态过程:都有服从正态分布;
正态序列;独立正态过程;
正态平稳过程:正态过程为(广义)平稳过程。
记个结论:正态过程其中,满足,则:
对于单边的情况(,),将换成即可。
满足两个各态遍历性:遍历过程。
确定遍历过程的数字特征:只需获得一个样本函数即可。
书上的例子:
例4:平稳过程的以T为周期,则,。
不是遍历过程的平稳过程:,是个随机变量。
给一个随机过程,
随机正弦波基本形式:,其中都是随机变量(随机振幅,随机相位)或者常数。
(这里写成sin和cos都等价,书上都写的余弦,这里就写余弦了)
其中为随机变量,一般题目会给均匀分布或,也可能是其他的。
如果是,则数字特征(即)里出现的地方换成 (和要相互独立),时间均值和时间相关函数里的换成(当心,如果振幅是随机的,则自相关函数不一定具有各态遍历性!)
一般来说会给正态分布或者均匀分布,然后一般还会给。
三角函数和差化积与积化和差
这里因为用到了,就稍微提一下,能背下来最好,实在背不下来可以现场推导。
如果要推导的话首先要牢记和角差角公式:
还有变换:,。对于和差化积,以为例,令,,套cos的和差角公式,
得到,然后由得.对于积化和差,以为例,令,,还是套cos的和差角公式,
得.
本章讨论的随机过程的状态空间是有限或可列集(或者说是离散型随机变量)
(为一个状态;状态数就是看j有几个取值,题目可能给转移矩阵问状态数,就是阶数)
马尔可夫链定义(马尔可夫性):也称"无后效性",将来时刻只与现在时刻有关,与过去无关
性质:非负性 ,规范性:.
齐次马尔可夫链:一步转移概率不依赖于起始时刻.
转移矩阵:,其元素均非负,且每行和为1.
例:伯努利序列,,转移矩阵为 。
科尔莫戈罗夫-查普曼方程:.
对于齐次马尔可夫链,通常使用矩阵形式,,n步转移矩阵就是1步转移矩阵的n次方。
有限维概率分布:由初始时刻分布与转移概率确定。
平稳分布:(存在)满足的,且.
求法:为转移矩阵的特征值为对应的特征向量。(可能多于一个,也可能没有)
求出特征向量后注意要归一化(所有元素之和为1)。(这部分有点类似于线性代数)
求平稳分布的一个例子(2018-2019春 解答题五),转移概率矩阵 .
解:将为特征值的特征矩阵为 写出,并进行初等变换:
令为自由变量,可得 ,即,基础解系只有一个线性无关的向量,将其"归一化"并转置得:
平稳分布为 .
几个齐次马尔可夫链模型(书上的例题):
这部分内容也不知道放哪比较好,就是做往年题时记下来的一些点。
例:(18-19春 解答题三)客车载20人,一共10个车站。如果某站没人下车则客车通过该站不停车,每位乘客在各个车站下车是等可能的,且下车与否相互独立 不受别人影响。记为停车次数,求。
(本题并非伯努利独立重复试验,但依旧可以采用类似于伯努利的做法,先求每个子事件,再合并)
解:设表示第站是否有人下车(是则取1否则取0),则某站没人下车的概率为, ,而,所以。
某一站没人下车:即每一个人(20次方)都选择其他车站(),所以是。
这道题的并非伯努利独立重复序列,即 时与不是相互独立的,
因为,但是由于此题只让计算期望,而期望的可加性不需要相互独立,,所以依旧可以拆分子事件算期望最后求和。
orz