[关闭]
@evilking 2018-05-01T22:52:40.000000Z 字数 11916 阅读 2783

时间序列篇

AR模型

定义

具有如下结构的模型称为 阶自回归模型,简记为 :

模型有三个限制条件:
条件一: . 这个限制条件保证了模型的最高阶数为 .

条件二: .这个限制条件实际上是要求随机干扰序列 为零均值白噪声序列.

条件三: . 这个限制条件说明当期的随机干扰与过去的序列值无关.

通常会缺省默认的限制条件,把模型简记为:

时,自回归模型又称为中心化 模型.

非中心化 序列都可以通过下面的变化转化为中心化 序列.令

的中心化序列.中心化变换实际上就是非中心化序列整体平移了一个常数位移,这种整体移动对序列值之间的相关关系没有任何影响.

引进延迟算子,中心化 模型又可以简记为:

式中,,称为 阶自回归系数多项式.


模型平稳性判别

特征根判别

任一中心化 模型 都可以被视为一个非齐次线性差分方程:

方程的通解为:
式中,为齐次线性差分方程 的通解;为上述非齐次线性差分方程的一个特解.

  1. 求齐次线性差分方程 的一个通解. 假定 是该特征方程的 个特征根.为了有代表性,不妨假设这 个特征根取值如下:
    个相等实根.
    个互不相等的实根.
    对共轭复根.
    那么齐次线性差分方程 的通解为:

    式中, 为任意实数.

  2. 求非齐次线性差分方程 的一个特解 . 首先,可以证明 模型的自回归系数多项式 的根是齐次线性差分方程 的特征根的倒数.
    证明: 设 为齐次线性差分方程 个特征根,任取 带入特征方程,有

    带入 模型的自回归系数多项式中,有

    根据这个性质,可以因子分解成

    由此可以得到非齐次线性差分方程的一个特解为:
    式中, 为常数.

  3. 求非齐次线性差分方程的通解

要使得中心化 模型平稳,即要求对任意实数 ,有

要使该式子成立的充要条件是
实际上就是要求 模型的 个特征根都在单位圆内.所以 模型平稳的充要条件是它的 个特征根都在单位圆内.

根据特征根和自回归系数多项式的根成倒数的关系,AR模型平稳的等价判别条件是该 AR 模型的自回归系数多项式的根,即 的根,都在单位圆外.


平稳域判别

对于一个 模型而言,如果没有平稳性的要求,实际上也就意味着对参数向量 没有任何限制,它们可以取遍 维欧式空间中的任意一点,但是如果加上平稳性限制,参数向量 就只能取 维欧式空间的一个子集,使得特征根都在单位圆内的系数集合

称为 模型的平稳域.

下面以低阶 模型用平稳域的方法判别模型的平稳性为例来说明:

  1. 模型的平稳域
    模型为: ,其特征方程为: ,特征根为: ,根据 模型平稳的充要条件,容易推出 模型平稳的充要条件是

    所以, 模型的平稳域就是: .

  2. 模型的平稳域
    模型为: ,其特征方程为: ,特征根为: 根据 模型的平稳的充要条件,模型平稳的充要条件是

    根据一元二次方程的性质和 模型的平稳条件,有

    可以导出:

    这三个限制条件意味着 模型的平稳域是一个三角形区域,

ar1


平稳 模型的统计性质

均值

假如 模型满足了平稳性条件,在等式两边取期望,得

根据平稳序列均值为常数的性质,有 ,且因为 为白噪声序列,有 ,所以有
求得:
特别地,对于中心化 模型,有


方差

Green函数

为平稳 模型的特征根,则平稳 模型可以写成如下形式:

式中,

上式称为 模型的传递形式,系数 称为 函数.因为 都在单位圆内,所以 函数应该呈指数下降,且 通过待定系数法,可以确定 函数的递推公式.

,则中心化 模型可以简记为:

把上式带入 模型 ,得到
展开上式,得
整理得:
根据待定系数法,有
由此可以得到 函数递推公式:
式中


平稳 模型的方差

对平稳 模型等式两边求方差,有

式中, 为白噪声序列;,所以
因为 呈指数下降,所以 ,这说明平稳序列 方差有界,等于常数


协方差函数

在平稳模型 等号两边同乘 ,再求期望,得

因为,于是可以得到如下自协方差函数的递推方式:


自相关系数

平稳 模型自相关系数递推公式

由于 ,在自协方差函数的递推公式等号两边同除以方差函数 ,就得到自相关系数的递推公式:

容易验证平稳 模型的自相关系数递推公式为:
平稳 模型的自相关系数递推公式为:


自相关系数的性质

平稳 模型的自相关系数有两个显著的性质:
1. 一是拖尾性;
2. 二是呈指数衰减.

根据自相关系数的递推公式,模型的自相关系数的表达式实际上是一个 阶齐次差分方程.那么滞后任意 阶的自相关系数的通解为:

式中,为该差分方程的特征根; 为任意常数,如果已知任意 个自相关系数的值就可以确定 的解,显然 不能全为零.

通过这个通解形式,容易推出 始终有非零取值,不会在 大于某个常数之后就恒等于零,这个性质就是拖尾性.

可以直观的解释 模型自相关系数拖尾的原因.对于一个平稳 模型:

虽然他的表达式显示 只受当期随机误差 和最近 期序列值 的影响,但是由于 的值又依赖于 ,所以实际上 也有影响,依次类推,之前的每一个序列值 都会对 构成影响.自回归模型的这种特性体现在自相关系数上就是自相关系数的拖尾性.

同时随着时间的推移, 会迅速衰减,因为 ,所以 时,,继而导致 ,而且这种影响是以指数 的速度在衰减.

这种特性表明对平稳序列而言,通常只有近期的序列值对现时值的影响比较明显,间隔越远的过去值对现时值的影响越小.


偏自相关系数

偏自相关系数的定义

对于一个平稳 模型,求出滞后 自相关系数 时,实际上得到的并不是 之间单纯的相关关系.因为 同时还会受到中间 个随机变量 的影响,而这 个随机变量又都和 具有相关关系,所以自相关系数 里实际上掺杂了其他变量对 的相关影响.为了能单纯的测度 的影响,引进偏自相关系数的概念.


对于平稳序列 ,所谓滞后 偏自相关系数,就是指在给定中间 个随机变量 的条件下,或者说,在剔除了中间 个随机变量 的干扰之后, 相关影响的度量.

公式化描述为

式中,,这就是滞后 偏自相关系数的定义.


偏自相关系数的计算

假定 为中心化平稳序列,用过去的 期序列值 阶自回归拟合,即

式中,,对 取条件期望,记
已知,所以
则有
那么
在等式两边同时乘以 ,并求期望:
因为 ,所以
所以上式等于
由此得出
等号右边的结果正好等于滞后 偏自相关系数的定义式.

这说明滞后 偏自相关系数实际上就等于 阶自回归模型第 个回归系数 的值,根据这个性质就容易计算偏自相关系数的值.


在对 阶自回归拟合方程中,两边同时乘以 ,并求期望,得

取前 个方程构成的方程组:
该方程组称为 方程.通过解该方程组,可以得到参数 的解,参数向量中最后一个参数的解,即为滞后 偏自相关系数 的值.

用矩阵形式表示为:


根据线性方程组求解的 法则,有
式中

为矩阵形式中系数矩阵的行列式, 是把 中的第 个列向量换成矩阵形式中等号右边的自相关系数向量后构成的矩阵行列式.


偏自相关系数的截尾性

可以证明: 平稳 模型的偏自相关系数具有 步截尾性.所谓 步截尾是指, 要证明这一点实际上只要证明当 时, 即可.

证明:

对任一 模型

有如下 方程成立:
为系数矩阵中 个列向量, 为式中等号右边的自相关系数向量,即
则有
因为 模型限制条件之一是 ,所以向量 一定可以表示成向量 的非零线性组合.

显然 的前 个列向量正好就是 ,而最后一个列向量正好就是向量 ,根据计算公式,说明在行列式中最后一个列向量可以用另外 个列向量的线性组合表示.根据行列式的性质,具有这种线性相关关系的行列式的值一定为零,即 .由 等级推出 .

证毕.


由此证明了 模型偏自相关系数的 步截尾性.这个性质连同前面的自相关系数拖尾性是 模型识别的重要依据.


R程序演示模型

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注