第13章状态空间模型和卡尔曼滤波(第三版)

上传人：6*** IP属地：湖北上传时间：2021-11-03 格式：PPT 页数：95 大小：780KB 积分：28 举报 版权申诉

已阅读5页，还剩90页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1 上世纪上世纪60年代初，由于工程控制领域的需要，产生了卡尔曼滤年代初，由于工程控制领域的需要，产生了卡尔曼滤波波 (Kalman Filtering)。进入。进入70年代初，人们明确提出了状态空间年代初，人们明确提出了状态空间模型的标准形式，并开始将其应用到经济领域。模型的标准形式，并开始将其应用到经济领域。80年代以后，状态年代以后，状态空间模型已成为一种有力的建模工具。空间模型已成为一种有力的建模工具。许多时间序列模型，包括典许多时间序列模型，包括典型的线性回归模型和型的线性回归模型和ARIMA模型都能作为特例写成状态空间的形模型都能作为特例写成状态空间的形式，并估计参数值。在计量经济

2、学文献中，状态空间模型被用来估式，并估计参数值。在计量经济学文献中，状态空间模型被用来估计不可观测的时间变量：理性预期，测量误差，长期收入，不可观计不可观测的时间变量：理性预期，测量误差，长期收入，不可观测因素（趋势和循环要素）。状态空间模型在经济计量学领域其他测因素（趋势和循环要素）。状态空间模型在经济计量学领域其他方面的大量应用请参见方面的大量应用请参见 Harvey（1989）和）和 Hamilton（1994）。 2 在一般的统计模型中出现的变量都是可以观测到的，这些模在一般的统计模型中出现的变量都是可以观测到的，这些模型以反映过去经济变动的时间序列数据为基础，利用回归分析或型以反映

3、过去经济变动的时间序列数据为基础，利用回归分析或时间序列分析等方法估计参数，进而预测未来的值。状态空间模时间序列分析等方法估计参数，进而预测未来的值。状态空间模型的特点是提出了型的特点是提出了“”这一概念。这一概念。而实际上，无论是工程控制问题中出现的某些状态（如导弹而实际上，无论是工程控制问题中出现的某些状态（如导弹轨迹的控制问题）还是经济系统所存在的某些状态都是一种不可轨迹的控制问题）还是经济系统所存在的某些状态都是一种不可观测的变量，正是这种观测不到的变量反映了系统所具有的真实观测的变量，正是这种观测不到的变量反映了系统所具有的真实状态，所以被称为状态，所以被称为。这种。这种(Unob

4、servable Component Model)。3 UC模型通过通常的回归方程式来估计是不可能的，必须利用状模型通过通常的回归方程式来估计是不可能的，必须利用状态空间模型来求解。态空间模型来求解。，从而可以通过估计各种不同的状态向量达到分析和，从而可以通过估计各种不同的状态向量达到分析和观测的目的。观测的目的。 EViews状态空间对象对单方程或多方程动态系统提供了一个直状态空间对象对单方程或多方程动态系统提供了一个直接的、易于使用的界面来建立、估计及分析方程结果。它提供了大接的、易于使用的界面来建立、估计及分析方程结果。它提供了大量的建立、平滑、滤波及预测工具，帮助我们利用状态空间形式来

5、量的建立、平滑、滤波及预测工具，帮助我们利用状态空间形式来分析动态系统。分析动态系统。 4 利用状态空间形式表示动态系统主要有两个优点：利用状态空间形式表示动态系统主要有两个优点：第一，状态空间模型将不可观测的变量第一，状态空间模型将不可观测的变量(状态变量状态变量)并入可观测并入可观测模型并与其一起得到估计结果；模型并与其一起得到估计结果；其次，状态空间模型是利用强有效的递归算法其次，状态空间模型是利用强有效的递归算法来估计的。卡尔曼滤波可以用来估计单变量和多变量的来估计的。卡尔曼滤波可以用来估计单变量和多变量的ARMA模型、模型、MIMIC（多指标和多因果）模型、马尔可夫转换模型以及变

6、参数模（多指标和多因果）模型、马尔可夫转换模型以及变参数模型。型。5 在本节中，我们仅就如何定义并预测一个线性状态空间模型做以在本节中，我们仅就如何定义并预测一个线性状态空间模型做以简要的讨论。状态空间模型一般应用于多变量时间序列。设简要的讨论。状态空间模型一般应用于多变量时间序列。设 yt 是包含是包含 k 个经济变量的个经济变量的 k 1 维可观测向量。这些变量与维可观测向量。这些变量与 m 1 维向量维向量 t 有关有关，。定义。定义“” (measurement equation) 或称或称“”(signal equation)为为(13.1.1)其中：其中：T 表示样本长度，表示样本

7、长度，表示表示 k m 矩阵矩阵，称为称为，dt 表示表示 k 1 向量，向量，ut 表示表示 k 1 向量，是均值为向量，是均值为0，协方差矩阵为，协方差矩阵为 Ht 的不相关扰动项，的不相关扰动项，即即(13.1.2),tttttudZyTt,2, 1，tttEHuu)var(0)(6 一般地，一般地，然而可表示成一阶马尔可夫，然而可表示成一阶马尔可夫(Markov)过程。下面定义过程。下面定义(transition equation)或称或称(state equation)为为 (13.1.3)其中：其中：表示表示 m m 矩阵矩阵，称为称为，ct 表示表示 m 1 向量向量，Rt 表

8、示表示 m g 矩阵，矩阵， t 表示表示 g 1 向量，是均值为向量，是均值为0，协方差矩阵为，协方差矩阵为 Qt 的连续的不相关扰的连续的不相关扰动项，即动项，即(13.1.4) 量测方程和状态方程的扰动项的协方差矩阵用量测方程和状态方程的扰动项的协方差矩阵用表示表示,1ttttttRcTtttEQ)var(0)(Tt,2, 1，ttttQHu00var7 当当 k 1 时，变为单变量模型，量测方程可以写为时，变为单变量模型，量测方程可以写为 (13.1.5)其中：其中：Zt 表示表示 1 m 矩阵矩阵， t 表示表示 m 1状态向量，状态向量， ut 是方差为是方差为 2 的扰的扰动项

9、动项。tttttudyZTt,2, 12)var(tu8 若使上述的状态空间模型成立，还需要满足下面两个假定：若使上述的状态空间模型成立，还需要满足下面两个假定： (1) 初始状态向量初始状态向量 0 的均值为的均值为 a0，协方差矩阵为协方差矩阵为 P0，即即 (13.1.6) (2) 在所有的时间区间上，扰动项在所有的时间区间上，扰动项 ut 和和 t 相互独立，而且它们和初相互独立，而且它们和初始状态始状态 0 也不相关，即也不相关，即 (13.1.7)且且 (13.1.8) 0000)var()(P aE0)(stEuTts,2, 1,，0)(0utE0)(0tETt,2, 19 量测

10、方程中的矩阵量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵与转移方程中的矩阵Tt , ct , Rt , Qt 统称为统称为。如不特殊指出，它们都被假定为非随机的。因。如不特殊指出，它们都被假定为非随机的。因此，尽管它们能随时间改变，但是都是可以预先确定的。对于任此，尽管它们能随时间改变，但是都是可以预先确定的。对于任一时刻一时刻 t，yt 能够被表示为当前的和过去的能够被表示为当前的和过去的 ut 和和 t 及初始向量及初始向量 0 的线性组合，所以模型是线性的。的线性组合，所以模型是线性的。10 (13.1.9)其中：其中：E( t )=0，var( t)= 2，cov(

11、t , t-s)=0, 通过定义状态向量通过定义状态向量 t =( yt ,t ) 可以写成状态空间形式可以写成状态空间形式量测方程：量测方程： (13.1.10) 状态方程：状态方程： (13.1.11)这种形式的特点是不存在量测方程噪声。这种形式的特点是不存在量测方程噪声。，1tttytty)0, 1 (ttt100101Tt,2, 111 对于任何特殊的统计模型，状态向量对于任何特殊的统计模型，状态向量 t 的定义是由结构确定的。的定义是由结构确定的。它的元素一般包含具有实际解释意义的成分，例如趋势或季节要素。它的元素一般包含具有实际解释意义的成分，例如趋势或季节要素。状态空间模型的

12、目标是，所建立的状态向量状态空间模型的目标是，所建立的状态向量 t 包含了系统在时刻包含了系统在时刻 t 的所有有关信息，同时又使用尽可能少的元素。所以如果状态空间的所有有关信息，同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最小维数，则称为模型的状态向量具有最小维数，则称为(Minimal Realization)。对一个好的状态空间模型，最小实现是一个基本准则。对一个好的状态空间模型，最小实现是一个基本准则。然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的，然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的，这一点很容易验证。这一点很容易验证。考虑通过定义一个

13、任意的非奇异矩阵考虑通过定义一个任意的非奇异矩阵 B，得到得到 t*=B t ，为新为新的状态向量。用的状态向量。用 B 矩阵左乘状态方程矩阵左乘状态方程(13.1.3)，得到，得到 (13.1.12)式中式中 Tt* = BTt B-1，ct*= Bct ，Rt*= BRt 。相应的量测方程是。相应的量测方程是 (13.1.13)式中式中 Zt* = Zt B-1 。ttttttRcT1tttttudZy12例例13.2 二阶自回归模型二阶自回归模型AR(2) (13.1.14)其中：其中：E(ut) = 0，var(ut) = 2，cov(ut , ut-s) = 0, 考虑两个可能的状态

14、空间考虑两个可能的状态空间形式形式( k=1, m=2 )是是 (13.1.15) (13.1.16)换一种形式换一种形式 (13.1.17) ,2211ttttuyyytttttuyy010112112tttttuyy01011211tty)0,1 ( tty)0,1 (Tt,2, 113 系统矩阵系统矩阵 Zt ，Ht ，Tt ，Rt ，Qt 可以依赖于一个可以依赖于一个的的集合。状态空间模型的一个主要的任务就是估计这些参数，在例集合。状态空间模型的一个主要的任务就是估计这些参数，在例13.1的的MA(1)模型中的参数模型中的参数 , 2 和例和例13.2的的AR(2)模型中的参数模型中的

15、参数 1， 2， 2 是未知的，这些参数将通过是未知的，这些参数将通过向量表示，并被称为向量表示，并被称为。超参数确定了模型的随机性质，在。超参数确定了模型的随机性质，在 ct 和和 dt 中出现的参数仅影响确定性的可观测变量和状态的期望值。中出现的参数仅影响确定性的可观测变量和状态的期望值。在状态空间模型中可以引入外生变量作为解释变量，也可以引入在状态空间模型中可以引入外生变量作为解释变量，也可以引入 yt 的延迟变量，这些都可以放到的延迟变量，这些都可以放到 dt 中去。如果中去。如果 ct 或或 dt 是未知参数是未知参数的一个线性函数，这些未知参数也可以作为状态变量或者超参数的一个线

16、性函数，这些未知参数也可以作为状态变量或者超参数的一部分元素。的一部分元素。14 通常的回归模型可用下式表示，即通常的回归模型可用下式表示，即：其中：其中：yt 是因变量，是因变量，xt 是是m 1的解释变量向量，的解释变量向量，是待估计的是待估计的m 1未知未知参数向量，参数向量，ut 是扰动项。这种回归方程式所估计的参数在样本期间内是扰动项。这种回归方程式所估计的参数在样本期间内是固定的，可以采用普通最小二乘法是固定的，可以采用普通最小二乘法(OLS)、工具变量法等计量经济、工具变量法等计量经济模型的常用方法进行估计。模型的常用方法进行估计。，tttuyxTt,2, 115 实际上近

17、年来，我国由于经济改革、各种各样的外界冲击和政策变实际上近年来，我国由于经济改革、各种各样的外界冲击和政策变化等因素的影响，经济结构正在逐渐发生变化，而用固定参数模型表现化等因素的影响，经济结构正在逐渐发生变化，而用固定参数模型表现不出来这种经济结构的变化，因此，需要考虑采用不出来这种经济结构的变化，因此，需要考虑采用(Time-varying Parameter Model)。下面利用状态空间模型来构造变参数模型。下面利用状态空间模型来构造变参数模型。量测方程：量测方程：状态方程：状态方程：其中其中xt 是具有随机系数是具有随机系数 t 的解释变量的集合，的解释变量的集合，zt 是有固

18、定系数是有固定系数的的解释变量集合，随机系数向量解释变量集合，随机系数向量 t 是对应于是对应于(13.1.1)中的状态向量，称为可中的状态向量，称为可变参数。变参数。假定变参数假定变参数 t 的变动服从于的变动服从于AR(1) 模型（也可以简单地扩展为模型（也可以简单地扩展为AR(p) 模模型），扰动向量型），扰动向量 ut , t 假定为相互独立的，且服从均值为假定为相互独立的，且服从均值为0，方差为，方差为 2和和协方差矩阵为协方差矩阵为 Q 的正态分布。的正态分布。 tttttuyzxttt1),(ttu ,00,002QNTt,2, 116 当一个模型被表示成状态空间形式就可以对其

19、应用一些重要的当一个模型被表示成状态空间形式就可以对其应用一些重要的算法求解。这些算法的核心是算法求解。这些算法的核心是Kalman滤波。滤波。Kalman滤波是在时刻滤波是在时刻 t 基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工程问题中，状态向量的当前值具有重要影响程问题中，状态向量的当前值具有重要影响 (例如，它可以表示火箭例如，它可以表示火箭在空间的坐标在空间的坐标)。Kalman滤波的主要作用是：当扰动项和初始状态向滤波的主要作用是：当扰动项和初始状态向量服从正态分布时，能够通过预测误差分解计算似然函数，从而可

20、以量服从正态分布时，能够通过预测误差分解计算似然函数，从而可以对模型中的所有未知参数进行估计，并且当新的观测值一旦得到，就对模型中的所有未知参数进行估计，并且当新的观测值一旦得到，就可以利用可以利用Kalman滤波连续地修正状态向量的估计。滤波连续地修正状态向量的估计。17 以下设以下设 YT 表示在表示在 t = T 时刻所有可利用的信息的信息集合，即时刻所有可利用的信息的信息集合，即 YT = yT , yT-1 , , y1 。状态向量的估计问题根据信息的多少分为。状态向量的估计问题根据信息的多少分为3种类型：种类型： (1) 当当 t T 时，超出样本的观测区间，是对未来状态的估计问时

21、，超出样本的观测区间，是对未来状态的估计问题，称为题，称为； (2) 当当 t = T 时，估计观测区间的最终时点，即对现在状态的估时，估计观测区间的最终时点，即对现在状态的估计问题，称为计问题，称为； (3) 当当 t T 时，是基于利用现在为止的观测值对过去状态的估时，是基于利用现在为止的观测值对过去状态的估计问题，称为计问题，称为。18 进一步，假定进一步，假定 at t-1 和和 Pt t-1 分别表示以利用到分别表示以利用到 t-1 为止的信为止的信息集合息集合 Yt-1 为条件的状态向量为条件的状态向量 t 的条件均值和条件误差协方差的条件均值和条件误差协方差矩阵，即矩阵，即在本

22、节假定系统矩阵在本节假定系统矩阵 Zt , Ht , Tt , Rt 和和 Qt 是已知的，设初始是已知的，设初始状态向量状态向量 0 的均值和误差协方差矩阵的初值为的均值和误差协方差矩阵的初值为 a0 和和 P0，并假定，并假定 a0 和和 P0 也是已知的。也是已知的。 )(11ttttEYa)var(11ttttYP19 考虑状态空间模型考虑状态空间模型(13.1.1)和和(13.1.3)，设，设，也是基于信息集合，也是基于信息集合 Yt-1 的的 t-1 的的，Pt-1 表示估计误差的表示估计误差的 m m 协方差矩阵，即协方差矩阵，即 (13.2.1) 当给定当给定 at-1 和和

23、 Pt-1 时，时， t 的条件分布的均值由下式给定，即的条件分布的均值由下式给定，即 (13.2.2) 在扰动项和初始状态向量服从正态分布的假设下，在扰动项和初始状态向量服从正态分布的假设下， t 的条件分的条件分布的均值布的均值 at t-1 是是 t 在最小均方误差意义下的一个最优估计量。估计在最小均方误差意义下的一个最优估计量。估计误差的协方差矩阵是误差的协方差矩阵是 (13.2.3)。)(11111tttttEaaPtttttcT11aattttttttRQRTPTP1120 一旦得到新的预测值一旦得到新的预测值 yt ，就能够修正，就能够修正 t 的估计的估计 at t -1， (

24、13.2.4)和和 (13.2.5)其中其中 (13.2.6) 上述上述 Kalman滤波的初值可以按滤波的初值可以按 a0 和和 P0 或或 a1 0 和和 P1 0 指定。这样，对于指定。这样，对于 t =1, 2, ,T，每当得到一个观测值时，每当得到一个观测值时，Kalman滤波提供了状态向量的最滤波提供了状态向量的最优估计。当所有的优估计。当所有的 T 个观测值都已处理，个观测值都已处理，Kalman滤波基于信息集合滤波基于信息集合 YT ，产生当前状态向量和下一时间条件状态向量的最优估计。这个估计包含产生当前状态向量和下一时间条件状态向量的最优估计。这个估计包含了产生未来状态向量和

25、未来观测值的最优预测所需的所有信息。了产生未来状态向量和未来观测值的最优预测所需的所有信息。 )(1111ttttttttttttdZyFZPaaa1111ttttttttttPZFZPPPttttttHZPZF1Tt,2, 121 平滑（平滑（smoothing）( t =T-1 , T-2 , , 1 ) (13.2.10) (13.2.11)其中：其中：aT|T , PT|T 是平滑的初值。是平滑的初值。还可以计算得到还可以计算得到 yt 的平滑估计和协方的平滑估计和协方差矩阵差矩阵)(| 11| 1|tt tTtttt tt tTtcTPTPaaaat tttttTtttt tt t

26、Tt|1| 1| 1| 11| 1|)(PTPPPPTPPPtTttTtdZyatTtttZPZS22 如果量测方程如果量测方程(13.1.1)的扰动项和初始状态向量服从多元正态分布，的扰动项和初始状态向量服从多元正态分布，则则 yt 关于关于 Yt-1 的条件分布也是正态的。且这个条件分布的均值和协方差的条件分布也是正态的。且这个条件分布的均值和协方差矩阵可以直接由矩阵可以直接由Kalman滤波给定。滤波给定。以信息集以信息集 Yt-1 为条件，为条件， t 服从具有均值服从具有均值 at t 1 和协方差矩阵和协方差矩阵 Pt t 1 的正态分布。如果量测方程被写为的正态分布。如果量测方

27、程被写为 (13.2.12)可以直接看出可以直接看出 yt 的条件分布是正态的，的条件分布是正态的，yt 的条件均值的条件均值():(13.2.13) ttttttttttudZZy)(11aattttttttEdZyy111)(a23 一步向前预测误差向量一步向前预测误差向量 (13.2.14) 预测误差协方差矩阵由式预测误差协方差矩阵由式(13.2.6)的的 Ft 给定，即给定，即 (13.2.15) 由后面由后面13.2.2节的论述可以知道条件均值节的论述可以知道条件均值是是 yt 的最小均方误差的最小均方误差意义的最优估计量意义的最优估计量(MMSE)。因此，可以利用式。因此，可以利

28、用式(13.2.13)，以及，以及Kalman滤波公式滤波公式(13.2.2)(13.2.6)，对，对 yt ， t（t = T+1 , T+2 , ）进行预测。）进行预测。,1ttttyyvTt,2, 1,1ttttttHZPZFTt,2, 11tty24Kalman滤波的导出依赖于扰动项和初始状态向量服从正态分滤波的导出依赖于扰动项和初始状态向量服从正态分布的假设。有了正态分布的假设，就能够基于信息集合布的假设。有了正态分布的假设，就能够基于信息集合 YT = yT , yT-1 , , y1 ，利用，利用Kalman滤波递推地计算滤波递推地计算 t 的分布。这些条件分布的分布。这些条件分

29、布自身也都服从正态分布，因此也就由它们的均值和协方差矩阵完全自身也都服从正态分布，因此也就由它们的均值和协方差矩阵完全确定，这就是确定，这就是Kalman滤波计算的估计量。为了说明滤波计算的估计量。为了说明 t 的条件均值的条件均值是是 t 在最小均方误差意义下的一个最优估计量，下面首先介绍均方在最小均方误差意义下的一个最优估计量，下面首先介绍均方误差和最小均方估计的概念。误差和最小均方估计的概念。 25 设设 z 是随机向量，已知样本集合是随机向量，已知样本集合 ZT = zT, zT-1 , z1 ，是基于是基于ZT 的的 z 的任一估计量，则定义均方误差（的任一估计量，则定义均方误差

30、（mean square error，MSE）为）为 (13.2.16) 设设是基于是基于 ZT 的的 z 的任一估计量，的任一估计量，是其中使均方误差达到最小是其中使均方误差达到最小的的 z 的估计量，即的估计量，即 (13.2.17)则称则称为为 z 的最小均方估计的最小均方估计(mininum mean square estimator，MMSE)。 Kalman滤波以信息集滤波以信息集 Yt 为条件，产生为条件，产生 t 的条件均值和方差的条件均值和方差 (13.2.18) (13.2.19)其中：数学期望算子下面的下标其中：数学期望算子下面的下标 t 表示是关于表示是关于 Yt

31、的条件期望。的条件期望。) () MSE(2zzz E) ()(22zzzzEEz z z z )()(tttttEEYa)()(ttttttttEEEP26 设设是以信息集是以信息集 Yt 为条件的为条件的 t 的任一估计量，估计误差可以被分的任一估计量，估计误差可以被分为两个部分为两个部分 (13.2.20) 对式对式(13.2.20)两端平方，并求期望值，经过计算，由于混合乘积项为两端平方，并求期望值，经过计算，由于混合乘积项为零，得到零，得到 (13.2.21) 在式在式(13.2.21)等号右边的第一项是等号右边的第一项是 t 的条件方差，由于的条件方差，由于var( t Yt

32、) 0 ，且与估计量，且与估计量无关，因此要想使式无关，因此要想使式(13.2.21)达到最小，只需在第二项达到最小，只需在第二项取取即可。也就是说，即可。也就是说， t 的最小均方估计的最小均方估计(MMSE)就是由就是由Kalman滤波所得到的条件均值滤波所得到的条件均值 at=E( t Yt )，并且是惟一的。，并且是惟一的。)()(ttttttttEEYY2)Y()Yvar()MSE(ttttttEEt t )(tttEY 27 当状态空间模型的扰动项的分布不能满足正态分布假定时，一般地，当状态空间模型的扰动项的分布不能满足正态分布假定时，一般地，Kalman滤波所产生的估计量滤波

33、所产生的估计量 at 不再是状态向量不再是状态向量 t 的条件均值，换句话的条件均值，换句话说，式说，式(13.2.18)将不成立。但是如果限制估计量是观测值的线性组合，将不成立。但是如果限制估计量是观测值的线性组合，即在所有线性估计范围内，即在所有线性估计范围内，at 是具有最小均方误差意义上的最优估计量。是具有最小均方误差意义上的最优估计量。此时称此时称at 是基于信息集是基于信息集 Yt 的的 t 的最小均方线性估计量的最小均方线性估计量 (minimum mean square linear estimator，MMSLE)，估计误差的协方差矩阵是由，估计误差的协方差矩阵是由Kalma

34、n滤波给出的滤波给出的 Pt 矩阵。矩阵。进一步地，上述关于状态向量进一步地，上述关于状态向量 t 的论述也可以类似地用来解释的论述也可以类似地用来解释 yt 基于信息集基于信息集 Yt1 的条件均值，用的条件均值，用表示，即表示，即 (13.2.22) 在正态假定下，在正态假定下，是是 yt 在最小均方误差意义下的最优估计量在最小均方误差意义下的最优估计量(MMSE)，并且在不满足正态假定时，是，并且在不满足正态假定时，是 yt 的最小均方线性估计量的最小均方线性估计量(MMSLE)。 ttttttdZy11a1tty1tty28 预测误差预测误差 (13.2.23)被称为被称为，因为

35、它代表在，因为它代表在 Yt-1 的基础上新观测值的基础上新观测值 yt 所带来的信息。从更新方程所带来的信息。从更新方程(13.2.4)中可以看出，新息中可以看出，新息 vt 对修正状态对修正状态向量的估计量起到了关键的作用。向量的估计量起到了关键的作用。在正态假定下，根据在正态假定下，根据是最小均方误差意义下的最优估计量，是最小均方误差意义下的最优估计量，可以推断可以推断 vt 的均值是零向量。进一步地，从式的均值是零向量。进一步地，从式(13.2.23)容易看出容易看出 (13.2.24)其中：其中：Ft 由式由式(13.2.6)给定。在不同的时间区间，新息给定。在不同的时间区间，新

36、息 vt 是不相关的，是不相关的，即即, (13.2.25) ,)(11tttttttttuZyyvaTt,2, 1ttFv)var(0)(stEvvTstst,2, 1,1tty29 当量测方程和转移方程的扰动项是相关的时候，需要修改当量测方程和转移方程的扰动项是相关的时候，需要修改Kalman滤波。考虑具有量测方程和转移方程的状态空间形式滤波。考虑具有量测方程和转移方程的状态空间形式 (13.2.26) (13.2.27) 假设假设(13.2.28)其中其中 Gt 是已知的是已知的 g k 矩阵。量测方程和状态方程的扰动项的协方差矩矩阵。量测方程和状态方程的扰动项的协方差矩阵用阵用表示表

37、示注意当量测方程和转移方程的干扰项在同时点相关，在不同时点不注意当量测方程和转移方程的干扰项在同时点相关，在不同时点不相关时，相关时，Kalman滤波中的预测公式滤波中的预测公式(13.2.2)，(13.2.3)不变，更新方程进不变，更新方程进行如下修改：在行如下修改：在 (13.2.4)和式和式(13.2.5)中矩阵中矩阵 Pt t 1Zt 变为变为 Pt t 1Zt + Rt Gt ，式，式(13.2.6)变为变为 (13.2.29)tttttudZy,1ttttttRcTTt,2, 1ststEtst,)(0GuttttttQGGHuvarttttttttttttHZRGGRZZPZF

38、130 在许多实际应用问题中，状态空间模型的系统矩阵在许多实际应用问题中，状态空间模型的系统矩阵 Zt ，dt ，Ht ，Tt ，ct ，Rt 和和 Qt 都是不依赖于时间变化的，这样就可以写成不带时间下标的都是不依赖于时间变化的，这样就可以写成不带时间下标的模型，称为非时变模型。一般允许模型，称为非时变模型。一般允许 ct 和和 dt 是依时间变化的，于是状态空是依时间变化的，于是状态空间模型的量测方程间模型的量测方程(13.1.1)和转移方程和转移方程(13.1.3)就可以写为就可以写为 (13.2.32) (13.2.33), (13.2.34) 如果系统是稳定的，则转移矩阵如果系统是稳

39、定的，则转移矩阵 T 的所有的特征根的模的倒数应的所有的特征根的模的倒数应当小于当小于1，即，即 (13.2.35)且如果初始协方差矩阵且如果初始协方差矩阵 P1 0 是非负定的，则是非负定的，则 (13.2.36) 独立于独立于 P1 0 ，Pt+1 t 呈指数地迅速收敛到呈指数地迅速收敛到。 HuudZy)var(,tttttQRcT)var(,1ttttt0)(stEuts,1)(Timi,2, 1PPttt1limPP31 (1) 仅当状态转移矩阵仅当状态转移矩阵 T , 方差矩阵方差矩阵 P 和和 Q 是非时变的且满足某些是非时变的且满足某些稳定性条件，初始条件的求解才是可能的。如

40、果初始条件的求解是可稳定性条件，初始条件的求解才是可能的。如果初始条件的求解是可能的，可以利用关系式：能的，可以利用关系式：在更复杂的模型中给出求协方差矩阵初始条件在更复杂的模型中给出求协方差矩阵初始条件 P0 的一种方法的一种方法 (13.2.37)式中式中Vec( ) 算子是把矩阵拉直，即表示矩阵的列是一列接着一列而形成算子是把矩阵拉直，即表示矩阵的列是一列接着一列而形成一个向量，而运算符一个向量，而运算符表示克罗内克积表示克罗内克积(kronecker product) ，I 为单位为单位矩阵。矩阵。 (2) 如果初始条件的求解是不可能的，状态将按扩散先验处理。当如果初始条件的求解是

41、不可能的，状态将按扩散先验处理。当利用扩散先验时，采用利用扩散先验时，采用Koopman，Shephard和和Doornik (1998) 提出的提出的方法将设置方法将设置 0 = 0 和和 P0 = I ，这里，这里为一个任意的大数。如设为一个任意的大数。如设 = 106，然后通过乘以残差协方差矩阵的最大的对角线元素调整然后通过乘以残差协方差矩阵的最大的对角线元素调整 P。cTI10）（aRRQTTPP001)(Vec)(Vec1RRQTTIP32 在在13.2节讨论利用节讨论利用Kalman滤波递推公式求状态向量的估计量滤波递推公式求状态向量的估计量时，假定状态空间模型的系统矩阵时，假定

42、状态空间模型的系统矩阵 Zt , Ht , Tt , Rt 和和 Qt 是已知的。是已知的。但实际上但实际上。例如，在例。例如，在例13.1的一阶移动平的一阶移动平均模型均模型MA(1)中中 = ( , 2)，在例，在例13.2的二阶自回归模型的二阶自回归模型AR(2)中中 = ( 1, 2, 2)。本节对于状态空间模型的量测方程。本节对于状态空间模型的量测方程(13.1.1)和状和状态方程态方程(13.1.3)中含有未知参数的情况，介绍超参数的估计方法。中含有未知参数的情况，介绍超参数的估计方法。33 在许多问题中，特别在关于正态分布的各种估计问题中，极大在许多问题中，特别在关于正态分布的各

43、种估计问题中，极大似然法是最常用的方法，这主要表现在极大似然估计量常具有某些似然法是最常用的方法，这主要表现在极大似然估计量常具有某些优良的性质。这里采用极大似然法估计未知的超参数。优良的性质。这里采用极大似然法估计未知的超参数。极大似然法的原理通常用于观测值极大似然法的原理通常用于观测值 y1 , y2 , , yT 相互独立且具相互独立且具有同样分布的情形，此时它们的联合概率函数被给定为有同样分布的情形，此时它们的联合概率函数被给定为 (13.3.1)其中：其中：P(yt) 是第是第 t 个观测值的概率密度函数。个观测值的概率密度函数。 L( y ; )是样本是样本y1 , y2 , ,

44、 yT 的联合概率密度函数。一旦得到样本观测值，的联合概率密度函数。一旦得到样本观测值，L( y ; ) 就就可以被解释为似然函数，并且可以通过关于可以被解释为似然函数，并且可以通过关于求偏导数，使函数求偏导数，使函数L( y ; ) 达到最大来求出达到最大来求出的极大似然估计。的极大似然估计。 TttPL1)();(yy34 然而，经济时间序列的一个重要特征是经济变量间是不独立的，然而，经济时间序列的一个重要特征是经济变量间是不独立的，因此不能用式因此不能用式(13.3.1)，而是利用条件概率密度函数代替联合概率密，而是利用条件概率密度函数代替联合概率密度函数将似然函数表示为度函数将似然

45、函数表示为 (13.3.2)其中：其中：P(yt Yt-1) 表示表示 yt 以直到时刻以直到时刻 t-1 的信息集合为条件的条件分的信息集合为条件的条件分布，即布，即 Yt-1=yt-1, yt-2 , , y1，P( yt Yt-1)=P(yt y1, , yt-1)。在总体正态的假定之下，可以将式在总体正态的假定之下，可以将式(13.3.2)的对数似然函数直的对数似然函数直接写为接写为 (13.3.3)其中其中 (13.3.4) TtttPL11)();(YyytTtttTttTkLvFvFy11121ln212ln2);(ln1ttttyyvttttttdZy11a,1ttttttH

46、ZPZFTt,2, 135 由前面由前面13.2.2节的论述可以知道条件均值节的论述可以知道条件均值是是 yt 的最小均方误的最小均方误差意义的最优估计量差意义的最优估计量(MMSE)，所以，所以 k 1 向量向量 vt 可以作为一个预测误可以作为一个预测误差向量来解释。因此差向量来解释。因此(13.3.3)式有时也称为似然函数形式的预测误差分式有时也称为似然函数形式的预测误差分解。解。极大似然估计量的计算方法有许多种，有解析方法，也有数值解极大似然估计量的计算方法有许多种，有解析方法，也有数值解法。设法。设 = ( 1, 2, , n ) 是待求的未知参数向量，是待求的未知参数向量，首先

47、求极大似然首先求极大似然估计的迭代公式。为求极大似然估计，需要求解估计的迭代公式。为求极大似然估计，需要求解设设是超参数向量的精确值，采用是超参数向量的精确值，采用Taylor展开式，取一次近似，展开式，取一次近似，并设并设表示参数空间上的任意一点，则可将表示参数空间上的任意一点，则可将 lnL(y; )/ 表示成表示成1tty0);(lnyL) (lnlnln2LLL 36令其为令其为0，可得，可得于是得到于是得到其中：其中：l = 1, 2, ，从某个初始设定的参数值从某个初始设定的参数值 (0) 出发，进行迭代过程：出发，进行迭代过程： (1) , (2) , (3) , 。求

48、求 (l) ( l = 1, 2, ) ，它的收敛值，它的收敛值为所求的极大似然估计。式中对数似然函数的为所求的极大似然估计。式中对数似然函数的，而对数似然函数的，而对数似然函数的。计算海塞。计算海塞(Hessian)矩阵的逆矩阵，计算量是很矩阵的逆矩阵，计算量是很大的。计算方法有多种，近似的方法可节省时间但缺少严密性，而严密的大的。计算方法有多种，近似的方法可节省时间但缺少严密性，而严密的方法又有计算时间长的缺点。方法又有计算时间长的缺点。 12lnlnLL)()(lnln12)()1(llLLll limll37被定义为：被定义为： )1()1()()1()(2)(log)(log)(

49、logiiiiiissLsLL 而而则由下式计算：则由下式计算：这里这里 logL 是似然函数，是似然函数，s 充分接近充分接近 0 ，上述公式可达到任意精度。双侧，上述公式可达到任意精度。双侧导数更加精确，但它要对似然函数进行的计算量大概是单侧导数的两倍，导数更加精确，但它要对似然函数进行的计算量大概是单侧导数的两倍，运行时间上也是如此。运行时间上也是如此。 )1()()1()()(log)(log)(logiiiiisLsLL38 EViews可以处理大量的单方程和多方程状态空间模型，提供了可以处理大量的单方程和多方程状态空间模型，提供了指定系统方程、协方差矩阵和初始条件控制的详细方法。

50、指定系统方程、协方差矩阵和初始条件控制的详细方法。在定义和估计一个状态空间模型时，第一步是创建一个状态空间在定义和估计一个状态空间模型时，第一步是创建一个状态空间对象。从主菜单中选择对象。从主菜单中选择Objects/New Object/Sspace，EViews将创建一将创建一个状态空间对象，并打开一个空的状态空间说明窗口。个状态空间对象，并打开一个空的状态空间说明窗口。 39 有两种方法定义一个状态空间模型，最简单的方法就是利用有两种方法定义一个状态空间模型，最简单的方法就是利用EViews中的中的“自动指定自动指定”功能引导状态空间模型的标准形式。这功能引导状态空间模型的标准形式。这

51、种方式只需在状态空间种方式只需在状态空间过程过程Procs中选择中选择Define State Space功能功能，就可以弹出定义对话框，指导创建一个状态空间的过程。这一方就可以弹出定义对话框，指导创建一个状态空间的过程。这一方式的详细介绍见式的详细介绍见“自动定义自动定义”一节。一节。描述状态空间模型的更一般方法是使用关键字和文本来描述描述状态空间模型的更一般方法是使用关键字和文本来描述量测方程、状态方程、误差结构、初始条件和待估参数的初值。量测方程、状态方程、误差结构、初始条件和待估参数的初值。下面来介绍描述状态空间对象的一般语法。下面来介绍描述状态空间对象的一般语法。 40 作为缺省

52、，如果一个方程通过关键字作为缺省，如果一个方程通过关键字“”来明确定义，或来明确定义，或没有用关键字，没有用关键字，EViews将把其作为量测方程处理。要注意以下几点：将把其作为量测方程处理。要注意以下几点：（1）量测方程的因变量可以包含表达式。）量测方程的因变量可以包含表达式。（2），包括出现，包括出现在右端表达式的所有变量。在量测方程中任何滞后量测变量都被看作多在右端表达式的所有变量。在量测方程中任何滞后量测变量都被看作多步向前预测的预测值看待。步向前预测的预测值看待。（3）。状态向量的非线性。状态向量的非线性或存在超前或滞后状态变量将导致错误的信息。或存在超前或滞后状态变量将导致错

53、误的信息。（4）量测方程中可以包含外生变量和未知参数，也可以是这些元素）量测方程中可以包含外生变量和未知参数，也可以是这些元素的非线性形式。的非线性形式。（5）量测方程可以包含误差或误差方差指定的选项，如果方程中不量测方程可以包含误差或误差方差指定的选项，如果方程中不包含误差或误差方差，方程是确定性的。状态空间模型中误差指定的详包含误差或误差方差，方程是确定性的。状态空间模型中误差指定的详细内容参看后面的细内容参看后面的“误差和方差误差和方差”。 41 下面是有效的量测方程的定义（注：下面量测方程中的下面是有效的量测方程的定义（注：下面量测方程中的sv1, sv2, sv3, sv4是状

54、态向量）是状态向量） signal y =sv1+sv2*x1+sv3*x2+sv4*y(-1)+var=exp(c(1) log(p)= sv1 + c(1) + c(3)*x + sv2*y z = c(1) + sv1+sv2*x1+sv3*x2 + var=exp(c(2) signal y=x1+var=exp(c(1) log(p)=c(1)+c(3)* z = sv1+sv2*x1+ c(1)+var=exp(c(2) 因为它们至少违背了上面描述条件中的一个条件（其顺序是：状态向因为它们至少违背了上面描述条件中的一个条件（其顺序是：状态向量的非线性、状态向量的滞后、量测向量的超前

55、）。量的非线性、状态向量的滞后、量测向量的超前）。42 状态方程的定义必须包含关键字状态方程的定义必须包含关键字“”，后面跟随一个有效，后面跟随一个有效的状态方程。必须注意以下几点：的状态方程。必须注意以下几点： (1) 。因为。因为EViews对状态方程不能自动建立工作文件序列。对状态方程不能自动建立工作文件序列。 (2) ，或因变量的超前和滞，或因变量的超前和滞后变量。后变量。 (3) 每一个状态方程每一个状态方程。如果在。如果在状态方程中存在状态变量的非线性关系、同期、超前或多期滞后将产状态方程中存在状态变量的非线性关系、同期、超前或多期滞后将产生错误信息。需要强调的是，在状态方程中一期

56、滞后约束条件不是限生错误信息。需要强调的是，在状态方程中一期滞后约束条件不是限定的，因为更高阶的滞后被当作新的状态变量。关于这种情况的例子定的，因为更高阶的滞后被当作新的状态变量。关于这种情况的例子在后面的在后面的AR(2)模型中提供。模型中提供。 (4) 状态方程中可以包含外生变量和未知参数，可以是它们的非线状态方程中可以包含外生变量和未知参数，可以是它们的非线性形式。性形式。 (5) 在状态方程中还包含误差或误差方差指定选项。在状态方程中还包含误差或误差方差指定选项。43 下面两个状态方程定义了一个服从下面两个状态方程定义了一个服从AR(2)过程的不可观测误差过程的不可观测误差: stat

57、e sv1=c(2)*sv1(-1)+c(3)*sv2(-1)+var=exp(c(5) state sv2=sv1(-1) 第一个关于第一个关于sv1的方程，根据的方程，根据AR(1)的系数的系数c(2)，和，和AR(2)的系数的系数c(3)，确定确定AR(2)模型的参数。误差方差的指定在方框中给出。模型的参数。误差方差的指定在方框中给出。sv2的状态方程定的状态方程定义为变量义为变量sv1的一步滞后，所以的一步滞后，所以sv2(-1)表示表示sv1的两步滞后。的两步滞后。下面是不正确的状态方程：下面是不正确的状态方程： state exp(sv1)=sv1(-1)+var=exp(c(3

58、) state sv2=log(sv2(-1)+var=exp(c(3) state sv3=c(1)+c(2)*sv3(-2)+var=exp(c(3) 因为它们至少违背了上面描述条件中的一个条件（其次序是：状态方因为它们至少违背了上面描述条件中的一个条件（其次序是：状态方程因变量是表示式，状态变量是非线性的，出现状态变量的多期滞后程因变量是表示式，状态变量是非线性的，出现状态变量的多期滞后）。）。 44 在误差项的处理中，状态空间对象方程的指定在某种程度上是唯在误差项的处理中，状态空间对象方程的指定在某种程度上是唯一的。一的。EViews总是把一个隐含的误差项加到一个方程或系统对象的各总是

59、把一个隐含的误差项加到一个方程或系统对象的各个方程中去。但如不特殊指定，状态空间量测或状态方程中不能包含个方程中去。但如不特殊指定，状态空间量测或状态方程中不能包含误差项。误差项必须被加到（在方括号中）指定方程的后面。误差项。误差项必须被加到（在方括号中）指定方程的后面。把一个误差项加到状态空间方程中最简单的方法是指定误差项的方把一个误差项加到状态空间方程中最简单的方法是指定误差项的方差。即加一个误差表达式到已存在的方程中去。差。即加一个误差表达式到已存在的方程中去。 signal y=c(1)+sv1+sv2+var=1 state sv1=sv1(-1)+var=exp(c(2) sta

60、te sv2=c(3)+c(4)*sv2(-1)+var=exp(c(2)*x) 指定的方差可以是已知常数值，也可以是包含待估计未知参数的指定的方差可以是已知常数值，也可以是包含待估计未知参数的表达式。还可以在方差中使用序列表达式建立时变参数模型。表达式。还可以在方差中使用序列表达式建立时变参数模型。45 这种方差的直接指定方法不允许不同方程的误差之间存在相关关这种方差的直接指定方法不允许不同方程的误差之间存在相关关系。作为默认，系。作为默认，EViews假定误差项之间的协方差为零。如果指定误差假定误差项之间的协方差为零。如果指定误差项间存在相关关系，需要使用项间存在相关关系，需要使用“命名误

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第13章状态空间模型和卡尔曼滤波(第三版)

文档简介

温馨提示

最新文档

评论

第13章状态空间模型和卡尔曼滤波(第三版)

文档简介

温馨提示

最新文档

评论

相关文档