非线性时间序列第四章

上传人：5*** IP属地：湖北上传时间：2022-06-01 格式：DOC 页数：59 大小：4.99MB 积分：30 举报 版权申诉

已阅读5页，还剩54页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第四章参数非线性时间序列模型对分析时间序列数据来说，ARMA模型长期持续地普及令人信服地证明了线性模型的有用性. 不过，鉴于任何统计模型都是对现实世界的近似，线性模型只是凭借数学公式来解释未知动态关系的第一步. 世界其实是非线性的！因此，存在大量的经验证据指出线性ARMA族的局限性并不令人吃惊. 为了给大量的非线笥现象建模，比如超越线性相关的相依性，我们需要非线性模型. 在本章中，我们给出一些参数非线性模型和它们的统计推断. §4.1对条件均值函数的门限建模提供了一个入门介绍. §4.2致力于说明非常条件方差函数ARCH建模一种称之为条件异方差的现象.§4.3

2、则简要叙述双线性模型.4.1 门限模型在几乎所有学科中，线性逼近作为一个强有力的工具用于大量的科学研究中. 然而，当我们处理非线性问题时，比如建模非线性动态，全局线性律常常是不适合的. 例如，假定在经济或动物种群中扩张相被作为收缩相的同一个线性动态所控制，这似乎显得缺少智慧. 由于全局二次（或高阶）自回归形式实际上是不稳定的，一个自然的替代也许是把全局线性逼近分成几段；在状态空间的每个子集上有一个线性逼近. 在门限原理的大伞下（Tong 1990的§3.3），有一类非线性时间序列模型，它建模非线性动态是基于“分段”线性逼近，即把状态空间分割成几个子空间，每个子空间上使用线性逼近.

3、分割实际上由所谓的“门限”变量来指定. 在本节，我们提出一个简单而常用的形式门限自回归模型，重点放在Tong（1990）之后的发展上. 我们介绍一些关于估计、检验和模型识别的方法，并通过一个实际数据例子来说明这些方法.4.1.1 门限自回归模型定义4.1 具有分段的门限自回归（TAR）模型定义为，（4.1）其中是一些未知的正整数，且是未知参数，构成的一个分割，其含义是对所有的，且. 在以上模型中，我们在每一个上拟合一个线性形式. 分割由门限变量指定，称为延迟参数. 通常（但不总是）的情形是. 在此情形，称为门限. 这个模型最初由H. Tong在1977年引进，事实上，它是自激励门限模型的

4、一个特殊类型；见Tong和Lim（1980）及Tong（1990）. 它已广泛地用于各种不同的领域建模非线性现象，包括经济（Tiao和Tsay, 1994, Hansen, 1999），环境科学（Mélard和Roy, 1988），神经科学（Pemberton, 1985）和人口动力学（Stenseth et al., 1999）. 它的成功部分地在于它在模型拟合，也许更重要的是在模型解释这两方面的简单性. 通过分割状态空间建模非线性，平稳性可以被保持. 这明显地不同于变点模型，后者的控制开关按时间发生，其结果导致非平稳过程. 不幸的是我们关于TAR模型的知识仍处于发展中. 我们还没

5、有像线性ARMA模型那样的全面的理论和方法. 由定理2.4易见，如果（a），（b）或者，或者，其中见模型（4.1）有严平稳解. 注意，这些条件是充分的，但不是必要的；见模型（2.14）. 两个随机变量的线性相关有清晰的定义. 因此，正如我们在第三章已经看到的那样，时间序列的自相关性可通过在建模自线性关系中起着关键作用的自相关函数（ACF）很好地掌握. （注意，PACF是相应ACF的函数；见命题（2.3）. 不幸的是，对表示非线性相依一般地没有类似的ACF. 已经做了各种尝试来定义非线性相依/相伴的适当度量；或者局部化，或者全局的. 但是，它们不像分析线性关系时ACF和PACF那样简单和易于图示

6、. 事实上，我们在此有一个自相矛盾的地方；建模非线性现象比线性更复杂且更困难，有用的工具缺乏广泛性和有效性. 因此，在非线性建模中，像图方法（Tong, 1990的§5.2）、背景信息、非参数和参数方法等数据探索和数据分析的方法在识别适当（参数）的形式时起着重要的作用. 对线性性的统计检验是验证非线性的常规实践. 在以下§4.1.4的一案例研究中，我们将说明这些思想的一部分. 为了拟合一个低维结构，相对于它的延迟值所画的时间序列变量的散点图几乎与任何更复杂的工具同样有用. 为了说明这个思想，我们考虑如下具有两个分段的简单TAR模型：（4.2）其中是独立变量. 取分别等于和

7、，我们由以上模型生成四组样本（每组的长度为500）. 图4.1描绘了这四个样本序列的散点图. 对，模型变成线性AR（1）. 对其他三种情形，非线性在这些图中被清楚地显示出来. 另一方面，尽管ACF和PACF图还有用，但已不能作为相依性解释的最终度量. 例如，图4.2（a）指出，尽管由（4.2）定义的和之间显著相依，但当时，却很难有明显的自相关. 值得指出的是，TAR模型的有用性归因于逐段线性函数实际上可以为更复杂的非线性函数提供简单和易于操作的逼近. 图4.3显示了一些例子，这些不同的非线性函数能够由具有2，3或4段逐段线性函数来逼近，它们可以看作是有2，3或4个节点的线性样条函数；见

8、7;6.4. 在实际中，来自TAR模型好的似合不一定蕴涵所考虑的过程是精确逐段线性的. 但是，在一个拟合模型里，当每一个分段表示所考虑的非线性动态的一个不同特征时，特别有意义和解释常常被接受. 为了说明这一点，我们下面报告由Tiao和Tsay（1994）对美国按季度实际GNP数据拟合的TAR模型，在这个模型中，分段是按两个（而不是一个）门限变量来定义的.图4.1 由TAR模型（4.2）生成的样本的散点图，其中（a）；（b）;（c）和（d）. 实践是真实回归函数令表示1947年2月至1991年1月美国按季度实际GNP，总共177观测. 图4.4是增长率的时间序列的图Tiao和Tsay（1994

9、）用如下的具有四个分段的TAR模型（丢弃两个不显著的项）拟合增长率：（4.3）图4.2 由TAR模型（4.2）生成的时间序列的样本ACF和PACF的图图4.3 对非线性函数（实线）的逐段线性逼近（点线）：（a）；（b）；（c）对这个模型的解释如下.图4.4 美国按季度实际GNP增长的时间序列图（1947年2月1991年1月）第一个分段（即）表示一个衰退期，即在这个时期经济从一个收缩状态变化到一个更坏的状态. 仅有六个观测来自这个衰退期. 进一步，在这个分段中，发现回归函数的负的爆炸特性是可靠的，这就指出经济通常从衰退期迅速恢复. 事实上，在给定的序列内，仅有三处发生两个连续的负增长被观测到

10、. 第二个分段（即和）对应着经济处于收缩但已开始改善的时期. 在这个时期，回归函数趋向于正的，说明经济恢复一旦开始，更可能连续地增长跳出衰退. 第三个分段（即和）表示在这个时期经济是合理的，但增长有所下降. 第四个分段（即）表示一个扩张期，在这个时期经济变得更强劲. 在这两个分段中，拟合的线性形式是类似的，自回归系数处于0.44附近. 在模型（4.3）中，所有系数都是统计显著的. 这个模型的统计分析细节参阅Tiao和Tsay（1994）.4.1.2 估计和模型识别设是具有给定的模型（4.1）的观测值. 基于这些观测，我们估计参数，确定阶和分割. 首先，我们假定分割和阶是已知的. 为了简化记号

11、，我们假定. 则对自回归系数，的最小二乘估计被定义为，其中和是下式对所有可能实数值和整数值取极小值. （4.4）式中 . （4.5）以上的极小化可以看作是两步过程；对每一个固定的，我们先对，极小化（4.5），然后选择使得（4.4）达到极小. 注意，对固定的，（4.5）的极小值是线性回归模型的普通最小二乘估计，因此，它能够精确地获得. 在此情形下，存在多个的最小值，我们总是选择延迟参数最小的作为我们的估计. 现在，方差的估计定义为，（4.6）其中如下集合中的元素个数和. 如果我们假定是高斯的，以上导出的最小二乘估计不必渐近等价于条件极大似然估计. 事实上，对s，和的条件极大似然估计能够从极大

12、化下式中获得.对给定的，如同（4.4）一样，通过极小化获得. 然而，是通过极小化而不是（4.4）来获得. 对给定的和，的条件MLE由（4.6）得到. 示意性的算法如下：对每个给定的，利用最小二乘方法，我们由（4.6）获得和. 这就产生了一个以为指标的条件似然序列，由经可获得的一个估计. 我们不去进一步地追踪这一点，这是由于只有当之间的差异较大时，最小二乘估计的有效性才是显著的. 在实际中，分割常常是未知的，通常假定具有形式，其中. 理论上，我们可以按照如下的全面搜索的方式来确定分割：对给定的分割集合，记（4.4）的最小值为，我们求分割，它使得达到极小. 在实际中，常取较小的数值，比如2，3或4

13、，门限在样本范围的某个内点处求得. 例如，当时，我们可以在60%的样本范围内寻找. 现在，我们定义最小二乘估计和，它们由极小化（4.4）所得，并定义 . （4.7）为了确定自回归的阶，我们可以定义一个推广的AIC如下：，其中由（4.7）得出. 我们选择使得相应的AIC-值达到最小. 在以上的表达式中，对分段数的惩罚反映在关于的求和中. 当然，像BIC或AICC这些准则在这个问题中也能够以相同的方式被采用；见§3.4. 为了考虑估计的渐近性质，我们假定由（4.1）生成的是严平稳遍历的，且有有限的二阶矩. 能够证明，如果在模型（4.1）中，给定分割和延迟参数，则的最小二乘估计是渐近正态

14、的，即（4.8）其中，1是向量，其所有分量都是，且.（还可见定理3.2）. 不幸的是，在实际中和实际上是未知的. 估计的渐近性质更复杂，它依赖于回归函数是连续的（诸如图4.1（d）或不是连续的（诸如图4.1（b）和（c）. 直观上，图4.1（b）所显示的不连续性使得门限的估计比在图4.1（d）所表现的连续情形时的估计要容易. 下面的归功于Chan（1993a）的定理4.2表明，当回归函数不连续时，门限的估计以速度收敛（和传统的速度对比）. 连续情形的渐近性质可参阅Chan和Tsay（1998）. 下面的两个定理涉及模型（4.1）的特殊情形，即给定和. 在此情形中，分割的估计退化为估计单个门限

15、. 我们表示它的估计为. 定理4.1（Chan 1993a）设满足具有和的模型（4.1），且是遍历的，严平稳的，有有限的二阶矩. 假定的联合密度函数是处处为正的. 则所有估计和都是强相合的. 定理4.2（Chan 1993）除定理4.1的条件外，我们假定（i）马尔可夫链是几何遍历的. （ii）有正的一致连续的密度函数，且. （iii）自回归函数是不连续的，即存在，其中，使得. 则和是渐近独立的. 进一步，是渐近正态的，均值为0，方差为，它们由（4.8）给出. 注意，仅取整数值. 因此，对大的最终等于几乎必然成立；见定理4.1定理4.2表明，由于不连续性，乘上因子收敛到比乘上因子更快. （的渐

16、近分布由Chan, 1993a给出）. 因此，在的渐近分布涉及的范围内，和可以被认为是已知的；见定理4.2和（4.8）. 这样，基于（4.8），容易构造系数的近似的置信区间. 另一方面，如果（a），和（b）或者，或者，其中，则在定理4.2中所要求的几何遍历条件成立；见例2.1和定理2.4.4.1.3 线性性检验由于缺乏非线性相依的一般度量，在拟合非线性模型时，检验线性性就变成了验证非线性的例行工作. 现在有十几个这样的检验可用（Tong, 1990的§5.3），它们可以分成两类：一类是混合检验，在没有指定的备择模型下，检验对线性模型的偏离；另一类检验是针对某些特定的备择模型所设计的

17、. 最近，利用非参数和半参数拟合的检验已受到广泛的注意；参阅第九章. 我们下面介绍线性模型相对于具有两个分段的TAR备择模型的似然比检验，它归功于Chan和Tong（1990）及Chan（1990b）. 虽然检验是针对特定的备择模型而设计的，但由于逐段线性函数提供了一个比来自（全局）线性函数更好的逼近，它可以被应用于检验对一般平滑非线性函数的偏离. 这和Cox（1981）的想法相同，他建议用平方或三次方回归来检验非线性性。令是来自严平稳过程的观测. 我们检验零假设：是来自一个线性AR模型，相对于备择它是指定的具有两个分段的TAR模型. 在以上的表达式中，其中，和是已知的正整数. 进一步，我们

18、假定门限落在一个有界的闭区间内.，似然比检验将拒绝，上式又等价于检验，（4.9）其中是一具标准化常数，.基于泊松clumping heuristic, Chan （1991）对以上检验的显著性水平（当是大的）发展了如下的近似：，（4.10）其中表示具有自由度的分布的概率密度函数，且，和是方程的根，其中，.表4.1 具有包含50%样本点的的渐近零分布的上侧百分位点阶10%50%2.5%1%0.1%0 6.12 7.75 9.3311.3616.331 9.2711.1812.9415.1620.45211.3413.3815.2617.6023.13313.2515.4217.3919.

19、8325.57415.0717.3319.3921.9327.87516.8019.1621.3023.9330.04618.4820.9323.1425.5832.13923.2825.9628.3631.2938.011227.8330.7033.2736.3943.501532.2035.2537.9741.2648.721836.4539.6742.5245.9653.74表4.2 具有包含80%样本点的的渐近零分布的上侧百分位点阶10%5%2.5%1%0.1%0 7.61 9.2110.7712.8017.75111.0512.8514.5516.7221.94213.2615.18

20、16.9819.2524.69315.3017.3119.1921.5727.20417.2219.3221.2823.7329.54519.0521.2323.2625.7931.77620.8223.0725.1627.7733.90925.8428.3030.5533.3639.901230.5833.2035.6138.5945.491535.1337.9140.4443.5850.811839.5442.4545.1148.3955.92在以上的表达式中，和分别表示在下的概率律和期望. 基于（4.10），我们能够对的零分布列出近似的上侧百分位点表. 表4.1和表4.2取自Chan（1

21、991）. 对阶的一些别的值，百分位点可以通过内插近似地获得. 似然比检验的显著水平的近似还能够利用自助法获得；见§9.2.3.4.1.4 对加拿大山猫数据案例的研究画在图1.2中的加拿大西北部Mackenzie河流域加拿大山猫捕获量的年度记录已在几本时间序列的书中做了分析. 在这个序列中显示的周期波动深刻地影响着生态学的理论. 它还变成了时间序列分析中检验新的统计方法的基准序列. 对这个特别的数据集合所建立的第一个时间序列模型可能是Moran（1953）的模型. Moran对山猫数据的对数拟合了如下的线性AR（2）模型：，（4.11）其中. 事实上，Moran立即就意识到了线

22、性拟合的局限性，正如他在同一篇文章中指出了一个“古怪的特征”对应于大于均值的值的残差的平方和是1.781，而对应于小于均值的值的残差的平方和是4.007. 两个和的比值是2.250，这就相对于零假设以1%水平（F-检验）显著地判断残差的两个集合是来自同一个正态分布的随机样本. 在以后，我们将示范如何对这组数据一步一步地拟合一个TAR模型，包括用各种图、非参数平滑对线性性的统计检验的探索性分析. 这部分的分析部分地取自Tong（1990）的§7.2. 我们总是把显示在图1.2中的变换数据叫做山猫数据. （a）图和非参数平滑正如拟合线性时间序列模型那样，用一种明智的方式构造数据图可能提

23、供丰富的信息和富有启发性. 图4.5以正常和逆向时间顺序画山猫的时间序列图. 显然，山猫种群显示出像周期的波动，其中大多周期约为9或10年. 另一个明显之处为这个序列不是时间可逆的. 例如，种群的循环是非对称的；它从一个谷到达一个峰花费大约六年的时间，而从一个峰落到一个谷大约花费三或四年的时间.图4.5 （a）加拿大山猫数据的时间图；（b）加拿大山猫数据的逆向时间图缺乏时间可逆性是否就意味着有非线性性？答案一般不必是肯定的. 然而，如果我们找到一个统计模型，它将再生时间可逆特征，我们则要求非线性建模. 在第三章讨论的（线性）ARMA模型重点在线性自相关上，它是时间可逆的，这是它的一个天生的优

24、点. 更进一步，如果ARMA过程是被一个高斯白噪声定义的，则它的全部概率分布都是时间可逆的. 虽然我们没有明确地在模型中施加正态性，但我们仅考虑它的前两阶矩的性质，常不加说明地将过程看成是正态的. 在这点上，谱分析是典型的例子. 这种处理仅对高斯过程是合理的. 因此，一时我们识别到一些非高斯性质，我们可以准备接受一个非线性模型. 在此意义上，非正态性可以看作是非线性性. （还可见命题2.1）图4.6给出两个具有不同大小条形的山猫数据的直方图，它们清楚地指出边缘分布至少是双峰的. 对概率密度函数的非参数估计（见§5.2）由具有默认框架的标准S-Plus函数“density”产生，补充

25、这种非高斯性.图4.6 具有不同大小条形的加拿大山猫数据的两个直方图，同估计的密度函数一起（实线）延迟直线连接的散点图是相对于画，点与点之间（比如（）和（）用直线连接的图. 这种散点图是提供更多的住处的方式. 直线连接的散点图是分析非线性时间序列的另一个有效的工具. 对加拿大山猫数据，图4.7表明，在延迟1和2的图的中心明显地有空心. 由于2维正态分布在其样本空间的中心不能有洞，这就令人信服地表明，对的联合分布不是高斯的. 这还和图4.6给出的边缘密度是一致的. 是高斯过程，边缘分布还是高斯的. 图4.7 加拿大山猫数据延迟1和2的直线连接的散点图图4.8（a）-（d）显示了对和4，相对于

26、的散点图，图中置放了延迟回归的非参数估计，这个估计由具有默认框架的标准S-Plus函数“ksmooth”得到. （估计曲线是不平滑的. 然而，我们不打算增加平滑度，这是因为在这一阶段，估计仅仅是用于说明. 对非参数平滑的全面的说明参阅§6.3）. 象大多数实际数据那样，延迟1的延迟回归有好的线性性，但对和4，延迟回归不太可能是的线性函数，导致进一步的结论是不是高斯过程. 受描绘在图4.8（a）中线性性的鼓舞，我们拟合了一个对的线性回归，得到模型. 我们分别相对于和，在图4.8（e）和（f）中画的残差. 正如所期望的那样，由于在图4.8（e）中的回归曲线事实上是零，几乎不包含残差的信息

27、. 但却包含了一些附加的信息. 在图4.8（f）中，除了几个“异常点”外，残差点几乎均匀地分布在回归曲线的两边，这条回归曲线明显是非线性的. 这说明的非线性依赖于它的延迟值. 总之，通过把以各种方式画数据的非参数平滑结合起来，我们识别了一些非线性特征，诸如时间不可逆性、非正态性和非线性自相依性.图4.8 对加拿大山猫数据，相对于（a），（b），（c）和（d），的散点图，核密度估计（实线）与这些散点图在一起. 还有相对于（e）和（f）所画的来自线性回归残差的散点图. 实线是非参数回归估计（b）检验线性性我们应用似然比检验（4.9）于零假设是一具线性AR（2）过程和对立假定取从具有两个分段的T

28、AR模型（4.1）且. 现在. 令等于90%的样本范围内点，我们有. 这样，. 按照表4.2，我们在水平拒绝线性AR（2）模型的零假设. （c）具有生态学解释的简单TAR模型对许多生态种群，存活率依赖于种群的大小，而种群的大小与许多因素有关，比如，生活环境资源的竞争、食物的限制、捕食者被捕食者的相互作用等等. 实际上，在种群的循环过程中，初期存活率是增加的，称为增加时期，在后来的发展进程中，不种群过大时，就进入减少时期. 一个种群的减少将顺次导致它的捕食者总群的减少，从而又使它的被捕食者的种群增加，还有资源的丰富. 这就轮替地进入到一个新的增加时期. 因此，这看来非常适用用门限模型来建模种群

29、动态，在这种模型中，不同的分段将反映种群循环的不同时期或阶段. 考虑到生物学的事实，H. Tong对山猫数据拟合了如下具有两个分段和延迟变量为的TAR模型：（4.12）见Tong（1990，第377页）. 丢掉误差项，我们重写以上模型如下：（4.13）在上面的分段（i.e. ）中，趋向负，这就意味着种群减少. 在下面的分段（即）中，缓缓地趋向正，意味着缓慢地种群增长. 事实上，由模型（4.13）生成的序列将收敛到周期为9的稳定极限环，它由长度为6的增长时期和长度为3的减少时期组成. 这与图4.5所看到的非对称循环是一致的. Stenseth et al. （1999）利用生态学中熟知的捕食

30、者（山猫）和被捕食者（野兔）的相互作用模型给出了一个好的解释. 正如我们上面所指出的那样，下面的分段粗略地对应着种群增加时期，上一分段对应着种群减少时期. 注意，在（4.12）中，在增加时期，的系数显著地为正，但正得不多. 在减少时期的系数显著地为负，而负了不少. 这些系数的符号反映了山猫和野兔相互联系在一个特定的被捕食者捕食者相互作用模式中. 在增加和减少时期中系数的差异表示为生态学中熟知的时期相依和密度相依，它仅能够在非线性模型中被反映. 时期相依意味着当山猫种群增加或减少时，山猫和野兔有不同的行为方式（猎杀或逃逸）. 密度相依蕴涵动物的再生产率以及它们的行为依赖于种群的丰富性. 关于对山

31、猫数据TAR拟合的生态学意义的进一步讨论，我们可参阅Stenseth et al. （1999）. （d）模型的AIC选择令，对山猫数据，AIC选择的TAR模型是（4.14）见Tong（1990，第387页）. 估计的门限是，它是图4.8（f）中回归估计的转折点. 对和的方差估计分别是0.0259和0.0505. 基于（4.8）（还可见定理4.2）计算的上半分段的中八个系数的标准误差依次分别是0.275, 0.094, 0.156, 0.149, 0.153, 0.170, 0.167和0.101. 在下半分段中的三个估计的系数的标准误差分别是0.655, 0.102和.195. 模型（4

32、.14）保持了简单模型（4.12）的基本动态. 例如，由（4.14）（丢掉误差项）生成的序列不收敛到具有长度为6的增加时期和长度为3的减少时期的周期为9的极限循环. 根据统计拟合，模型（4.14）给出了（4.12的一个改进）. 然而，它的更为复杂的形式还使生物学的解释不清楚. 两个模型之间的选择依赖于分析的目的. 显然，如果我们的目的是建模山猫种群的波动性和反映不同时期种群循环的不同的特征，则模型（4.12）将更可取. 另一方面，模型（4.14）享有更好的统计性质，对原始数据提供了更好的统计拟合. 此外，它可能还对将来值提供了更好的预报. 考察用不同的准则，比如AIC，BIC等，所选择的几个模

33、型，或者说用同一准则选择的最好的三个模型是一个好的方法. 最终选择的模型依赖于模型的由数据分析的目的所指定的统计和/或物理的性质. Tong（1990，第386页）的表7.6列出了山猫数据的六个选择模型. 模型（4.14）是被挑出来作为既有好的统计拟合又与山猫种群波动足够类似的模型. （e）诊断检验像所有统计拟合一样，尽管一些诊断思想早已融入现代建模方法，但对拟合一个非线性时间序列模型来说，构造一个诊断检验是重要的. 例如，由BIC选择的模型通常不受过度拟合的影响. 类似于拟合线性模型，残差方法仍然是最常用的诊断工具，见§3.5. 来自模型（4.14）的残差从容地通过了这些检验的大

34、多数. 把原始数据的一些特征和由拟合模型所生成的模拟数据的同样的特征进行比较还是有用的. 例如，正如我们在以上提到的那样，模型（4.12）和（4.14）都能成功地再产生非对称的种群循环.4.2 ARCH和GARCH模型与重点在于给条件一阶矩建模的传统的时间序列分析不同的是，ARCH和GARCH模型主要是考虑条件二阶矩的相依性的建模. 这很有希望适应解释和建模金融时间序列的风险和不确定性方面日益增长的要求. 在这一节，我们首先给出ARCH和GARCH模型的基本概率性质. ARCH/GARCH建模最常用的统计推断方法还将被介绍. 我们还简要地叙述ARCH/GARCH在金融时间序列中的应用. 进一

35、步我们将通过实际数据来说明GARCH建模的方法论. 这些方法已经作为工具加进S+GARCH附加一个模块到S-Plus系统. 最后，我们对随机波动率模型给出一个简要的介绍. 有关ARCH和GARCH建模的全面的讨论可阅读Gouriéroux（1997）.4.2.1 ARCH过程的基本性质定义4.2 具有阶自回归条件异方差（ARCH）模型定义为，（4.15）其中是常数，对所有的与独立. 由以上方程定义的随机过程称为ARCH过程. ARCH模型首先由Engle（1982）为建模英国的通货膨胀的预报方差而引进. 从此这个模型被广泛地用来建模金融和经济时间序列的波动率. 隐蔽在（4.15）

36、结构背后的基本思想是相当直观的：由过去所得的的预报分布是具有依赖于过程过去的比例常数的的分布的尺度变换. 因此，给定过去的的条件分位数还能够容易地计算，这个条件分位数在金融风险管理中起着重要作用（见下面§4.2.8的部分（e）和§8.5.6）. 例如，如果，则预报分布是具有方差的，其中方差依赖于所作预报的条件. 进一步，大的预报方差将是由过去大的绝对值所引起的. 这显然不同于基于经恶性循环模型的预报，因为线性模型的条件均方预报误差是常数；见命题3.4. 定理4.3 （i）（4.15）定义惟一的有有限二阶矩的严平稳过程的充分必要条件是. 进一步，且如果，则对一切. （ii）如

37、果，，（4.16）（4.15）的严来稳解有有限的四阶矩，即. 证明（i）和（ii）的充分性可直接由定理2.5得到. 由（4.15）和平稳性，或.（i）的必要性由Bollerslev（1986）的定理1得到，该定理证明了条件对（4.15）有（弱）平稳解还是必要的. （注意，在Bollerslev的文章中定理1不依赖正态性假定）. 实际上，保证. 由（4.15）易见，任何一个平稳ARCH过程还是一个白噪声；还可见定理4.3（i）. 进一步，（4.17）其中. 容易看到，对任何. （4.18）因此，对任何，由（4.17）和（4.18）或. （4.19）更一般地，对任何， . （4.20）以

38、上两个方程反映了这样一个事实，即预报中的高风险在它减弱前将持续一段时期；这个现象在金融时间序列中称为波动性类聚. 由定理4.3（ii）得到，在附加条件（4.16）下，其中.注意，在条件下，对所有.这样，对任何. 这意味着是因果过程. 因此，过程的ACF（还有ACVF）能够容易按照（2.20）和（2.18）来计算. 此外，由这些公式容易看到，尽管，如果，则对所有的. 如果我们采用峰度作为对分布重尾的度量，ARCH过程比白噪声有更重的尾部，这里由来定义. 为此，用表示分布的峰度. 则 .现在，由Jensen不等式得到 . （4.21）因此，. 在是正态和的情形下，有峭度（即重尾）. 我们把以上的发

39、现总结在下面的命题中. 命题4.1 设是由（4.15）定义的严平稳ARCH过程，其中. 则（i），且条件方差函数满足方程（4.19）. 在附加条件（4.16）下，（ii）是（线性）因果过程，如果，则它的ACF总是正的. （iii）即比白噪声有更重的尾部. 例4.1 考虑严平稳ARCH（1）过程，（4.22）其中. 则，且对，（4.23）用（4.23）递推，我们有，这个式子表明，大的值将导致大的预报风险（即条件方差），而风险将会在不远的将来持续一段时间. 假定. 这是条件（4.16）退化为，即. 在这个条件下，且满足因果AR（1）方程，其中. 因此，在以上方程的两边乘以项并取期望，我们

40、有 . 最后一项是利用事实. 易见，因此，有峭度（重尾）. 我们由（4.22）生成长度为1000的序列，其中正态. 前250个样本点被画在图4.9（a）中. 图4.9（c）是对应于条件标准差的图，它清楚地指出，大的和的值一起用线段表示. 在图4.9（b）中样本的直方图和在图4.9（d）中的QQ-图（相对于正态）表明，分布的尾部比正态的尾部更重. 图4.9（e）和（f）是和的样本ACF. 我们在图4.10重复以上的练习，只是取. 把图4.10（a）和（b）与图4.9（a）和（b）做比较可见，波动率对大的值更为显著. 图4.9（d）表明，尽管不像在情形那样显著，但分布的尾部还是比正态分布的尾部重.

41、注意，现在是因果AR（1）模型，ACF为；见图4.10（f）. 与图4.9（f）相反，对和有本质上的差异. 这归因于当，因此，ACVF没有定义.4.2.2 GARCH过程的基本性质 ARCH模型已有许多推广，它们中的一些推广是出于经济学的考虑，而另一些推广则含有明显的统计思想. 这些推广中最重要的是到模型包含滑动平均部分的推广，即推广的ARCH（GARCH）模型，它归功于Bollerslev（1996）和Taylor（1986）. 图4.9 例4.1由的ARCH（1）模型产生的1000样本：（a）和（c）是和的前250样本所画的时间序列图；（b）是标准化的直方图和具有相同均值和方差的正态密

42、度函数；（d）QQ-图：的分位数与样本分位数；（e）和（f）分别是和的样本ACF 图4.10 例4.1由的ARCH（1）模型产生的1000样本；（a）和（c）是和的前250样本所画的时间序列图；（b）是标准化的直方图和具有相同均值和方差的正态密度函数；（d）QQ-图：的分位数与样本分位数；（e）和（f）分别是和的样本ACF 定义4.3 具有和的推广的自回归条件异方差（GARCH）模型定义为，（4.24）其中和是常数，且对所有的与独立. 由以上方程定义的随机过程称为GARCH过程. 实证已经表明，只要大，定义在（4.15）的简单ARCH模型对金融时间序列就提供了一个合理的拟合. 由于（4.

43、15）的定义的合理性是用过去观测的平方时变的加权平均作为对条件方差的近似，把定义为不仅含有过去的，而且还有过去的是很自然的. 这就导致了以上的GARCH模型（4.24），事实上，它和ARMA模型间存在有趣的联系：，（4.25）其中，且 . （4.26）于是，形式上服从ARMA模型. 注意，有有限阶的和的可逆ARMA实际上是AR模型. 这就解释了为什么简单GARCH模型，比如，GARCH，对的一些复杂的自相依结构可以提供一个简洁的表示，仅有大的ARCH模型能够有此功能；还可见（4.17）. 事实上，GARCH模型在实证研究中已取得极大的成功，而且被许多计量经济学家认为是基准模型. 定理4.4

44、（424）定义惟一有有限二阶矩的严平稳过程的充分必要条件是 . （4.27）进一步，对任何.此外，如果假定，（4.28）则有. 证明注意，（4.24）中的第二个方程能够形式地写为.条件（4.27）蕴涵了对任何. 因此，，其中由如下方程确定. 因此，取，.类似于（2.20），能够按如下递推公式推计算：，对，.在以上表达式中，我们假定. 利用归纳法，我们可以证明对. 现在，由定理2.5和Bollerslev（1986）得到要证的定理；参看定理4.3. 在平稳性下，方差和协方差能够如下计算.这就意味着，即进一步，对，用双重期望公式，.这就完成了定理证明. 定理4.4对由具有有限二阶矩的模

45、型（4.24）定义的严平稳过程给出了一个充分必要条件. Bougerol和Picard（1992b）对严平稳解的存在性建立了一个充分必要条件，它不必要求有有限的二阶矩；还可见Kazakeviius和Leipus（2001）. 这个条件是针对与这个模型相关的随机矩阵以Lyapunov指数定义的，在实际中一般很难验证，因此，我们在此不给出这个结果. 在条件（4.27）下，且ARMA表示（4.25）是因果的和可逆的（尽管不必是有限的）. 于是，由（4.26），我们得到.因此，.这样，在（4.24）中定义的确定是给定它的无穷多过去观测时的条件方差. 如果是严平稳GARCH过程，且条件（4.28）成立，

46、则. 因此，. 在此情形，是定义在（5.8）的因果和可逆的ARMA过程，与ARCH过程不同，的ACF不必总是正的. 注意，如果我们用给定所有延迟变量来代替仅给定个变量的条件期望，峰度不等式（4.21）还成立. 因此，我们有下面的命题. 命题4.2 （i）由（4.24）定义的平稳GARCH过程是白噪声，且是给定无穷多的过去观测的条件方差. （ii）如果由（4.24）定义的是严平稳GARCH模型，且条件（4.28）成立，则是因果且可逆的ARMA过程. 进一步，比表现出更重的尾部，亦即. 例4.2 考虑平稳GARCH过程，（4.29）其中和是正的，. 则. 由于，我们有.因此V，它依赖于的无穷多

47、个过去值. 这是与ARCH（1）过程的明显差别，因为对ARCH（1）过程仅依赖于；见（4.23）. 这还表明GARCH过程比ARCH过程的波动聚集更具持续性. Nelson（1990）证明，GARCH（1,1）过程是严平稳的充分必要条件（可能具有无穷二阶矩）是.由Jensen不等式，. 因此，条件对保证定义（4.29）的是严平稳是充分的. 如果我们要求严平稳解还是弱平稳的（有有限的二阶矩），这个条件也是必要的. 在附加条件（4.28）下，. 现在，我们定义. 则由（4.25）有，即是因果和可逆的ARMA（1,1）过程. 它的ACF是 . （4.30）在（4.29）取和，并由这个模型生成长度为

48、1000的序列. 在图4.11的（a）和（c）中分别给出了这个序列的250个样本点和它们的条件标准差的图. 注意，这里生成的GARCH（1,1）过程和图4.9中生成的ARCH（1）过程有相同的（无条件）方差. 然而，将图4.9的（a）、（c）和图4.11的（a）、（c）相比较，GARCH过程的条件方差更具波动性. 进一步，GARCH过程有更长的持续波动聚集. 图4.11的（b）和（d）表明，的边缘分布是尖峰的. 平方的样本ACF是显著的自相关，但本身却不是的. 我们取重复以上的练习. 现在，. 的ACF有明确的定义. 画在图4.12（f）中的的样本ACF对真实的ACF提供了合理的估计，这里对和

49、3，真实的ACF分别是0.337, 0.202和0.120，它们由（4.30）获得. 相反地，当的ACVF没有定义. 画在图4.11（f）中的样本ACF不像定义在（4.30）中的函数. 我们还注意到，对较小的，重尾性质不再被断言；见图4.12的（b）和（d）. 尽管峰度是实际中使用的一个简单且直观度量，但它却没有对分布的尾部有多重给出一个直接的表述. 更为贴切的度量是由Kesten（1973）引进的尾指标. 对由（4.29）定义的系数满足的GARCH（1,1）模型，我们假定的概率密度函数具有无穷支撑，且存在常数使得对一切，和.则方程（4.31）定义了一个称为尾指标的惟一正常数，满足当，（4

50、.32）其中是（4.29）的严平稳解，且. 在以上的表达式中，符号“”的含义是表达式两边的两个量之比有极限，是常数. 显然，估计是一个困难的工作. 关于尾指标的进一步讨论，参阅Kesten（1973），Goldie（1991），de Haan, Resnick, Rootzen和Vires（1989）.图4.11 例4.2由和的GARCH（1,1）模型生成的1000个样本：（a）和（c）分别是前250个和的时间序列图；（b）归一化的直方图，与其具有相同的均值和方差的正态密度函数；（d）QQ-图：样本分位数与的分位数；（e）和（f）分别是和样本ACF图4.12 例4.2由和的GARCH（1,1）

51、模型生成的1000个样本：（a）和（c）分别是前的250个和的时间序列图；（b）归一化的直方图，与其具有相同的均值和方差的正态度函数；（d）QQ-图：样本分位数与的分位数；（e）和（f）分别是和样本ACF 在结束本节之前，我们指出，对GARCH）模型（4.24）来说，条件（4.27）对保证模型（4.24）有严平稳解不是必要的. 事实上，Bougerol和Picard（1992b）证明了，如果的分布有无界支撑，在零点没有原子，且，（4.33）则存在惟一的严平稳过程满足（4.24）和. 与求和ARMA（ARIMA）过程（即过程有单位根）类似，Engle和Bollerslev（1986）对满足（4.33）的GARCH过程创造了名字“求和GARCH”（IGARCH）. 也许这里值得提及的可能混淆是：正如我们在前面看到的那样，ARIMA过程总是非平稳，但一个IGARCH过程却可以是严平稳的.4.2.3 估计我们总假定是GARCH模型的严平稳解，即满足和，（4.34）其中. 基于观测，我们讨论模型中参数的各种估计方法. 我们在此的任务是估计条件二阶矩，由于其所具有特性，这一任务比估计条件均值更为困难. 即使是正确地得到似然函数

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

非线性时间序列第四章

文档简介

温馨提示

最新文档

评论

非线性时间序列第四章

文档简介

温馨提示

最新文档

评论

相关文档