免费预览已结束,剩余78页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
金融时间序列分析金融时间序列分析讲稿第一章 绪论第一节 时间序列分析的一般问题人们在日常生活和工作中会遇到大量的金融数据,如存款的利率、股票的价格、债券的收益等等,例 某支股票的价格。如何从这些数据中总结、发现其变化规律,从而预测或控制现象的未来行为,这就是时间序列分析这门课程所要研究的问题。研究方式预测数据建立模型数据的类型。横剖面数据:由若干现象在某一时点上所处的状态所形成的数据,称为横剖面数据,又称为静态数据。它反映一定时间、地点等客观条件下诸现象之间存在的内在数值联系。例如,上海证券交易所所有股票在某一时刻的价格;某一时刻全国各省会城市的温度,都是横剖面数据;研究方法:多元统计分析。纵剖面数据:由某一现象或若干现象在不同时点上的状态所形成的数据,称为纵剖面数据,又称为动态数据。它反映的是现象与现象之间关系的发展变化规律。例如,南京市1980年至2005年每年末的人口数;上海证券交易所所有股票在一年中每个周末收盘价,都是纵剖面数据研究方法:时间序列分析时间序列概念。时间序列: 简单地说,时间序列就是按照时间顺序排成的一个数列,其中每一项的取值是随机的。严格的时间序列的定义需要随机过程的概念。设是一个概率空间,其中是样本空间,是上的-代数,是上的概率测度。又设是一个有序指标集。概率空间上的随机变量的全体称为随机过程。注: 指标集可以是连续的也可以是离散的,相应地,随机过程也有连续和离散之分。定义:若是中的一个离散子集,则称随机过程是一个时间序列。简言之,一个离散随机过程被称为一个时间序列。注: 1、从统计意义上说,时间序列是一个统计指标在不同时刻上的数值,按照时间顺序排成的数列,由于统计指标数值受到各种偶然因素影响,因此这数列表现出随机性。 2、从系统论上说,时间序列是某一系统在不同时刻的响应,是系统运行的历史行为的客观记录。时间序列的特点:(1) 序列中的数据依赖于时间顺序;(2) 序列中每个数据的取值具有一定的随机性;(3)序列中前后的数值有一定的相关性-系统的动态规律(4) 序列整体上呈现某种趋势性或周期性。研究时间序列的意义通过对时间序列的分析和研究,认识系统的结构特征(如趋势的类型,周期波动的周期、振幅,等等);揭示系统的运行规律;进而预测或控制系统的未来行为,或修正和重新设计系统(如改变参数、周期等)按照新的结构运行。时间序列分析根据时间序列所包含的历史行为的信息,寻找相应系统的内在统计特征和发展变化规律性的整个方法,称为时间序列分析。注: 时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学的一个分支。时间序列分析的类型(详见P7)。确定性时序分析:设法消除随机型波动,拟合确定型趋势,形成长期趋势分析、季节变动分析和循环波动测定的时间序列分析方法,称为确定性时序分析。随机时序分析:对许多偶然因素共同作用的随机型波动,运用随机理论来研究分析,找出其中的规律性,称为随机时序分析第二节 时间序列的预测技术本课程主要研究诸如资产收益率等金融时间序列,这些时间序列具有一些典型特征。时间序列的预测技术就是通过对预测目标自身时间序列的分析处理来研究其变化趋势。时间序列的基本变动。长期趋势变动:指序列朝一定方向持续上升或持续下降,或停留在某一水平上的倾向。例如,1950年至2000年我国人口数一直保持增长的趋势;2000年至2005年人口数量稳定在13亿。季节变动:指在一年或更短的时间内,由某种固定周期性因素(如自然、生产、消费等季节性因素)的影响而呈现出有规律的周期性波动。例如,雅戈尔西服的销售量在春秋两季较高,而在冬夏两季较低。循环变动:指周期为一年以上,由非季节因素引起的涨落起伏波型相似的波动。例如,经济的过热或经济的萧条;股票市场大约每四年一次的牛市等。不规则变动:由许多不可控的偶然因素(如战争、自然灾害或其它社会因素等)和随机变动(即由大量随机因素产生的宏观影响)所共同作用的结果例如,黎巴嫩今年的经济因以色列突然入侵而蒙受重大损失;我国7月份福建、浙江因台风遭受重大损失等。几种常见的预测模型 如果在预测时间范围以内,无突然变动且随机变动的方差较小,并且有理由认为过去到现在的历史演变趋势将继续发展到未来,可以用如下一些经验方法来进行预测。简单预测模型:用现象的现在值作为其下一时刻的预测值,即 。移动平均模型(滑动平均,Moving Average Model):当预测目标出现某些不规则的变化,如特大值或特小值,用简单预测法将会产生较大偏差,可以用前一段时间的观察值的平均数来削弱不规则变化对预测的影响。设观察值序列,一次移动平均模型 为 我们用此值作为下一时刻的预测值,即令 。注:1、移动平均的特点是“修匀”原序列中的某些不规则变化而使之平滑化,并使趋势倾向更加明显。2、当预测目标的基本趋势是在某一水平上下波动时,可以用移动平均模型来作预测。3、当预测目标的基本趋势与某一线性模型相吻合时,常采用二次移动平均模型,即。4、当预测目标同时存在线性趋势和周期波动时,可用趋势移动平均模型,其中:,为周期长度。该模型在数据处理中常用来作为预处理,消除周期波动和减弱随机干扰的影响往往是有效的。指数平滑模型(Exponential Smoothing Model):观察移动平均模型可知,我们实际上是作了以下两个假定:(1)下一期的预测值只与前期的历史数据有关,而与前期以前的历史记录无关;(2)前期的历史数据对预测值的影响是相同的, 即都加权数。然而,这两条假定是存在一定缺陷的:假定(1)限制我们不能充分利用数据带来的信息;假定(2)与实际情况不相符合,因为一般说来距离预测期越远的数据对预测的影响应当越小。为了克服移动平均模型的缺点,更好地符合实际情况,我们应当对各期的观察值依时间的顺序进行加权平均来作为预测值。设观察值序列为, 由移动平均模型有如用代替,并记,则上式可以写成一般地,一次指数平滑模型 为其中()为加权系数。利用上述递推公式,我们可以进一步得到 注:1、上式中加权系数呈指数函数衰减,加权平均能消除或减弱随机干扰的影响。2、指数平滑模型是以当前时刻为起点,综合历史数据的信息,来对未来进行预测的。其中加权系数的选择是提高预测精度的关键。根据经验,的取值范围一般为0.10.3。3、类似地,我们也有如下的二次、三次平滑公式,等等,加权系数的作用:由一次指数平滑公式有其中最后一个括号表示对上期预测误差的修正,因此,的大小反映了对上期预测误差修正的幅度值越大,加权系数的序列衰减速度就越快,采用的历史数据就越少。由此可以得到取值的一般原则: (1)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则值应取小些,以减少修正幅度,使预测模型包含更多历史数据的信息;(2)如果预测目标的基本趋势发生系统变化,则值应取大些,可以偏重新数据的信息队原来模型进行大幅度修正,以使预测模型适应预测目标的新变化。第三节 金融时间序列及其特征金融时间序列分析研究的是资产价值随时间演变的理论和实践。它是一个带有高度经验性的学科, 但也像其它科学一样,理论是形成分析推断的基础。然而,金融时间序列分析有一个区别于其它时间序列分析的主要特点:金融理论及其经验的时间序列都包含不确定因素。例如,资产波动率有各种不同的定义,对一个股票收益率序列,波动率是不能直接观察到的。正因为带有不确定性,统计理论和方法在金融时间序列分析中起重要作用。资产收益率多数的金融研究是针对资产收益率而不是资产价格。Campbll, Lo和MacKinlay (1997) 给出了两个使用收益率的主要理由: 第一,对普通的投资者来说,资产收益率的高低完全反映了投资机会的大小; 第二,收益率序列比价格序列有更好的统计性质,因而更容易处理。设是资产在时刻的价格,假定资产不支付分红。单周期简单收益率若从第天到第天这一个周期持有某种资产,则单周期的简单毛收益率 定义为 或 对应的单周期简单净收益率 或 称简单收益率 为。多周期简单收益率若从第天到第天这个个周期内持有某种资产,则周期简单毛收益率定义为 周期简单毛收益率也称为复合收益率。由上式可见,周期简单毛收益率恰是个单周期简单毛收益率的乘积周期简单净收益率 为注:在实践中,实际的时间区间对讨论和比较收益率很重要的,例如是月收益率还是年收益率。若时间区间没有明确给出,那么一般认为隐含假定时间区间为一年。如果持有资产年限为年,则年度化的平均收益率定义为 年度化的即为个单周期简单毛收益率的几何平均。由于算术平均要比几何平均容易计算,所以年度化的平均收益率也可以用算术平均来表示为:年度化的注意到单周期收益率一般很小,利用一阶Taylor展开式 与 ,年度化的平均收益率又可以进一步近似地表示为:年度化的。连续复合收益率连续复合的含义:例 假定银行存款的年利息为10%,最初存款为1美元。假如该银行每年支付一次利息,那么一年之后存款的额度变为1+0.1=1.1美元。假如该银行每半年支付一次利息,六个月的利息率是10%/2=5%,第一年之后存款的额度为美元。一般地,假如该银行一年支付次利息,那么每次支付的利息率为10%/m,一年后存款的额度变为美元。下表给出一些常用的时间间隔下年利率为10%时存款1美元的结果类型一年半年季度月周天连续地支付次数1241252365无穷多每周期利率0.10.050.0250.00830.1/520.1/365净值(美元)1.11.10251.103811.104711.105061.105161.10517可见,净值趋于,这个值就是连续复合的结果。一般地,连续复合的净资产值为: 其中是年利率,是初始资本,是年数。由此式我们可以得到称为年后价值为的资产的现值 连续复合收益率: 资产的简单毛收益率的自然对数称为连续复合收益率 或 对数收益率(log-return): 其中注: 连续复合收益率与简单净收益率比较有一些优点:1、 对多周期收益率,我们有 即,连续复合多周期收益率恰是各连续复合单周期收益率之和2、 对数收益率有更容易处理的统计性质。3、 根据泰勒公式,我们有如下有关系式 ,即毛收益率的对数近似等于净收益率。资产组合收益率由个资产组成的一个资产组合的简单净收益率是它所包含的各资产的简单净收益率的加权平均,其中每个资产的权重是资产组合的总价值中该资产的价值所占的百分比。 设是一个资产组合,其在资产上的权重为,那么在时刻的简单收益, 其中是资产的简单收益率。收益率分布的假定。正态分布 金融研究中传统的假设是:简单收益率是相互独立的,且都服从一个固定均值为、方差为的正态分布。这个假设使得资产收益率的统计性质变得可以处理,但它遇到几个麻烦:第一,简单资产收益率的下界为-1,而正态分布的支撑是没有下界,它可以取到实直线上的任何值;第二,如果是正态分布的,那么多周期的简单收益率就不是正态分布的,因为它是单周期收益率的乘积;第三,经验结果不支持正态性假设,很多资产收益率数据表明它具有正的超出峰度,即具有厚尾性。对数正态分布 金融研究中另一个常用的假设是:资产的对数收益率是相互独立的,且都服从一个均值为、方差为的正态分布。此时,简单收益率就是独立同分布的对数正态的随机变量,由=exp, 容易计算得到的均值和方差分别为, 这两个式子在研究资产收益率是有用的。如果简单收益率服从对数正态分布,均值和方差分别为,通过计算可以得到其对数收益率的均值和方差分别为, *第四节 随机变量的矩 最近的理论研究和实证结果表明:对收益率的两个传统假定并不成立,即收益率序列并不是服从正态分布的,实际上它存在着尖峰厚尾现象。为描述这一现象,我们需要下面矩的概念。随机变量的矩设连续型随机变量的密度函数为,则的阶矩 定义为 一阶矩称为的均值 或 期望,它表示的是分布的中心位置,记为。的阶中心矩 定义为二阶中心矩称为的方差,它表示取值变化的程度,记为。方差的算术根称为的标准差注:1、三阶中心矩度量关于其均值的对称性;四阶中心矩度量的尾部。的偏度(skewness)定义为标准化的三阶矩, 即 的峰度(kurtosis)定义为标准化的四阶矩, 即 量称为超出峰度, 具有正的超出峰度的分布称为具有厚尾性 。注:2、所谓“超出峰度”是以正态分布为标准比较而言的。正态分布的峰度,故其超出峰度为0。分布具有“厚尾性”意即该分布在其支撑的尾部有比正态分布更多的“质量”。在实际中,这意味着来自于这样一个分布的随机样本会有更多的极端值。注:3、在应用中,偏度和峰度可以由它们对应的样本偏度和样本峰度来估计。设是的个观察值的随机样本,样本的均值为样本方差为样本偏度为样本峰度为注:在正态分布假定下,和均渐近正态分布,均值为零,而方差分别为和。(参见Snedecorhe Cochran(1980), P.78)注:4、类似地,我们也可以给出离散随机变量的偏度和峰度的定义。第二/三章 线性时间序列模型时间序列列的一个重要特征是它的前后数据之间具有相关性,这反映系统的现在行为与历史行为是有关联的,也就是说系统对过去行为具有记忆性,也叫做系统的动态性。记忆性(动态性) 。记忆性 指某一时刻进入系统的输入对系统后继行为的发生影响的性质。 输入 输出(响应)系统 。动态性 指系统现在行为与历史性为的相关性,即在时间序列中,观察值之中蕴含有相关关系。从系统观点来看,动态性即指系统的记忆性。若某输入只影响系统的下一时刻的行为,而对其后的行为不发生作用,则称系统有一期记忆性 或 一阶动态性 。类似可以定义系统的阶记忆性。例:一个病人服用镇痛药,在时刻服用,相当于在时刻进入神经系统的一个输入-镇痛药,结构图如下: 输入 输出(响应)神经系统 镇痛药 精神状态如果此药仅在下一个时刻有效,此后无效,该系统具有一期记忆性,其动态性可用下图表示: 假如服药后四小时内有效,且药力递减,第五个小时后无效,则系统的动态性图示如下: 注:如何定量描述系统的记忆性,这是时间序列分析的主要内容,时间序列模型就是系统记忆性的具体描述,建模过程驾驶记忆的定量描述过程。例如,若某系统的输入和输出为:时间 1 2 3 4 5 6输入 0 0 0 0 0输出 0 0 0 0 0则模型为。若某系统的输入和输出为:时间 1 2 3 4 5 6输入 0 0 0 0 0输出 0 0 0 0 0则模型为。若某系统的输入和输出为:时间 1 2 3 4 5 6输入 0 0 0 0 0输出 0 0 0 0则模型为。 一般地,系统的记忆性可以用如下模型表示:其中表示在时刻系统对输入的记忆程度,或者输入对系统输出的影响程度。称为系统的记忆函数。实际上,我们所掌握系统的信息总是有限的,因此描述系统的记忆性的模型一般为有限形式:其中的是一个随机误差。 。线性时间序列 若时间序列能够写成 ,其中是的均值,是零均值、独立同分布的随机变量序列(即白噪声),则称为线性时间序列。 。线性时间序列理论 包括平稳性、动态相依型、自相关函数、建模和预测 。经济计量模型 (1)简单自回归(AR)模型;(2)简单滑动平均(MA)模型;(3)混合的自回归滑动平均(ARMA)模型;(4)季节模型。第一节 平稳性。严平稳 对时间序列,若对所有的、任意正整数和任意个正整数,随机变量组的联合分布与随机变量组的联合分布均是相同的,即满足关系式:则称是严平稳的。 换言之,严平稳性要求的联合分布在时间的平移下是不变。注:严平稳性的条件是相当强的,根据定义很难验证。稍微弱一点平稳性是如下的定义。弱平稳 对时间序列,若(1); (2) 仅与有关,则称是弱平稳的 或 宽平稳的。 换言之,若和与的协方差均不随时间变化,则是弱平稳的。注:1、弱平稳性意味着数据的时间图显示出其值在一个常数水平上下以相同幅度波动;2、在弱平稳性的条件中,隐含地假定了的头两阶矩均是有限的;(请读者验证)3、弱平稳对时间推移的不变性表现在统计平均的头两阶矩上,严平稳对时间推移的不变性表现在统计平均的概率分布上,二者的要求不同。严平稳与弱平稳的关系命题1.1 若时间序列是严平稳的,且它的头两阶矩是有限的,则也是若平稳的。反之一般不成立,命题1.2 若时间序列是正态分布的,则严平稳与弱平稳时等价的。白噪声序列:若时间序列是一个有有限均值和有限方差的、独立同分布的随机变量序列,则称为白噪声序列,否则称为有色噪声。若还服从均值为0、方差为的正态分布,则称为高斯白噪声。注: 白噪声与白色光有相似的特性:白色的光谱在各频率上有相同的强度;白噪声的谱密度在各频率上的值也相同。例1 高斯白噪声序列是弱平稳的。设高斯白噪声序列,即它们是独立同分布的随机变量且,又。故。所以是弱平稳的。注:平稳性条件是难以验证的。在实际中,如果某过程前后的环境和主要条件够不随时间变化,就可以认为是平稳的。如在工业生产中,原料质量、机器性能、工艺过程、工人技术、自然条件(气温、雨量等)没有剧烈变化,就可以认为其过程是平稳的。若进行了工艺革新、设备改造、工人岗位变动等,则这一工业生产过程就是非平稳的了。自协方差 对弱平稳时间序列,协方差称为间隔为的自协方差。命题1.3 设弱平稳时间序列,则自协方差具有如下性质:(1); (2)。 第二节 相关系数和相关函数对资产收益率,我们希望用简单模型来刻画与时刻之前所拥有的信息之间的线性关系。这里的信息可以包括的历史值和决定资产价格的经济环境的状态。所以,相关系数在理解这些模型中起着重要作用,所研究的变量与其过去值的相关系数是线性时间序列分析的重点。这些相关系数被称为自相关系数,它们是研究平稳时间序列的基本工具。随机变量的相关性 两个随机变量的相关系数为: 其中和分别是的均值,并且假定方差是存在的。注:1、相关系数度量的是随机变量线性相关的程度。我们知道有以下性质: (1) 且 ; (2)若,则随机变量是不相关的; (3)若都是正态随机变量,则是互相独立的。 2、如果有样本,相关系数可以由它所对应的样本相关系数来估计:其中,分别为的样本均值。自相关函数(ACF) 。自相关函数 设时间序列,与的相关系数称为的间隔为的自相关系数,记为,即注:当时间序列是弱平稳时,自相关系数与时间无关,而只是间隔的函数,此时由于,我们有进一步还有,(1) ; (2) 弱平稳序列是前后不相关对所有,。例2 设高斯白噪声,由例1已经算得 故高斯白噪声的自相关函数为:。例3 设是随机变量,。记 ,则时间序列有 ,又。所以对任意,。注:例3的结论表明时间序列具有极强的相关性。实际上,该序列的每一项是相同的,因而也是严平稳的。与例2比较可知,白噪声是另一个极端的情形。 。样本自相关函数(ACF) 假定有样本,则的间隔为1的样本自相关系数为 一般地,的间隔为的样本自相关系数定义为 注:1、若是独立同分布(iid)序列,且,则对任意固定的,是渐近地服从均值为0、方差为的正态分布(见Brockwellhe 和Davis(1991))。此结果可以用来检验原假设 对备选假设。检验统计量为通常的比,即,它渐近地服从标准正态分布。 2、若是一个弱平稳序列,满足,其中,是高斯白噪声序列,则对于,渐近地服从均值为0、方差为的正态分布(见Box, Jenkins和 Reinsel(1994))。3、对于有限样本,是的有偏估计。事实上,若记,称其为样本自协方差。因为对于,所以,是的有偏估计。又由于,所以也是的有偏估计。4、由于偏差的阶为,因此,在样本容量较小时是不容忽视的。但在大多数金融应用中,都是相当大的,故这个偏差影响并不大。定义 称函数 , 为的样本自相关函数注:自相关函数(ACF)在线性时间序列分析中起着重要作用。事实上,线性时间序列模型可以完全由其ACF所决定,线性时间序列的建模就是用样本ACF来刻画数据的线性动态关系的。第三节 滑动平均模型在金融收益率序列的建模中有一类简单模型是滑动平均模型,它可以看作是白噪声序列的简单推广。滑动平均模型概念 滑动平均模型的英文为:Moving-Average Model, 缩写为:MA模型。MA(q)模型 假定是均值为零、方差为的白噪声序列,则称, 为q阶滑动平均模型,简记为MA(q)模型。注:1、MA模型是用白噪声序列组成的一个加权平均;2、MA模型具有许多吸引人的特点,包括简单的均值和自协方差结构。MA模型性质。MA(1)模型的均值和方差 ,对MA(1)模型:,两边取期望可得 ;两边取方差可得 。一般地,我们有如下命题:命题3.1 对MA模型,我们有(1) MA模型是零均值的;(2) MA(q)模型的方差为 。MA模型的平稳性 MA模型总是弱平稳的。 因为,且 。MA(1)模型的自相关函数 , 对在MA(1)模型。两端同乘以,得 ,利用MA(1)模型的递推性质,将上式右端用白噪声表示,有两边取期望,得 由于,故, , 对。类似的计算可以得到(请同学自己验证):。MA(2)模型的自相关函数 对MA(2)模型,有, 对。注:1、上述自相关函数式表明:MA(1)模型的自相关函数在间隔为1以后是截尾的;MA(2)模型的自相关函数在间隔为2以后是截尾的;一般地,对MA(q)模型有,但对有,即MA(q)模型 的自相关函数在间隔为以后是截尾的。因此MA(q)序列是一个“有限记忆”模型。2、某些金融时间序列有时会有正的均值,这时就应当是把这个常数均值 添加入到模型中去,使得MA(q)模型变为那么,通过计算可以得到 ,而方差和自相关系数均保持不变。 例3.1 考虑MA(1)模型:,通过计算(同学自己完成)可得, , 对。即与上面MA(1)模型 具有相同的自相关函数。问题:MA(1)序列与具有相同的相关系数,那么选择哪一个模型更为合适呢?为回答这个问题,我们将白噪声分别用数据与表示: (1) (2)如果,方程(1)收敛而方程(2)发散,此时我们应当选择MA(1)序列。MA模型的阶的识别自相关函数是识别MA模型的阶的非常有用的工具。如果MA时间序列的自相关函数满足:,但对有,则服从一个MA(q)模型。注:在实际问题中,我们是计算序列的样本自相关函数,如果从某以后的样本自相关函数显著的小,则可以近似地视样本自相关函数在项以后是截尾的,从而是阶MA模型。第四节 自回归模型另一类常用的模型是自回归模型。自回归模型之所以有吸引力是因为它与很传统的线性回归模型非常相像。美国芝加哥大学证券价格研究中心(CRSP)价值指数的月收益率具有统计显著的间隔为1的自相关系数,这表明延迟的收益率在预测时会有一定的作用,描述这样的预测功能的模型就是所谓的一阶自回归模型。自回归模型概念 自回归模型的英文为:Auto Regressive Model,缩写为:AR模型。AR( p)模型 假定是均值为零、方差为的白噪声序列,则称, 为p阶自回归模型,简记为AR(p)模型。注:1、自回归模型从形式上看与线性回归模型很相似,但是,两者又有显著的不同。下面以一阶自回归模型为例来与一阶线性回归模型进行比较:一阶回归模型:一自回归模型:是确定性取值,是随机性变量值,均是随机变量一随机变量对另一确定性变量的依存关系一随机变量对自身过去值的依存关系静态条件下研究动态条件下研究,皆是独立的独立,之间有相关性条件回归无条件回归 二者之间的联系:若固定时刻且已知时,AR(1)是一元线性回归;而当我们用时间序列的过去(滞后)值代替线性回归模型的预测子后,就得到一个AR模型。因此我们有理由相信经典回归所导出的大部分统计结果可以只作少量的修改就可以推广到AR情形。 2、阶自回归模型反映了系统的期记忆性,或阶动态性质,即,系统的时刻的状态主要与该时刻之前的个时刻的状态有关,而与时刻之前个时刻以前的状态无关。 3、模型中是因变量,是解释变量,表示对的依赖程度。 4、对AR(1)模型,在已知过去收益率的条件下,我们有 , ,即,给定过去收益率,现在的收益率将以为中心取值,离散程度以衡量。AR模型的性质。AR(1)模型的均值 当AR(1)序列是弱平稳时,其均值为零,即, 在AR(1)序列 的两边取期望,得由弱稳定性假设可知 ,以及对所有的,我们有 ,于是,当时有。AR(1)模型的方差 当AR(1)序列是弱平稳时,其方差为 , 将AR(1)模型写为 (4.1)两边取方差,得 (4.2)为计算,我们利用叠代方程(4.1),重复叠代可推得, (4.3)将(4.3)式两边同乘以再取期望,得 利用白噪声序列的独立性,我们有 。由式(4.2)得 。在平稳性的假定下,故。注: 类似等式的证明,可以得到等式,这表明白噪声序列在时刻的噪声与其以前各时刻的历史记录是独立的。AR(1)模型的弱平稳性由于AR(1)模型弱平稳的条件之一是方差非负有限,即, 所以,即。于是,我们得到命题4.1 AR(1)模型是弱平稳的必要条件是。注:由命题4.1,我们可以推得:对AR(1)模型,若系数,则该模型不是弱平稳的。问题:我们如何判断AR(1)模型是弱平稳的呢?事实上,我们可以证明:命题4.2 AR(1)模型是弱平稳的。AR(1)模型的自相关函数 当AR(1)序列是弱平稳时(即),在AR(1)模型 的两边乘以,再取期望得到 (4.4)为计算,我们在模型 的两边同乘以并取期望,得,这里用到了与的独立性。由(4.4)式及关系,我们有 对,由后一方程推得。 又因,故有 。注:1、AR(1)模型的自相关系数从开始以比率为指数衰减,因此不能在任意有限间隔后截尾。(然而由于是一指数衰减,实际问题的计算时,也可以视为是截尾的。) 2、若为正时,AR(1)模型的自相关函数图在上方以比率指数衰减;若为负时,AR(1)模型的自相关函数图由上下两个都以比率衰减的图形组成。=0.8的ACF图:=0.8的ACF图:3、如果把一个常数加入到方程中,使得AR(1)模型变为 (4.4)仿照上面方法计算可得(请同学自己验证):, ,这表明序列的均值与常数项有关,而方差和自相关函数均保持不变。易见,的均值为零。为求方差,由上述均值公式可得,代入(4.4)得利用此方程重复叠代可推得, (4.5)将(4.5)式两边乘以再取期望,并利用序列的独立性,我们有 。由协方差定义,。故对(4.4)式两边平方再取期望,可得即 其中是的方差。在平稳性的假定下,故。AR(2)模型的均值 用类似上面的方法(请同学自己验证),可以证明均值 当AR(2)序列是弱平稳时,其均值为,。AR(2)模型的自相关函数由AR(2)模型两端同乘以,有 (4.3)利用AR(2)模型的平稳性以及,对(4.3)式两边取期望,得, ()称为平稳AR(2)模型的矩方程。 对上述矩方程两边同乘除以,我们可以得到平稳AR(2)时间序列的自相关函数满足条件: ()进一步,有 (1) , () (2) 对间隔为1的自相关函数,利用以及的对称性,有, () 命题4.3 若AR(2)序列是弱平稳的,则其自相关函数满足二阶差分方程 ()其中是向后推移算子,即。注: 对弱平稳AR(2)序列,我们没能得到自相关函数的具体表达式,而仅得到了自相关函数所满足的差分方程。AR(2)模型的特征方程与特征根上述自相关函数所满足的差分方程决定了平稳AR(2)时间序列的自相关函数的特性,同时也决定了 的预测方法。定义:与二阶差分方程对应的二次多项式为 ,称为AR(2)模型的特征方程,其解称为AR(2)模型的特征根。记AR(2)模型的特征根为 。 (i) 若,则和均是实数,此时模型中二次差分方程能分解成,这表明AR(2)模型可以看成两个AR(1)模型的叠加。此时的自相关函数是两个指数衰减的混合。(ii) 若,则和均是复数,的自相关函数将呈现出减幅的正弦和余弦的图像。在经济和商业的应用中,复数特征根是很重要的,它们会导致商业环的出现。对于经济时间序列模型来说,复数特征根是经常出现的。对AR(2)模型而言,若出现一对共轭复特征根,则其随机环的平均长度为 。例 考虑美国的实际国民总产值(GNP)的嫉妒增值率,时间是从1947年第二个季度到1991年的第一个季度。可以简单利用AR(3)模型来分析,用表示增长率,建立模型为:,改写成得到对应的三阶差分方程将方程分解为第一个因子表示所考虑的GNP增长率大体上呈指数衰减;对第二个因子,有。因此,这个AR(3)模型的第二个因子说明美国的实际GNP的嫉妒增长率中存在随机商业环。这一点是合理的,因为美国经济经历了膨胀和紧缩期。随机环的平均长度大约为这大约为3年。若用一个非线性模型把美国经济分解成“膨胀期”和“紧缩期”,数据将表明紧缩期平均长度大约为三个季度,而膨胀期的平均长度为3年。10.83个季度是这两个平均长度的折中。AR(2)模型的弱平稳性命题4.4 AR(2)模型是弱平稳的条件是其两个特征根的模都小于1,即,。(推导从略)注:如果把一个常数加入到方程中,使得AR(2)模型变为 (4.6)仿照上面方法计算可得(请同学自己验证): , 且自相关函数也满足二阶差分方程 ,即具有与原来相同的特征根。为求的自相关函数满足的条件,由此均值公式可得,代入(4.6)得两端同乘以,有利用AR(2)模型的平稳性以及,对上式两边取期望,得, ()两边同乘除以,得 ()即满足二阶差分方程 。AR(p)模型均值 当AR(p)序列是弱平稳时,其均值为, 特征方程 平稳性条件 特征根的模皆小于1,即 。自相关函数 当AR()序列是弱平稳时,则其自相关函数满足差分方程 ()识别AR模型的阶AR模型的阶的识别并不像MA模型直接利用其自相关函数那么简单,需要所谓的偏自相关函数。而偏自相关函数的引入比较麻烦且不容易理解,我们留在下一章再去介绍。第五节 简单的ARMA模型在有些应用中,为了把握较复杂现象的时间序列,我们需要高阶的MA模型或AR模型才能充分地描述数据的动态结构,这样就会有多个参数需要估计,问题就变得复杂起来。为避免由此带来的困难,人们想到AR模型与MA模型结合起来,这就是自回归滑动平均模型(见Box, Jenkins 和Reinsel (1994) )。自回归滑动平均模型概念自回归滑动平均模型的英文为:Auto Regressive and Moving Average Model, 简记为:ARMA模型。 。ARMA(p,q)模型 假定是均值为零、方差为的白噪声序列,则称为ARMA(p,q)模型。注:金融中的收益率序列,直接用ARMA模型的机会较少。然而,ARMA模型的概念与波动率建模有密切联系。事实上,推广的自回归条件异方差(GARCH)模型就可以近似地认为是关于序列的ARMA模型。ARMA(1,1)模型的性质。ARMA(1,1)模型的均值 当ARMA(1,1)序列 是弱平稳时,其均值为零,即 , 在ARMA(1,1) 模型 的两边取期望,得由弱平稳性可知:对所有的,。又由,我们有。于是,当时有 。注:一般地, 当序列是弱平稳时,ARMA(1,1) 模型与AR(1)模型具有相同的期望值。ARMA(1,1)模型的方差 当ARMA(1,1)序列是弱平稳时,其方差为, 在ARMA(1,1) 模型 的两端乘以再取期望,得 (5.1) 再在模型 的两端取方差,得 (由与不相关及(5.1))所以当序列平稳时,有,故当时,有。ARMA(1,1)模型的平稳性 由于ARMA(1,1)模型弱平稳的必要条件之一是方差是非负有限的,即, 所以,即。于是,我们又有命题5.1 AR(1)模型是弱平稳的必要条件是。(这又与AR(1)模型的条件是相同的。)。ARMA(1,1)模型的自相关函数 当ARMA(1,1)模型是弱平稳时,其自相关函数为: 在ARMA(1,1) 模型 的两端乘以,有 假定序列是弱平稳的,则有 。对,在上式两端取期望,并利用时的(5.1) 式,我们有 (5.2) (注意:此结果与AR(1)情形的不同)对,取期望后得到 。(注意:此结果与AR(1)情形是相同的)一般地,对我们可以得到 (5.3)因此,且对有。注:ARMA(1,1) 模型的自相关函数与AR(1) 模型的自相关函数相像,不同之处是ARMA(1,1) 模型的自相关函数从间隔2开始以比率指数衰减,因此不能在任意有限间隔后截尾。ARMA(p,q)模型的性质将ARMA(p,q)模型 改写为或记 ,则上式可以写成 (5.4)这里分别称多项式和为ARMA模型的AR多项式和MA多项式。此地要求AR多项式与MA多项式没有公因式,否则模型的阶(p,q)将会降低。注:1、与AR和MA模型一样,ARMA模型的性质通常也可以由它的自相关函数来刻画。例如,AR多项式引进了ARMA模型的特征方程。若特征方程的所有根的模皆小于1,则ARMA模型是稳定的;此时序列的均值为。4、 在识别ARMA模型的阶时,其自相关函数和偏自相关函数都不是很有用的。而要用到所谓的推广的自相关函数,其思想是简单的。如果我们能得到ARMA模型的AR部分的相合估计,则能导出AR部分,对所导出的MA序列,用自相关函数来决定MA部分的阶(见Tsay 和 Tiao (1984)。 第四章 时间序列模型的建立第一节 时间序列模型的特征函数 自相关函数是时间序列模型的一个特征函数,其分析方法基本上与平稳随机过程理论类似,只是结果有很大不同。在时间序列分析中还有一些在平稳随机过程中所没有的特征函数,如格林函数、逆函数、偏自相关函数等,它们从不同的侧面来反映时间序列模型的特性。下面我们就来介绍这几个函数。格林函数 (Green 函数,G函数) 格林函数刻画的是时间序列模型对于过去时刻进入系统扰动的记忆性。由ARMA模型 解出,得用多项式除法,可得或,式中的系数称为格林函数。注:利用格林函数,把表示为完全由过去时刻的进入系统的噪声所产生的对的影响,即系统对过去噪声的记忆性。因此,我们可以用一个MA模型来逼近的行为。这种表达式称为的传递形式。具体地说,格林函数是个单位之前进入系统的噪声对现在响应的权重。记换句话说,表示了系统对先前噪声记忆的程度,因此也称为记忆函数。 。MA(q) 模型的格林函数 , ,, , 由MA(q)模型 显见。 。AR(1) 模型的格林函数 , 由AR(1)模型 改写为 ,解出得 所以 。注:对于AR(1)模型,如果,则当时,即系统在充分长时间后将恢复到它的平衡位置(期望为零)。这从另外一个角度导出了AR(1)模型平稳的条件。ARMA(2,1) 模型的格林函数 , 其中,为模型的AR多项式的两个根。由ARMA(2,1)模型 改写为 ,解出得 (*)若ARMA(2,1)模型有特征根与,即其自回归多项式有分解式:,则(*)可以作部分分式分解所以,。注: 对于ARMA(2,1)模型,仅当两个特征根的模均小于1时,即且,才有,即系统是平稳的。如果两个特征根有一个模大于1,将导致发散,系统就不平稳了。例1 判定ARMA(2,1)模型的平稳性,并计算它的格林函数求解该模型的AR多项式的根,得,。由于两个特征根均是小于1的正数,所以该模型是平稳的。将特征根,代入格林函数计算公式有于是。由此可见,该模型的格林函数呈现快速下降的趋势。逆函数 (I函数) 逆函数刻画的是时间序列模型的对于过去时刻记录的记忆性。 由ARMA模型 解出,得用多项式除法,可得, (*)或 式中的系数称为逆函数。注:1、利用逆函数,把表示为过去所有历史时刻的对系统所产生的影响。即系统对于过去所有历史时刻的的记忆性。因此,我们可以用一个AR模型来逼近的行为。这种表达形式称为“逆转形式”。2、(*)式也说明了白噪声序列可以由时间序列的加权平均来表示。 。AR(1) 模型的逆函数 , 由A R(1)模型 显见。 。MA(1) 模型的逆函数 , 由MA(1)模型 改写为 ,解出得 所以。 。ARMA(1,2) 模型的逆函数其中,为模型的MA多项式的两个根。(请同学自己验证)注:由上述结论看出:AR(1)模型和MA(1)模型的格林函数和逆函数之间具有如下的对偶关系,即格林函数逆函数AR(1),MA(1),观察表格可以看出:AR(1)的与MA(1)的形式一样,仅是符号相反,参数互换。一般地,用代替,用代替,代替,且用AR多项式的根代替MA多项式的根,即可实现各类林函数与逆函数之间的转换。(请同学通过计算ARMA(1,2)模型的格林函数和ARMA(2,1)模型的逆函数,自己比较它们之间的对偶性质。)。ARMA(p,q) 模型的可逆性 称一个时间序列模型是可逆的,如果它的逆函数有界。注:可逆性是对ARMA模型滑动平均参数,所施加的一种约束条件。由ARMA(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025国网河南省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题含答案详解(轻巧夺冠)
- 2026国网江苏省电力校园招聘(提前批)笔试模拟试题浓缩500题附答案详解(典型题)
- 2026国网四川省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及答案详解1套
- 效果图制作合同
- 国家管网集团2026届高校毕业生招聘考试备考题库(浓缩500题)带答案详解(满分必刷)
- 告知解除劳动合同
- 洋河股份合同
- 2025至2030藤木类中药行业发展趋势分析与未来投资战略咨询研究报告
- 2026秋季国家管网集团建设项目管理公司高校毕业生招聘考试参考题库(浓缩500题)及参考答案详解(培优a卷)
- 2025至2030内窥镜碎石术设备行业项目调研及市场前景预测评估报告
- 2024-2025学年七年级语文上册 第二单元 单元测试卷(人教安徽版)
- 《窗口操作掌握牢》参考课件
- 慢性白血病课件
- 铝锭合同范本2024年
- GB/T 9799-2024金属及其他无机覆盖层钢铁上经过处理的锌电镀层
- 2024年河南南阳人才发展集团下属子公司招聘笔试冲刺题(带答案解析)
- GB/T 4074.6-2024绕组线试验方法第6部分:热性能
- 腾讯面试自我介绍
- 肾性骨病的防治培训课件
- 【S省社会组织发展存在的问题及优化建议探析11000字(论文)】
- 以部编五上《太阳》教学为例谈小语跨学科学习任务群教学设计
评论
0/150
提交评论