《时间序列分析》教案_第1页
《时间序列分析》教案_第2页
《时间序列分析》教案_第3页
《时间序列分析》教案_第4页
《时间序列分析》教案_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、时间序列分析教学方案时间序列分析是将经济理论、经济数据和数学方法相结合,对经济行为理论进行定量化分析的统计方法。时间序列分析运用时域和频域分析方法,对经济现象的运动过程和现象间相互关系进行系统的定量分析。判断经济运行状态,预测未来发展趋势,建立理论模型,进行模型结构分析和实证研究。时间序列分析对于分析经济结构、运行机制、经济预测及宏观经济政策评价具有理论和实践意义,对于提高企业经营决策水平具有现实指导意义。第一章 时间序列分析与预备知识教学目的与要求 本章主要通过介绍时间序列分析的研究目的、意义、主要内容及应用领域,使学生对时间序列分析这门课程有一个大致的了解,同时讲授一些时间序列分析的基本概

2、念,为进一步学习打下基础。1 了解时间序列分析的研究目的、意义和主要内容及应用领域。2 了解随机过程、随机序列的基本概念。3 掌握随机序列的分布、特征函数。4 掌握平稳序列的定义、统计意义及其线性运算,了解平稳序列的遍历性。4 掌握线性差分方程的形式与求解方法。 重点与难点本章的重点是掌握时间序列的基本概念、分类、以及特性。本章的难点是平稳时间的定义与统计意义,线性差分方程的形式与求解方法。第一节 时间序列分析概述一 时间序列定义、分类、特征 1引例 按时间次序排列的观察值集合。按照研究的现象或问题的不同,可以得到各种时间序列。经济时间序列:经济学家观察某种物价指数波动-物价指数时间序列。逐日

3、股票价格、逐月人均收入、逐月产品进口总额、逐年公司利润等。图1 1964年1999年中国纱年产量的发展变化图自然科学中时间序列,自然科学家观察气候的变动,可得到逐日降雨量,逐时、逐月平均气温等时间序列。图2 1949-1998年北京市每年最高温度序列图1770年1869年太阳黑子年度个数序列人口统计学研究人口变动的规律性,可得到逐年人口出生率,逐年的死亡率,逐年的人口总量等人口统计学中的时间序列。过程控制,在生产过程中,问题是要求测量表征过程质量的变量来检测生产性能的变化。这些测量值可对时间画出图形,如下图当测量值偏离某一目标值较多时,就采取适当的校正措施以控制该过程。过程控制时间 二进过程,

4、在观察值只能取两个数值(通常0和1)中一个时,形成一类特殊的时间序列,如下图,叫二进过程。 时间点过程:研究在时间上随机出现的一系列事件时,形成另一类不同的时间序列。例如我们记录的发生重大火车车祸的日期。这类时间时间的序列通常称为点过程,观察这类事件时,我们关心的是给定时间周期里事件出现数目的分布以及事件间隔时间的分布。2 时间序列的定义从统计意义上将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往出现某种随机性,彼此之间存在着统计上的依赖关系。从数学上讲如果我们对某一个过程中的某一个变量或一组变量进行观察,在一系列时刻(为自变量,且

5、)得到离散有序数集称为离散数字时间序列,即随机过程的一次样本实现。从系统意义上时间序列是某一系统在不同时间(地点、条件等)的响应。这个定义从系统运行的观点出发,不仅指出时间序列是按一定顺序排列而成的,这里的“一定顺序”即可以是时间顺序,也可以是具有各种不同意义的物理量。可见时间序列只强调顺序的重要性,而并非强调必须以时间顺序。3 时间序列的特点时间序列中数值取值依赖于时间的变化,但不一定是时间的严格函数。时间序列中每一时刻的取值具有一定随机性,不可能完全准确的用历史数据预测。前后时刻(不一定相邻时刻)的数据有一定相关性。从整体上看,时间序列往往呈现某种趋势性或出现周期性变化的现象。二 时间序列

6、分析方法的目的、定义及其分类(一) 时间序列分析的目的由于时间序列包含了对该系统的历史行为的全部信息,所以我们研究时间序列的目的是揭示相应系统的内在统计特性和发展规律,尽可能多地从中提出我们所需要的准确信息。其具体内容如下:1预测对个别数列前后期相关性之了解来对数列未来观测值作预测。2描述给出一个时间序列,首先画出数据图并得出该时间序列的一些主要特征,并对其简单描述和度量。 拐点 跳点3说明同时分析多个相关随机序列,以期了解序列之间前后期及同期间之关系。这类动态关系如果存在,将可被用来提高预测准确度,以及对系统中某些变量的调控有助益。4过程控制根据对一个随机序列(多个随机序列)的一段观察结果的

7、分析,寻求对某些量的控制措施,以达到某种最优化的目的。5政策评估:.对特殊政策或事件的影响加以评估。6实证分析. 对理论性模式与数据进行适合度检定,以讨论模式是否能正确地表示所观测之现象,如一些常见的经济模式(Economic Model) 或计量模型(Econometric Models)。 (二)时间序列分析方法 我们把用来实现上述目的的整个方法称为时间序列分析方法。它是一种根据动态数据揭示动态数据结构和规律的统计方法,是统计学学科的一个分支。其基本思想是根据系统的有限长度的运行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报

8、。(三) 时间序列分析方法的分类 人们为了根据时间序列揭示所研究对象的动态规律性,在认识实践再认识的不断循环过程中,产生了一系列分析研究时间序列的方法。主要分为以下两类:1确定性时间序列方法这种方法主要适合于由确定性因素引起时间序列的变动,其通常显示出非常明显的规律性,比如有显著性的趋势或者有固定的变化周期,这种规律性新系通常比较容易提出。传统的时间序列分析通常把重点分析放在提出确定性信息地提出上。其目的:克服其它因素的影响,单纯测度出某一个确定性因素对序列的影响;推断出各种确定性因素彼此之间的相互作用关系及它们对序列的综合影响。其主要方法有:发展水平分析(水平分析和速度分析) 趋势变动分析有

9、些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测 趋势拟合法:就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法。根据序列所表现出的线性和非线性特征,可分为线性拟合和曲线拟合。线性拟合模型为: 式中,为随机波动,就是消除随机波动的影响之后该序列的长期趋势。曲线拟合模型:模型变换参数估计方法二次型令,原模型变换为:线性最小二乘法指数型 对原模型求对数,再令原模型变为:用线性最小二乘法求出,再变换修正指数模型: 不能转换成线性模型迭代法Gompertz型:不能转换成线性模型迭代法Logistic型:

10、不能转换成线性模型迭代法 平滑法平滑法是进行趋势分析和预测时常用的一种方法。它是利用修匀技术,消弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律。其具有调节灵活、计算简便的特征,广泛用于计量经济学、人口研究等诸多领域。根据所用平滑技术的不同,平滑法又可以具体分为移动平均法和指数平滑法。 A 移动平均法其基本思想:假定在一个比较短的时间间隔里,序列值之间的差异主要是由随机波动造成的。根据这种假定,我们可以用一定时间间隔内的平均值作为某一期的估计值 其分类:n期中心移动平均 n期移动平均:注意:移动平均期数确定的原则为、事件的发展有无周期性,以周期长度作为移动平均的间隔长度

11、,以消除周期效应的影响;、对趋势平滑的要求,一般移动平均的期数越多,修匀曲线越平化,表现出的长期趋势越清晰,拟合趋势越平滑;、对趋势反映近期变化敏感程度的要求 ,移动平均的期数越少,拟合趋势越敏感。移动平均预测公式如下: B 指数平滑法指数平滑方法的基本思想:在实际生活中,我们会发现对大多数随机事件而言,一般都是近期的结果对现在的影响会大些,远期的结果对现在的影响会小些。为了更好地反映这种影响作用,我们将考虑到时间间隔对事件发展的影响,各期权重随时间间隔的增大而呈指数衰减。这就是指数平滑法的基本思想 分类:简单指数平滑 式中为平滑系数,它满足。因为 所以 简单指数平滑法面临一个确定初始值的问题

12、。我们有许多方法可以确定的初始值,最简单的方法是指定。同时平滑系数的值由研究人员根据经验给出。一般对于变化缓慢的序列,常取较小的值,相反对于变化迅速的序列,常取较大的值。经验表明值介于0.050.3之间,修匀效果比较好。在此基础上,我们可以进行预测,设为第期的一次指数平滑值,为第期的动态数据。指数平滑的1期预测值: =指数平滑2期预测值: Holt两参数指数平滑Holt参数指数平滑适用于对含有线性趋势的序列进行修匀。它的基本思想是假定序列有一个比较固定的线性趋势每期都递增或递减,那么第期的估计值就应该等于第期的观察值加上每期固定的趋势变动值,即 由于随机因素的影响,使得每期的递增或递减不会恒定

13、为,它会随时间变化上下波动,所以趋势序列实际上是一个随机序列,因而 考虑用第期的观察值和第期的估计值的加权平均数作为第期的修匀值: 因为趋势序列也是一个随机序列,为了让修匀序列更平滑,我们对也进行一次修匀处理: 把式代入式,就能得到比较光滑的修匀序列。这就是Holt两参数指数平滑的构造思想,它的平滑公式: 式中,为两个平滑系数,也称为两个平滑参数,它们满足。同样此法也面临着确定初始值的问题,在此我们需要确定两个序列的初始值:平滑序列的初始值。最简单的是指定=。趋势序列的初始值假定最后一期的修匀值为,那么使用两参数指数平滑法方法,向前期的预测值为: 。季节波动分析有些时间序列呈现出固定的周期性变

14、化,我们分析目的主要分析时间序列周期变动的规律性。主要方法有周期点平均法、三角函数模型法和帕森斯季节性分析。趋势季节模型 其中,是序列变动趋势项,是季节指数,它表示季节性变动幅度的大小,;如月度为周期;季度为周期。具体步骤如下:将时间序号表示为年份序号和每年种各时期序号。 其中为数据跨越的年度数,为一年中时期数。对趋势变动,建立线性回归预测模型或简单时间非线性回归预测模型。 计算季节指数,建立预测模型 各时期的季节指数定义为 令 称为季节指数的平均值。季节变动的预测模型为 加法型季节模型 当季节周期波动呈现一种脉冲形式时,加法模型便不适用了。季节比例法计算各年的月平均值 令 计算的平均值,若预

15、测年份的头月数据已知,则在预测年份的后个月份预测模型为 季节效应分析 例 以北京市1995-2000年月平均气温序列为例,介绍季节效应分析的基本思想和具体步骤。绘制该序列的时序图,如下:时序图分析通过时序图,我们发现北京市1995-2000年每月的平均气温随着季节的变动有着非常规律的变化,气温的波动主要受到两个因素的影响:一个是季节效应;一个是随机波动。假如没有季节效应的影响,北京市的气温应该在某个均值附近随机波动,因为季节效应的存在,使得气温会在不同年份的相同月份呈现出相似的性质。为了便于得到数量化的季节信息,我们构造季节指数的概念。所谓季节指数就是用简单平均法计算各时期季节性影响的相对数。

16、其计算基本步骤:第一步:计算周期内各期平均数第二步:计算总平均数第三步:计算季节指数季节预测模型:注意:季节指数的理解:n 季节指数反映了该季度与总平均值之间的一种比较稳定的关系n 如果这个比值大于1,就说明该季度的值常常会高于总平均值n 如果这个比值小于1,就说明该季度的值常常低于总平均值n 如果序列的季节指数都近似等于1,那就说明该序列没有明显的季节效应 综合分析要对趋势起伏变动和季节效应应同时进行分析,首先必须了解它们之间的相互作用关系。但是,通常我们并不知道它们到底是怎样综合作用而影响序列变化的,这时只能根据序列的表现,选择一些经验模型来估计各因素之间的相互作用关系。常用的模型有:加法

17、模型乘积模型混合模型或式中,代表序列的长期趋势波动;代表序列的季节性(周期性)变化;代表随机波动。例 1 对1993年2000年中国社会消费品零售总额序列(数据见附录1.11)进行确定性时序分析。绘制时序图选择拟合模型。从该序列的时序图中,我们看到长期递增趋势和以年为固定周期的季节波动同时作用于该序列,因而尝试使用混合模型(3)拟合该序列的发展 计算季节指数月份季节指数月份季节指数10.98270.92920.94380.94030.92091.00140.911101.05450.925111.10060.951121.335消除季节影响后拟合该序列的趋势变动规律。根据拟合模型假设,原始序列

18、值除以相应的季节指数,就基本消除了季节性因素对原序列的影响,而只剩下长期趋势变动和随机波动的影响: 经过处理得到如下图:上图显示该序列有一个基本线性递增的长期趋势。于是考虑用一元线性回归进行趋势拟合:残差检验。用原需列除以季节指数,再减去长期趋势拟合值之后的残差项就可以视为随机波动的影响。 得到残差图如下:残差图显示残差序列仍然存在一定的相关性。这说明我们拟合的这个模型还没有把原序列中蕴含的相关信息充分提出出来,这是却定性分析方法常见的缺点。因素分解法德侧重点在于确定性信息快速、便捷地提取,但对于信息提出的充分性常常不能达到完美。 (6)短期预测 (5)X-11过程简介 X-11过程是美国国情

19、调查局编制的时间序列季节调整过程。它的基本原理就是时间序列的确定性因素分解方因素分解:长期趋势起伏 季节波动 不规则波动 交易日影响 模型 加法模型 乘法模型 方法特色: 普遍采用移动平均的方法、用多次短期中心移动平均消除随机波动用周期移动平均消除趋势、用交易周期移动平均消除交易日影响。注意:在确定性影响很强劲而不确定性影响很微弱时,选择合适的确定性模型通常会得到非常不错的分析预测结果。从总体上看,确定性时间序列方法刻画了序列的主要趋势,且直观、简单,易于计算,便于运用。但是,相对说来,刻画较为粗略,其假定,尤其是对于时间函数型来说,比较严格,现实问题很难完全满足。2 随机性时间序列分析方法随

20、着研究领域的不断拓广,人们发现单纯的确定性时间序列分析有很大的局限性。在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展通常会出现非常强的随机性,想通过对序列的确定性分析,总结出随机变量发展变化规律,并准确预测它们将来的走势通常是非常困难的。为了更准确地估计随机序列发展变化的规律,从20世纪年代开始,学术界利用数理统计学原理分析时间序列。研究的重心从表面现象的总结转移到分析序列值内在的相关关系上,由此提出了随机性时间序列分析方法。主要有两大类:频域(Frequency domain)分析方法原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动。发展过程早期的频域

21、分析方法借助富里埃分析从频率的角度揭示时间序列的规律; 后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数;20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段。 特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性。应用方向:电力工程、信息工程、物理学、天文学、海洋学和气象学等领域。时域(time domain)分析方法时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。原理:事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。目的:寻找出序列值之间相关关系的统计规律,

22、并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势。特点:理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法 分类:一元时间序列分析、多元时间序列分析等。(四)时间序列分析的手段1 数据图法:将时间序列在平面坐标系中绘出坐标图,根据图形直接观察序列的总趋势和周期变化以及异常点、升降转折点等。这种方法简单、直观、易懂易用;但是获取的信息少且肤浅和粗略;需要有相当丰富的分析经验,否则难以获得更深层次的信息;分析结果的主观性大。2 指标法:通过计算一系列核心指标来反映研究系统的动态特征。如反映变化率的发展速度和增长速度,反映均衡性和节奏性动态平均指标和变

23、异指标等等。虽然指标法较数据法客观,但它所提出的信息仍是肤浅、有限的。3 模型法:对给定的时间序列,根据统计理论和数学方法,建立描述该序列的适应或最优统计模型,并进而据以进行预测或控制。三 时间序列分析的基本特征与其它学科的区别时间序列分析的基本特征是研究序列随时间发展的模式。主要特征如下:1 顺序性。时间序列与其它变化数列不同,序列中的观察值是按照一定顺序取得的,并保持其顺序不变。2 依存性。时间序列中的观察值之间存在着一定的依存关系。3 自身性。时间序列分析对序列未来预测判断的依据不同。第二节 时间序列的建立要分析时间序列,就必须建立一个时间序列。一般来说,研究者是运用记录仪或通过观察测量

24、来获得所研究系统的真实有限的数据集合的。有时也可以直接用二手资料。但是,不论是通过哪一种途径获得的时间序列,在进行分析处理前,必须对所依据的资料进行认真地检查、整理,有时还需要进行适当的预处理。我们把获取时间序列以及对其进行检查、整理和预测处理等工作,称为时间序列的建立。一 时间序列数据的采集1 采样:按照一定的时间间隔对所研究系统的系统响应进行记录和观察。2 采样间隔(时间频率):相应地把记录和观察的时间间隔,一般采样是等间隔的,比如年、月、日等。3 采样原则:关键采样间隔的选择,希望所采到的样本没有信息损失,也没有信息余。二 离群点的检验与处理1 离群点定义:一个时间序列中,远离序列一般水

25、平的极端大值和极端小值。因此。也称之为奇异值,有时也称其为野值。2 离群点产生的原因采样中的误差被研究现象本身由于受各种偶然非正常的因素影响而引起的。3 离群点造成的影响离群点会直接影响模型的拟合精度,甚至会得到一些虚假信息。4 离群点的分类加性离群点(Additive Outlier),造成这种离群点的干扰,只影响该干扰发生的那一个时刻上的序列值,即,而不影响该是可以后的序列值,。更新离群点(Innovational Outlier),造成离群点的干扰不仅作用于,而且影响时刻以后序列的所有观察值,它的出现意味着一个外界干扰作用于系统的开始,并且其作用方式与系统的动态模型有关。水平移位离群点(

26、Level Shift Outlier),造成这种离群点的干扰是在某一时刻,系统的结构发生了变化,并持续影响是可以后的所有行为,在数列上往往表现出时刻前后的序列均值发生水平位移。 暂时变更离群点(Temporary Change Outlier),造成这种离群点的干扰是在时刻干扰发生时具有一定初始效应,以后随时间根据衰减因子的大小呈指数衰减的一类干扰事件。5 离群值的处理根据数据取值进行检查,如果某一时刻的数值超出了一定的范围,则认为该点是一个离群点,并用一定的方法进行剔点处理。对数据进行模型分析,然后根据拟合模型后的剩余序列计算特定的统计量,测出显著的离群点及其类型,并用相应的模型进行休整,

27、然后再对修正模型的剩余序列重复上述程序,依次测出各个离群点。三 缺损值的补足四 时间序列建立的实例1 确定时间序列的时间间隔2 确定指标计算范围3 确定计算方法4 确定指标口径5 检查数据6 调整数据 第三节 随机过程与随机序列 一 随机过程的直观背景和定义 1 例子 例1 在一条自动生产线上检验产品质量,每次取一件,若取到“废品”记为0,“合格品”记为1,以表示第时刻的检验结果,对于给定的时刻,是一个随机变量,如果要研究该产品的质量,就要观察的变化规律,即得到一族随机变量。 例2 统计某种商品在时刻的库存量(假设库存量为正整数,且该仓库最大容量为),对于固定的时间,库存量是一个随机变量。如果

28、要了解商品库存情况,就要研究库存量随时间变化的过程,可在某段时间的变化,这样就得到一族随机变量。 例3 某公共交通线上每一站的上下车人数之差是一个随机变量,要了解这条线路上的客流变化情况,就要研究各站的上下车人数,所以同时考虑多个随机变量。从以上例子知道,随机过程是依赖一个参数而变化的随机变量(或随机向量),也可以是一族随机变量(或随机向量)。2 随机过程的定义定义1 (从时间变化角度来考察)若对于每一个特定的(是一个无穷集合,称为参数集),是一个随机变量,而取遍参数集所有值,就会得到一族无穷多个随机变量是一个随机过程。可见,随机过程是依赖于时间的一族随机变量。定义2(从试验结果来看)若对事物

29、变化的全过程进行一次观察,得到的结果是一个时间的函数,但对同一事物的变化过程独立重复进行多次观测,所得的结果是不相同的,则称这种变化过程为随机过程。定义3(从数学角度来看)设给定概率空间和为某参数集(足标集),对于任意,是该概率空间上的一个随机变量,而取遍参数集所有值,得到一族随机变量,记为或,称为上的随机函数,称为上的随机过程。几点说明:足标集()又称为时间参数集,当时,称为离散时间随机过程,也称为随机序列;当时称随机函数为随机过程。一般随机过程简记为。从定义来看,对随机过程,当固定时,为上的一个随机变量,当不固定时,是上的函数,也称为现实或轨迹。从概率统计角度看,如果表示某试验结果的随机变

30、量,那么每一次试验,就能获得的一个取值,即固定,称为的一个样本。对于随机函数而言,它就是一个样本函数在上的函数。对于随机过程来说,它就是一条曲线或称轨道,在很多实际情形中,可由自动记录仪记录下来,有时称这种函数为随机过程的一个实现。对于随机序列()而言,其一次观察结果是一普通实数列,称为随机序列的一个实现或样本。3 随机序列由随机过程的定义可知,随机序列是离散型随机过程,即,要对随机序列进行研究,就必须对随机过程进行观测,其一次观测结果是一普通实数数列为随机序列的一个实现或样本。在实际问题中,因为随时间序列的流逝不能重复,所以我们往往仅能获得随机序列的一个实现。而长度为的动态数据为随机序列的长

31、度为个的观测值。今后称为随机序列的长度为的样本。注意:随机序列的正整数变量通常表示时间,比如表示第小时,第天,第年等等。但也表示其他含义,比如,在生物学上表示代,地质学上表示第层。但大量问题与时间有关,故通常表示时间,所以为时间序列。 二 随机过程(序列)的概率分布 1 有穷维分布函数族的概念 我们知道,一个随机变量的统计规律完全由它的分布函数所刻画,而维随机变量的统计规律完全由它们的联合分布函数所刻画,一个随机过程(序列)是一族随机变量,所以,要用一族分布函数来刻画其统计规律性。 设为随机过程(序列) 一维分布函数族 的分布函数来刻画其统计规律。 = 称为的一个一维分布函数,称为的一维分布函

32、数族。 二维分布函数族 为一个二维随机向量,它具有二维分布函数: 称为二维分布函数族。 维分布函数族 为一个维随机向量,它的维联合分布函数为: 称为的维分布函数族。 由于和的任意性,一切上述分布函数族的全体给出了随机序列统计规律的完整描述。 2 有穷维分布函数族定义对于随机过程, 所确定的一切分布称为随机过程的有穷维分布函数族。 3 有穷维分布函数具有下列两个性质:对称性对 的任一排列,有相容性设,则这两个性质称为柯尔莫哥洛夫的相容性条件。4 柯尔莫哥洛夫定理(随机过程存在定理)设给定足标集以及满足柯氏相容性条件的有限维分布函数族则必存在一个概率空间上的随机过程,以这个分布函数族唯有穷维分布函

33、数族,即这个定理是随机过程存在性定理,它肯定了对给定的分布函数族必存在随机过程以为有限维分布函数族。三 随机过程(序列)的数字特征函数虽然有穷维分布函数族能用来描述随机过程的统计特性,但是在实际问题中,给出随机过程的有穷分布函数族或者根本不可能,或者过于复杂,而且对对数实际问题也并不是必要的,因此我们引入随机过程的某些数字特征寒暑,如均值函数、自相关函数等等来描述的基本概率特性。一方面它们能够反映随机过程的分布特长,另一方面在一些特殊情况,它们能够完全确定有穷维分布函数族。1 二阶矩随机序列设为随机序列,若,二届原点矩,则称为二阶矩随机序列。说明的均值与方差都存在。2 二阶矩随机序列的数字特征

34、函数均值对于随机序列而言,任意时刻的序列值都是一个随机变量,都有它自己的概率分布,同时也有其数学期望,令,使得随机变量总是围绕在常熟附近作随机波动。当取遍中所有值时,我们就得到一个均值函数序列,称其为的均值函数,反映了时间序列的每时每刻的平均水平。方差设为二阶矩随机序列,任意时刻的序列值都是一个随机变量,其存在方差 ,当取遍中所有值时,我们就得到一个方差函数序列,称其为的方差函数序列,用来序列值围绕其均值做随机波动时平均的波动程度。自协方差函数设设为二阶矩随机序列,称为的自协方函数,它是二元函数,常记为 当时,为的方差。 自相关函数(ACF)(autocorrelation function)

35、 设为二阶矩随机序列的自协方函数,令 称为的自相关函数,是无量纲,它也是二元对称函数,它与一样来描述同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。 例1 求下列随机序列的数字特字特征函数: 设,其中和是相互独立的服从标准正态分布的随机变量。 设,其中是相互独立的且服从的随机变量,为一实数。 注意:虽然可以由的一维和二维分布函数族唯一确定,但是由于它们不能确定的有限维分布函数族,因此仅仅研究均值函数和自协方差或自相关函数不能代替对整个随机序列的研究,但是,对于正态随机序列而言,有限维分布函数族可以完全由所确定。 五 几个常见的随机过程(序列) 1 独立随机

36、过程(序列) 如果随机过程(序列) 对任意有限维分布函数满足:正整数,有 那么称为独立随机序列。 2 纯随机序列(白噪声随机序列) 如果满足如下性质: 任取有;,有 称序列为纯随机序列,也称为白噪声序列,简记为注意:白噪声序列的性质:纯随机性;方差齐性3 正态随机序列设为二阶矩随机序列,其有穷维分布函数族是一个正态分布族,则称为正态随机序列。(见P23)。对于的维联合密度函数为正态分布:其中而为协方差矩阵,即*正态随机序列的任何线性运算,其结果仍然是正态随机序列。4 独立同分布随机序列设为二阶矩随机序列,是相互独立且服从同一个分布,若正整数,其有穷维分布函数族为,则称为独立随机序列。第三节 平

37、稳随机序列一 平稳随机序列的定义 平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。 (一) 严平稳时间序列1 定义 设为一时间序列,对任意正整数,任取,有 则称为严平稳时间序列。2 严平稳的含义:它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化,而随机序列的统计特性完全由它们的联合概率分布族决定,所以序列严平稳是随着时间的推移的不变性表现在任意有穷分布函数族上。宽平稳时间序列1 定义设为二阶矩随机序列,并满足: 对一切,为常数; 任取且有则称为宽平稳时间序列。宽平稳时间序列也称为弱平稳或二阶平稳。2 宽平稳的定义:宽平稳是使用序列的数字特征函数来

38、定义的一种平稳性。它认为序列的统计特性主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要行近似稳定。宽平稳序列对时间的推移的不变性表现在同机平均的一阶、二阶矩上。严平稳与宽平稳的关系1 严平稳序列未必是宽平稳序列。比如服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一阶、二阶矩,所以无法验证它的二阶平稳。2 宽平稳序列未必是严平稳序列。3 具有二阶矩的严平稳序列必为宽平稳序列。4 对正态序列:严平稳序列 宽平稳序列例2 白噪声序列为平稳序列。证明:由于满足如下性质: 任取有;,有 所以, 为平稳随机序列。例3 设为一随机序列,并且之间相互独立,试证是一宽平稳序列

39、。证明: 故是宽平稳随机过程。二 平稳时间序列的统计特性根据平稳时间序列的定义,可以推断出它具有如下两个重要的统计性质。1 常数均值 对一切,为常数; 方差齐性 2 自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关。任取且有根据这个性质,可以将自协方差函数由二维简化为一维:3 平稳时间序列的延迟阶自协方差函数和阶自相关函数对于平稳时间序列,任取定义为时间序列的延迟阶自协方差函数: 根据平稳序列的这个性质,容易推断出平稳序列一定具有常数方差: 由延迟阶自协方差函数的概念可以等价得到延迟阶自相关函数的概念: 容易验证和相关关系一样,自相关函数具有如下性质:规范性且对称性非负定性对

40、于任意正整数,相关阵为对称非负定矩阵。 值得注意的是除了具有这三个性质外,它还具有一个特别的性质:非唯一。一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。三 平稳时间序列的线性运算在概率统计中,经常要对随机变量进行加、减等线性运算,对于随机序列来说,同样也可进行不同时刻随机变量之间的线性运算。1 设为零均值平稳序列,为两个实数,是某一固定整数,令 ,则仍然是零均值平稳序列。2设为零均值平稳序列,为实数数列,且,令 ,则也是零均值平稳序列。四 平稳时间序列的意义时间许可分析方法作为数理统计学的一个专业分支,它遵循数理统计学的基本原理,都是利用样本信息

41、来推测总体信息。1 传统的统计分析通常都拥有如下数据结构,随机变量样本12n根据数理统计学常识,显然要分析的随机变量越少越好(越小越好),而每个变量获得的样本信息越多越好(越大越好)。因为随机变量越少,分析的过程就会越简单,而样本容量越大,分析结果就会越可靠。2 时间序列分析的数据结构有它的特殊性,对随机序列而言,它在任意时刻的序列值都是一个随机变量,而且由于时间的不可重复性,该变量在任意一个时刻只能获得唯一的一个样本观察值。因而时间序列分析的数据结构如下:随机变量样本1由于样本信息太少,如果没有其他的辅助信息,通常这种统计结构是没有把法进行分析。而序列平稳性概念的提出可以有效地解决这个困难。

42、3 在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列 变成了只含有一个变量的常数序列,原本每个随机变量的均值只能依靠唯一的一个样本观察值去估计 ,现在由于,于是每一样本观察值,都变成了常数均值的样本观察值 ,这极大地减少了随机变量的个数,并增加了待估变量的样本容量。换句话说,这极大地简化了时序分析的难度,同时也提高了对均值函数的估计精度。同理,根据平稳序列二阶矩平稳的性质,我们可以得到基于全体观察样本计算出来的延迟自协方差函数的估计值:并进一步推导出总体方差的估计值: 和延迟自相关函数的估计值: 当延迟阶数远远小于样本容量时: 第四节 线性差分方程在时间序列的时域分析

43、中,线性差分方程是很重要的工具,本节将简略地介绍它的一般形式和求解公式。一 差分运算与延迟算子 阶差分1 阶差分运算:我们相距一期的两个序列值之间的减法运算称为1阶差分运算。一般记作2 阶差分运算:对一阶差分后序列再进行一次1阶差分运算称为2阶差分。记为阶差分运算:依次类推,对阶差分后序再进行一次1阶差分运算称为阶差分,记为的差分:。2 步差分相距的两个序列值之间的减法运算称为步差分运算。记为的差分: 。 延迟算子(后移算子)延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨一个时刻。记为延迟算子,有延迟算子有如下性质:1 2 若为任一常数,有3 对任意

44、两个序列,有4 5 ,其中 用延迟算子表示差分运算1 阶差分 2 步差分 二 线性差分方程线性差分方程的定义1 线性差分方程 设为序列,若满足如下关系式 其中,为实数;为的已知函数。则称为所满足的线性差分方程。2 齐次线性差分方程特别,若,则差分方程 为所满足的齐次线性差分方程。3 利用延迟算子表示线性差分方程 为了简便起见,记 今后,称方程为相应的特征方程,它和方程的根(这时把当成变量)是互为倒数。设为特征方程的特征根。齐次线性差分方程的解齐次线性差分方程的求解要借助它的特征方程和特征根。我们知道齐次线性差分方程的特征方程为,这是一元次线性方程,它至少有个非零特征根,为。由于特征根的取值不同

45、,齐次线性差分方程的解会有不同的表达式,下面分别讨论:1 为个不同的实根这时齐次线性差分方程的解为 其中为任意实数。 证明:我们只须验证此解的确是方程的解即可。将上式代入方程的结尾: 2 中有相同的实根不妨假定为个相同实根,而互不相同的实根。这时方程的解为: 式中为任意实数。3 中有复根由于差分方程的系数为实数,所以其复根必呈共轭出现。不妨假定 为一对共轭复根,其中,而为互不相同实根,这时方程的解为:式中为任意实数。 由于齐次线性差分方程的解含有个任意实常数,所以称其解为齐次线性方程的通解。只有它满足个初始条件才能唯一的确定解。非齐次线性差分方程的解求非齐次线性差分方程的解通常需要进行两步运算

46、。首先求出齐次线性差分方程的的通解然后求出该非齐次线性差分方程的特解。所谓的特解就是任意一个值,使得非齐次线性差分方程成立,即 。由于 两者相减得 而从而 ,这个解为齐次线性差分方程的解。时间序列模型与线性差分方程线性差分方程在时间序列分析中有着重要的应用。常用的时间序列模型和某些模型的自协方差函数和自相关函数都可以视为线性差分方程,而线性差分方程对应的特征根的性质对判断模型的平稳性有着非常重要的意义。例1 设非负齐次常系数差分方程为 求它的通解。解:它的相应齐次差分方程为 的解,所以为相应齐次差分方程的通解。 设为所求方程的特解,代入原方程得 比较等式两边的系数得 所以是原方程的特解,从而原

47、方程的通解为 为任意实数。第六节 时间序列分析的基本步骤一 观察时间序列的各种特征。二 根据时间序列的特征判断该序列是否为平稳时间序列?三 如果是平稳时间序列,进行第四部,否则进行以下处理: 1 第一种方法,利用某种方法把非平稳时间序列转化成平稳时间序列,也就是剔除确定性部分,对剩余的序列进行平稳性分析。 2 第二种方法,先对确定性部分进行确定性时间序列分析,得出其的模型形式,再利用公式得到随机性部分。四 对平稳时间序列进行纯随机性检验。如果为纯随机性平稳时间序列,则研究就终止,否则进行一步。五 对平稳非纯随机时间序列进行平稳时间序列分析。六 利用所建立的模型进行各种应用。第七节 纯随机性时间

48、序列的检验方法纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一种方法。我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任何相关关系,即满足 这是一种理论上才会出现的理想状况。实际上,由于观察值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零。例 2绘制1949-1998年北京市最高气温序列的样本自相关图,如下: 样本自相关图显示这个纯随机序列没有一个样本自相关系数严格等于零。但是这些自相关关系确实都非常小,都在零值附近以一个很小的幅度做着随机波动。这就提醒我们应该考虑样本自相关函数的分布性质,从统计意义上来判断序列的性质。Barlett证明,如果一个时间序

49、列是纯随机序列,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关关系数将近似服从均值为0、方差为序列期数倒数的正态分布,即 根据Barlett定理,我们可以构造检验统计量来检验序列的纯随机性。一 假设条件由于序列值之间的变异性是绝对的,而相关性是偶然的,所以假设条件如下: 二 检验统计量1 统计量 为了检验这个联合假设,Box和Pierce推导出了统计量: 式中,为序列观察期数;为指定延迟期数。根据正态分布和卡方分布之间的关系,我们很容易推导统计量近似服从自由度为的卡方分布: 当统计量大于分位数,或该统计量的值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列,否则

50、,接受原假设,认为该序列为白噪声序列。 2 统计量 在实际应用中人们发现统计量在大样本场合检验效果比较很好,但在小样本场合就不太精确。为了弥补这一缺陷,Box和Ljung又推导出统计量: 式中,为序列观察期数;为指定延迟期数。Box和Ljung证明统计量近似服从自由度为的卡方分布。注意统计量就是Box和Pierce的统计量的修正,所以人们习惯把它们称为统计量,分别记作统计量和统计量,在各种检验场合普遍采用的是统计量。的选择原则, 或三 随机性检验的基本步骤1 绘制序列时间序列数据图(判断序列是否有趋势性和季节性)2 自相关图检验,考察该序列的样本自相关图,进一步检验该序列的平稳性。3 纯随机性检验。第二章 平稳时间序列模型教学目的与要求 本章主要介绍平稳时间序列的线性模型的基本形式、假设、特征等内容,并讲述ARMA模型的特点,使学生ARMA模型有一个比较全面地了解。1 了解ARMA模型的特性及其优点。2 掌握AR、MA模型的形式、基本假设、结构特征以及系统解释。3 掌握ARMA模型的形式、基本假设、结构特征以及系统解释。 重点与难点本章的重点是平稳时间序列序列模型的基本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论