版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ARIMA时间序列模型概述1.1ARIMA模型理论介绍现实生活中大多数时间序列数据都呈非平稳且表现形式众多。一般经过恰当的差分处理后包含随机趋势的非平稳时间序列会转换为平稳序列,此时这个非平稳时间序列即为差分平稳序列[REF_Ref28697\n\h50]。在这种情况下可以通过求和自回归移动平均模型(autoregressiveintegratedmovingaverage,ARIMA)来对差分平稳序列进行拟合。ARIMA模型建模主要包含以下步骤:1.序列的平稳性检验。检验序列的平稳性可以采取不同角度与方法,其中图示法和单位根检验法目前使用较广。图示法即绘制给定的时间序列数据随时间变化的趋势图,通过经验主观判断该序列是否存在某种趋势;单位根检验法(augmentedDickey-Fuller,ADF)的特点为假设时间序列是由一个阶自回归过程生成的,接下来通过建立估计模型得到估计参数,并进行单位根检验[REF_Ref28837\n\h51]。若检验结果为具有单位根,则说明该序列不是平稳的;反之为平稳序列。当序列不平稳时,我们需要进行平稳化处理。主要包括三种类型:(1)对数化对数化即对原始数据进行对数变换。通过对数化处理,可以将一些诸如具有指数趋势的非平稳时间序列化为具有线性趋势的序列,从而减少其中非线性因素的影响。(2)数据的分解与平滑具备趋势特征是非平稳时间序列的典型特点,主要分为确定性趋势和随机性趋势。序列平稳化的方法之一就是通过对序列进行分解,提取其中的确定性趋势。提取确定性趋势的方法众多,例如:线性拟合法、移动平均法、指数平滑法等等。我们可以通过将这部分确定性趋势从原始序列去除,得到一个平稳序列。(3)差分法差分法即通过有限阶的差分运算将趋势信息提取,但要慎重选择差分阶数,否则可能过出现过差分的状况。特别地,若一时间序列具备指数趋势,可以考虑将对数化与差分法相结合,先通过对数变换降低指数趋势,在通过差分运算实现序列的平稳化。2.ARMA模型的识别与定阶。ARMA(p,q)模型的初步识别,可以通过样本观察值计算出样本自相关函数和偏自相关函数,按照ARMA(p,q)模型的定阶原则得到。ARMA(p,q)模型的定阶原则如下表1.1所示。表1.1ARMA(p,q)模型定阶原则模型AR(p)MA(q)ARMA(p,q)p阶拖尾截尾p阶拖尾截尾q阶拖尾q阶拖尾但在实践中这个定阶原则相对困难。因为样本具有随机性,所以样本的相关系数并不会出现理论上的完全截尾情况,本该是截尾的系数可能会呈现小幅度震荡的拖尾。此外该方法还存在着一定的主观性,因此使用信息准则方法来对模型进行定阶可以弥补一部分不足。目前常用的信息准则方法是准则和准则,准则是由Kullback-Leibler信息量导出的,其一般形式为: 式中,是极大似然函数,为待估参数的个数。值越小,代表选择该模型效果更好。准则是在基础上的改进,它把样本个数考虑在内,可以有效防止因当样本数量过多、模型精度过高而导致的模型复杂度过高,其一般形式为: 式中,是极大似然函数,为待估参数的个数,为样本个数。同样,以值更小作为选择模型的准则。1.ARMA模型的参数估计。模型识别后,即自回归阶数和移动平均阶数已将确定,接下来应估计ARMA(p,q)模型中的未知参数,,,。估计方法主要包括矩估计法、最小二乘法和极大似然估计法等。4.ARMA模型的检验。理论上来说,经模型识别与参数估计后,建立的模型应将原始数据中包含的信息全部提取,所得到的残差序列应为白噪声序列,故只需对残差序列进行白噪声检验即可判别所建立的模型能否有效提取原始数据的信息。白噪声检验的假设条件分别为:原假设:备择假设:至少存在某个检验统计量取为: 3-(5)此处的是残差序列的自相关函数,为样本自相关函数。通常情况下,取显著性水平为0.05,当检验的值高于0.05时,认为无法拒绝原假设,即有理由相信残差序列为白噪声序列;反之应拒绝原假设,认为备择假设成立,即序列为非白噪声序列,此时就要重新进行模型识别提取信息。ARIMA模型的整体构建流程如图1.1所示:图1.1ARIMA建模流程1.2ARIMA模型建模预测本节ARIMA模型建模预测使用R1.6.3和python实现。建模步骤如下:1.数据平稳化。首先,绘制1978-2018年的人均GDP(PGDP)趋势图如图1.2:图1.21978-2018年人均GDP趋势图直观来看,数据表随时间推移表现出明显的指数型增长趋势,并非平稳序列。以1978-2015年的数据作为训练集,2016、2017、2018年的数据作为测试集对原始数据进行划分。使用上述ADF方法得到训练集数据平稳性检验结果的值为0.9990,远大于显著性水平0.05,因此无法拒绝原假设,即该序列为非平稳序列。由于人均GDP呈指数趋势增长,故我们采取了对数变换法,去除指数趋势,此时的ADF检验值为0.5966,仍不平稳。对对数化后的序列做一阶差分运算,再次进行平稳性检验,此时,差分后的序列图如下图1.3所示,可以观察到,序列围绕一条水平线波动,大致为平稳序列。为避免主观因素的影响,对序列进行单位根检验大致,得到值为0.0025,显著小于0.05,因此可以拒绝原假设,认为该序列已经平稳。图1.3一阶对数差分序列趋势图模型平稳后,我们应检验平稳序列是否为白噪声序列,若序列为白噪声,则该序列中不存在值得提取的信息,分析结束。经检验,值为0.000035,远小于显著性水平0.05,故可以拒绝原假设,该序列并非白噪声序列,可以对该平稳序列进行建模。2.模型识别与定阶。对训练集平稳后的时间序列绘制自相关函数与偏自相关函数图如下:图1.4自相关与偏相关函数图根据图1.4,在1阶延迟后,自相关函数围绕零值呈小范围波动,其取值都在二倍标准差范围中。而偏自相关函数图的拖尾截尾性质难以准确判定,故我们利用、准则法来确定阶数。通过将、的最高滞后阶数设置为5,对训练集反复建立模型,得到的最佳滞后阶数为:,,即对训练集建立ARIMA(0,1,2)模型,效果相对最好。此时,值为-127.82,值为-121.38。1.对模型参数进行估计,结果见表1.2。表1.2参数估计结果系数标准误const0.12880.0161MA.L11.23410.2529MA.L20.42020.23294.模型检验。使用ARIMA(0,1,2)模型拟合训练集数据,对得到的残差序列进行白噪声检验,检验结果显示值为0.6342,大于0.05,说明在5%的显著性水平下,不能拒绝原假设,即该残差序列可认为是白噪声序列,这说明我们的模型对数据拟合良好,信息提取充分。5.模型评估。为更为清晰的展示模型的拟合情况,使用python中matplotlib包,绘制训练集的ARIMA(0,1,2)模型拟合曲线见图1.5。图1.5ARIMA(0,1,2)模型训练集拟合图图中,曲线为训练集预测值,真实值以点表示,可见模型拟合效果较好,真实值大多落在拟合曲线上。使用所建立的ARIMA(0,1,2)模型对测试集进行验证,得到的结果如表1.3(结果保留两位小数):表1.3测试集验证结果真实值预测值绝对误差相对误差平均相对误差2016年5413955201.961064.961.97%4.48%2017年60014623
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年湖北省荆州市八年级地生会考真题试卷(含答案)
- 大模型时代的具身智能-
- 17 我变成了一棵树 课件(内嵌视频)2025-2026学年语文三年级下册统编版
- 口腔护理实践中的安全与风险管理
- 员工手册编写及劳动合同制定流程
- 剖宫产恢复期营养建议
- 破产清算企业劳动合同终止规定
- 护理专业护理实践中的伦理挑战课件
- 2026年学校艾滋病自查报告(3篇)
- 吸痰技术的培训与教育
- 社区三中一大工作制度
- DB31∕T 310028-2025 数据资源目录编制指南
- 2026校招:北京祥龙资产经营公司试题及答案
- 2025年郑州黄河护理职业学院单招职业适应性测试试题及答案解析
- 工程标准员培训课件
- 教育公共知识考试题库及答案
- 小学语文教学中写作能力培养的课题报告教学研究课题报告
- 律师协议书模板
- 收费站安全教育培训课件
- GB/T 10091.1-2025事物特性表第1部分:定义和原理
- 专升本食品工程专业2025年食品化学试卷(含答案)
评论
0/150
提交评论