下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、ARIMA模型-自回归移动平均模目录 显示 ? 1 什么是 ARIMA 模型 ?2 ARIMA 模型的基本思想?3 ARIMA 模型预测的基本程序? 4 相关链接o 4.1 各国的 box-jenkins 模型名称? 5 ARlMA 模型案例分析o 5.1 案例一 :ARlMA 模型在海关税收预测中的应用 o 5.2 案例二 : 基于 ARIMA 模型的备件消耗预测方法1? 6 参考文献编辑什么是 ARIMA 模型 ?ARIMA 模型全称为自回归移动平均模型 (Autoregressive Integrated Moving AverageModel, 简记 ARIMA) ,是由 博克思 (B
2、ox )和詹金斯 (Jenkins ) 于 70 年代初提出的一著名 时间序列 预测方法 ,所以又称为 box-jenkins 模型、博克思 -詹金斯法。其中 ARIMA (p,d ,q)称为差 分自回归移动平均模型, AR 是自回归 , p 为自回归项 ; MA 为移动平均, q为移动平均项数, d 为时间序列成为平稳时所做的差分次数。编辑ARIMA 模型的基本思想ARIMA 模型的基本思想是:编辑ARIMA 模型预测的基本程序(一)根据时间序列的 散点图 、自相关函数和偏自相关函数图以 ADF 单位根检验其 方差 、 趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间
3、序列都不是 平稳序列。(二)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下 降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到 处理后的数据的自相关函数值和偏相关函数值无显著地异于零。(三)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾 的,而自相关函数是拖尾的,可断定序列适合 AR 模型;若平稳序列的偏相关函数是拖尾的, 而自相关函数是截尾的,则可断定序列适合 MA 模型;若平稳序列的偏相关函数和自相关函数 均是拖尾的,则序列适合 ARMA 模型 。(四)进行 参数估计 ,检验是否具有统计意义。(五)进行 假
4、设检验 ,诊断残差序列是否为白噪声。(六)利用已通过检验的模型进行 预测分析 。编辑相关链接编辑各国的 box-jenkins 模型名称Glossary of statistical termsLanguageDescriptionEnglishBox-Jenkins modelFrenchmodè le de Box-JenkinsGermanBox-Jenkins-ModellDutchBox-Jenkins-modelItalianmodello Box-JenkinsSpanishmodelo de Box-JenkinsCatalanmodel de Box-Jenkins
5、Romanianmodelul Box-JenkinsFinnishBoxin-Jenkinsin mallitHungarianBox-Jenkins-modellTurkishBox-Jenkins modeliEstonianBox-Jenkinsi mudelLithuanianBox ir Jenkins modelis ; Bokso ir D?enkinso modelisSlovenianBox-Jenkinsova modelPolishmodel Boxa-JenkinsaRussian -Ukrainian - ?Farsimodele Box-JenkinsPersia
6、n-Farsi?-?Arabic?- ? ?AfrikaansBox-Jenkins-modelChinese博克斯 詹金斯模型编辑ARlMA 模型案例分析编辑案例一 :ARlMA 模型在海关税收预测中的应用2008 年。海关税收预算计划 8400 亿元 .比 2007 年实际完成数增加 10.8 ,比 2007 年预 算数增加 22.1 。为了对 2008 年江门海关税收总体形势进行把握,笔者尝试利用 SAS 统计分 析 软件的时间序列预测模块建立 ARIMA 模型,对 2008 年江门海关税收总值进行预测。从预测 结果来看,预测模型拟合度较高,预测值也切合实际情况,预测模型具有一定的应用价
7、值。现 将预测的方法、原理以及影响税收工作的相关因素分析。一、 ARlMA 模型原理ARIMA 模型全称为自回归移动平均模型(Autoregressive Integrated Moving AverageModel ,简记 ARIMA) 。是由博克思 (Box)fFfl 詹金斯 (Jenkins) 于 70 年代初提出的一著名时问 序列预测方法,所以又称为 box-jenkins 模型、博克思一詹金斯法。其中 ARIMA(p , d.q) 称为 差分自回归移动平均模型, AR 是自回归, P 为自回归项; MA 为移动平均, q 为移动平均项数, d 为时间序列成为平稳时所做的差分次数。 A
8、RIMA 模型可分为 3 种: (1) 自回归模型 (简称 AR 模型 );(2)滑动平均模型 (简称 MA 模型); (3)自回归滑动平均混合模型 (简称 ARIMA 模型 )。ARIMA 模型的基本思想是:将预测对象随时问推移而形成的数据序列视为 个随机序列 .以时间序列的自相关分析为基础.用一定的 数学模型 来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。 ARlMA 模型在经济预测过程中既考虑了 经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对于经济运行短期趋势的预测 准确率较高,是近年应用比较广泛的方法之一。、应用 ARIMA 模型进行
9、预测每月税收数据 .可以看作是随着时间的推移而形成的一个随机时间序列,通过对该时间序列 上税款值的随机性、平稳性以及季节性等因素的分析,将这些单月税收值之间所具有的相关性 或依存关系用数学模型描述出来,从而达到利用过去及现在的税收值信息来预测未来税收情况 的目的。(一)对序列取对数和作差分处理,形成稳定随机序列ARIMA 模型建模的基本条件是要求待预测的数列满足平稳的条件, 即个体值要围绕序列均 值上下波动,不能有明显的上升或下降趋势,如果出现上升或下降趋势,需要对原始序列进行 差分平稳化处理。从上图可看出, 江门海关自 2002 年以来的实际入库税收值数列波动性较明显, 且呈现出一 定的上升
10、趋势, 不能直接用 AHIMA 模型进行建模。 取对数可以消除数据波动变大趋势, 对数列 进行一阶差分,可以消除数据增长趋势性和季节性。从下图可以看出,预测数列取对数并作一 阶差分后的图形显示基本消除了 长期趋势 性的影响, 趋于平稳化, 满足 ARIMA 模型建模的基本 要求。(二)模型参数的估计时间序列预测模块的自相关分析包括对自 相关系数 和偏 相关系数 的分析,通过对比分析从 而实现对时间序列特性的识别。从计算结果可知,自相关函数 1 步截尾,偏自相关函数 2 步截 尾,白相关函数通过白噪声检验。根据变换数列的自相关函数和偏自相关函数的特点,并经过 反复测试,对 ARIMA 模型的参数
11、进行估计 .三个参数定为 d=l , p=2 和 q=l 。对参数进行检验。从检验结果可知,参数估计全部通过 显著性检验 .拟合优度统计量表中给 出了残差序列的方差 (0.063367) 和 标准误差 (0.251729) ,以及按 AIC 和 SBC 标准计算的 统计量 (9.496798) 和 (18.54752) ,这两个值都较小,表明对预测模型拟合得较好。从残差的自相关检验 结果数据中 .可以得知残差通过白噪声显著性检验。预测模型最终形式为: (14-0.98284B)(1+0.56103B-2)Z=(1-0.34111B)(1+B)u其中, Z=logX 。 B 为后移算子, u 为
12、随机干扰项 (三 )应用模型预测。利用上面确定的模型进行预测。 预测模型 x.-J 2007 年税收的拟合值是 21.75 亿元, 跟实际 税收值 22.58 亿元比较, 误差为 3.7, 表明预测模型拟合度较高, 预测模型具有一定的应用 fir 值。把预测模型向前推 12 个月进行预测,得到 2008 年各月税收数据,全年累计税收预计均值 为 23.5 亿元, 实际税收值会围绕此值上下波动。 需要说明的是, 由于利用模型向前预测 1 一 12 月的数据,预测时间越长,难度越大, 预测精度 也下降,若到年中再次预测时,预测精度将会 进一步提高。这个税收预测值是基于当前 海关监管 水平、 税收征
13、管 水平不变或提高的基础上,挖掘税收 样本数据自身涵盖的信息 .利用 数理统计 分析方法,建立预测模型得出的理论预测值,一旦实际 外部环境和条件发生变化,例如国家实施 宏观调控 、人民币 升值过快、 汇率 大幅变动、对外 经 济政策 的变化等,将对 税收预测 结果生一定的影响。三、其他可能对 2008 年税收工作产生影响的主要因素(一)个别商品税收变化影响巨大2007 年占关区税收总值 80 前 20 位大类税源 商品 ,与 2006 年占关区税收总值 80 前 20 位大类税源商品相比,新增了大豆、印刷和装订机械及零件、棉纱线,少了空气调节器、初级 形状的聚丙烯和初级形状的聚乙烯 .新增的三
14、项 商品税 收总值为 3.1 亿元。占关区税收总值 13.8 ,其中,大豆 2007 年税款高达 2.6亿元, 2006 年仅为 15万元,影响巨大。另外,煤和 钢材的税收值大幅增长。液化石油气、纺织品( 包括服装和纺织纱线 )、纸及纸板 (未切成形的 ) 税收下降幅度较大。主要税源商品的不稳定,为关区税收工作增加了难度。(二)本地企业异地纳税仍保持较大规模据统计, 2007 年江门关区企业在异地进口 异地报关 应税货值 85.2 亿元人民币, 比 2006 年 增长 13.6 ,应征税收为 9.2 亿元,较 2006 年增长 7.4 .占江门区同期应征税收总额的四成多。从口岸 分布来看, 大
15、部分本地企业异地纳税进口行为分布在广州口岸。 在广州口岸纳税 4.7 亿元,下降占异地纳税总值的 51.1 。另外。在黄埔口岸纳税 1.7 亿元,下降 4.8 ;在拱北口 岸纳税 1.3 亿元,增加 3 倍从商品来看,异地纳税进口的商品主要是废塑料、废五金、木浆、 冰乙酸、正丁醇、脂肪醇、冻猪杂碎、 IEl 挖掘机、初级形状聚乙烯等商品,税款均超过千万元,部分商品曾经在本关区口岸大量进口。废塑料进口 3 亿元,下降 10.9 ;废五金进口 1.2 亿元, 增长 87.6 ;木浆进口 7783 万元,增长 17.2 ;冰乙酸进口 6593 万元,下降 19.4 ;正丁 醇进口 3498 万元,增
16、长 3.5 倍;脂肪醇进口 3366 万元。 32.3 ;冻猪杂碎进口 3313 万元, 增长 2.3 倍;旧挖掘机进口 3101 万元,下降 1.7 ;初级形状聚乙烯进口 2539 万元,下降 54 。 其中正丁醇、冻猪杂碎和废五金进口增长迅猛。(三)主要纳税大户变化较大2007 年占关区税收总值 60 前 20 位纳税企业,与 2006 年占关区税收总值 60前 20 位 纳税企业相比,有 12 家企业新上榜,更新率为 60 。新增的 2 家纳税企业嘉吉投资 (中国 )有限 公司 和北京华特安科经贸有限公司共纳税 3.4 亿元,占关区税收总值的 15 。影响巨大。而海 洋石油阳江实业有限公
17、司的纳税额从 2006 年的 1.4 亿元下降到 2783 万元,该企业的税款下 fl 手 x,l 2007 年关区税收工作带来了较大的影响。 主要纳税大户的不稳定, 加大了 2008 年关区税 收工作的不确定性。(四)加工贸易内销补税和出口征税的影响2007 年,江门关区 一般贸易 应征税收为 21.5 亿元,增长 26.5 ; 加工贸易 内销补税 (不含 后续补税 )为 7909 万元,增长 11.3 ;后续补税为 594 万元,增长 49.3 。 2007 年江门关区 出口商 品征税 160 万元,增长 1.8 倍。江门关区的税收以一般贸易进口征税为主,但由于 加工 贸易 进出口值占关区
18、进出口总值的比重超过一半.因而加强加工贸易内销征税工作,充分挖掘加贸内销补税潜力,可以为关区税收总量增长提供支持。虽然当前出口征税占关区税收总值的比 重非常少,但由于国家不断调整外贸政策, 2008 年出口需要征收 关税 商品涉及 300 多个税号, 而且相当多的商品 出口关税 率高达 15 20,预计江门关区出口关税将会保持大幅增长态势, 为关区税收总量增长提供补充。综合来看,只要大类税源商品如己内酰胺、大豆、煤、钢材和废纸等保持 2007 年的进口规 模,其他税源商品进口没有大幅下降, 2008 年的税收总额就能够保持甚至超过 2007 年的税收 水平,如果液化石油气、纺织品和纸及纸板恢复
19、 2006 年的进口水平,同时将本关区企业从异地 报关引导回本关区 报关 ,今年税收总额将比 2007 年小幅增长。 结合应用前面的时间序列模型的 预测结果,综合多方面因素,预计全年累计税收均值为 23.5 亿元。编辑案例二 :基于 ARIMA 模型的备件消耗预测方法 式中,前半部分为自回归部分,非负整数 p 为自回归阶数, 为自回归系数, 后半部分为滑动平均部分, 非负整数 q 为滑动平均阶数, 为滑动平均系数; Xt 为备 件消耗数据相关序列, t为 WN( 0, 2)。当 q=0 时,该模型成为 AR(p) 模型:一、引言随着技术的进步和军事的变革,快速响应战场需求是装备战斗力的重要指标
20、之一。要快速 响应战场需求就要有强有力的后勤保障和支持,部队需要保证有一定数量备件。而实际中却常 常由于没有足够的备件导致装备不能快速形成战斗力。由于造成备件短缺的重要原因是使用的备件需求预测方法和模型不够精确 1 当 p 0 时,该模型成为 MA(q) 模型: ,故尝试用差分自回归滑动平均模型,即ARIMA(p,d,q) 模型,对备件消耗进行预测。1 备件消耗预测的 ARIMA ( p,d,q )模型求和自回归滑动平均模型( AutoregressiveIntegrated Moving Average Model,简称 ARIMA ),由 Box 和 Jenkins于 70 年代初提出的时
21、间序列预测方法, 又称为 B-J 模型、博克思 -詹金斯法 3. 备件消耗预测建模流程通过建立 ARIMA(p,d,q) 模型进行备件消耗预测的基本流程,如下图 。其中 ARIMA(p,d,q) 称为差分自回归滑动平均模型, AR 是自回归, MA 为滑动平均, p、 q 分别为对应的阶数, d 为时间序列成为平稳时所做的差分次数。1. 基本思路首先需要明确建立模型的前提是在预测的这段时间内,影响该类备件消耗量的主要因素不 发生大变故。在此前提下,将备件消耗的历史 统计数据 视为一个时间序列,即为一组依赖于时 间 t 的随机变量序列。 这些变量间有依存性和相关性, 并表现出一定的规律性, 如能
22、根据这些消 耗数据建立尽可能合理的统计模型,就能用这些模型来解释数据的规律性,就可利用已得到的 备件消耗数据来预测未来消耗数据,也就能得出备件需求做好的备件供应。2. 模型描述备件消耗预测 ARIMA(p,d,q) 模型实质是先对非平稳的备件消耗历史数据 Yt 进行 d(d 0,1,dots,n )次差分处理得到新的平稳的数据序列Xt,将 Xt 拟合 ARMA(p,q) 模型, 然后再将原d 次差分还原,便可以得到 Y_t 的预测数据。其中, ARMA(p,q) 的一般表达式为:,得(2)ARMA 模型的识别(1) 获取数据并进行预处理 .收集装备使用阶段某备件消耗的数据序列,记为。 利用游程
23、检验法 4来判断该序列是否为平稳序列,如为非平稳序列,用差分的方法,即:游程检,对序列进行平稳化预处理,每次差分后数据进行验 ,直到差分所得数据可以通过平稳性检验,记为 d 次差分,得到新的平稳序列取前 N 组(或全部)数据作为观测数据,进行零均值化处理,即:到一组预处理后的新序列 。型识别。具体的计算公式为:通过计算预处理后的序列的自相关函数 (ACF) 和偏自相关函数 (PACF) 来进行模根据上述计算结果,并依据表 1 的模型识别原则,可以确定 符合的模型。ARMA (p,q )模型识别原则模型AR(p)MA(q)ARMA(p.q)自相关函数拖尾,指数衰减或振荡有限长度,截尾 (q 步
24、)拖尾,指数衰减或振荡偏自相关函数有限长度,截尾 (p 步 )拖尾,指数衰减或振荡拖尾,指数衰减或振荡(3) 参数估计和模型定阶 参数估计和模型定阶是建立备件消耗预测模型的重要内容,二者相互影响。 在上述模型识别的基础上,利用样本矩估计法、最小二乘估计法或 极大似然估计法 等对ARMA(p,q) 的未知参数,即自回归系数、滑动平均系数以及白噪声方差进行估计,得出 widehatvarphi_1,ldots,widehatvarphi_p,widehattheta_1,ldots,widehattheta _q,widehatsigma2 。利用 AIC 、BIC 准则进行模型定阶。具体步骤 5
25、。(4) 模型检验首先要检验所建立模型是否能满足平稳性和可逆性,既要求下式(6)、式 (7)根在单位圆外,具体公式如下:再进一步判断上述模型的残差序列是否为白噪声,如果不是,则需要重新进行模型识别,如果是,则通过检验,得出软件 可靠性预测 模型:(5)备件消耗量预测根据上述预测模型,依据一步预测的方法对进行预测,并考虑前面所进行的d 次差分,还原为备件消耗数据 Yt 的预测结果,根据该预测结果来进行备件的配置二、案例应用1. 原始数据及预处理以航空兵场站某种航材备件 3 年的消耗率 (件/1000h) 6来进行分析和预测。取前 30 组数据 建立模型,并用后面的几组数据对模型进行预测验证。3
26、年的原始数据的时间序列如下图,是有关备件消耗统计时间( 2001 年 1 月到 2003 年 12 月)备件消耗率(件 /1000h )的某航材备件消耗数据。从上图中可以看出,数据有明显递增的趋势,为非平稳序列。尝试进行一次差分对数据进 行平稳化处理,结果表明仍未平稳,然后再做一次差分,再对进行 2 次差分后的数据进行 游程 检验 4,可以通过检验,故接受数据具有平稳性的原假设。可得出d 等于 2 ,并将数据进行零均值化,下面进一步确定 ARMA(p,q) 模型。2. 建立模型并进行参数估计计算零均值化后序列的自相关函数 (ACF )和偏自相关函数 (PACF ),结果如下图。 其中, 上下两条线为 置信区间 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中职机电一体化技术(设备故障诊断)试题及答案
- 2025年大学大一(人工智能技术应用)机器学习实务试题及答案
- 2025年大学通识选修(博物馆与中国艺术)试题及答案
- 2025年高职智能化工程技术(智能系统)试题及答案
- 2025年高职市场营销(品牌推广方案设计)试题及答案
- 禁毒科普作品
- 珠宝设计职业规划
- 2026招商银行中山分行寒假实习生招募备考题库及答案详解一套
- 福建省莆田市秀屿区莆田第二十五中学2025-2026学年九年级上学期1月期末道德与法治试题(无答案)
- 【试卷】四川省达州市通川区2025-2026学年八年级上学期1月期末历史试题
- 湖南名校联考联合体2026届高三年级1月联考数学试卷+答案
- 山东省烟台市芝罘区2024-2025学年三年级上学期期末数学试题
- 别墅浇筑施工方案(3篇)
- 2025年度安全生产工作述职报告
- 2025年全国硕士研究生考试《管理类联考综合能力》试题及答案
- 小学信息技术教学备课全流程解析
- 肿瘤放射治疗的新技术进展
- 退岗修养协议书范本
- 高考语文二轮复习高中语文逻辑推断测试试题附解析
- 土壤微生物群落结构优化研究
- 2024外研版四年级英语上册Unit 4知识清单
评论
0/150
提交评论