徐亚琴基于ARIMA模型对中国入境旅游发展的分析与预测.doc_第1页
徐亚琴基于ARIMA模型对中国入境旅游发展的分析与预测.doc_第2页
徐亚琴基于ARIMA模型对中国入境旅游发展的分析与预测.doc_第3页
徐亚琴基于ARIMA模型对中国入境旅游发展的分析与预测.doc_第4页
徐亚琴基于ARIMA模型对中国入境旅游发展的分析与预测.doc_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山 西 大 学2007届硕士学位论文(山西大学2007届中职教师人员申请硕士学位论文)基于ARIMA模型对中国入境旅游发展的预测研究作者姓名(Name) 徐雅琴指导教师 (Supervisor) 孙敏学科专业 (Major) 计算机应用技术研究方向 (Field of Research) 数值分析学习年限 (Research Duration) 2004年9月2007年6月 二七年六月Shanxi University The 2007 Masters Thesis (The 2007 masters thesis by secondary vocational school teachers, Shanxi University)The analysis for Chinese Arrival tourism development based on ARIMA modelName XU YAQINSupervisor SUN MINMajor Computer Science and TechnologyField of Research Network System ManagementResearch Duration Sept.2004June 20072007627 / 38目 录中文摘要 III英文摘要 III第一章引言 11.1 中国入境旅游发展分析预测的研究意义11.1.1 中国入境旅游发展分析预测的研究意义11.1.2 旅游发展分析预测的研究现状21.2 本文的工作31.3 内容组织3第二章旅游需求预测的方法52.1 旅游需求预测方法简介52.1.1 旅游需求预测方法52.1.2 旅游需求预测方法比较52.2 旅游需求预测方法评价5第三章求和自回归移动平均(ARIMA)模型73.1 预测方法与预测模型73.2 ARIMA模型的概念73.3 ARIMA模型的建模思想83.3.1 根据时间序列的散点图83.3.2 数据进行平稳化处理83.3.3 根据时间序列模型的识别规则,建立相应的模型83.4 ARIMA模型表达式83.5 利用ARIMA模型对时间序列进行分析93.5.1 模型识别93.5.2 参数估计93.5.3 诊断检验103.5.4 合理预测11第四章 对我国入境旅游人数数据建模124.1 模型的识别124.1.1 数据进行平稳化处理124.1.2 识别模型144.2 模型的估计与诊断194.3 模型预测21第五章 结论225.1 测试与结果225.2 结论225.3下一步的研究方向23附录25参考文献27致谢28ContentsChinese AbstractVEnglish AbstractVChapter One Introduction11.1 Significance of Study on Analysis and Prediction of Chinese Arrival Tourism Development. 11.1.1 Significance of Study on Analysis and Prediction of Chinese Arrival Tourism Development.11.1.2 Present Study of Analysis and Prediction of Tourism Development 21.2 Tasks 31.3 Organization.3Chapter Two Methods for Prediction of Traveling Demand52.1 Brief Introduction of Predictive Methods for Traveling Demand.52.1.1 Predictive Methods for Traveling Demand 52.1.2 Comparison of Predictive Methods for Traveling Demand.52.2 Evaluation of Predictive Methods for Traveling Demand5Chapter Three ARIMA Model.73.1 Predictive Methods and Predictive Model.7.3.2 Concept of ARIMA Model.73.3 Theory of Building ARIMA Model.83.3.1 Scatter Diagram Based on Time Series 83.3.2 Steady Processing of Data.83.3.3 Building Models Based on Identifying Rule83.4 Expression of ARIMA Model.83.5 Analysis of Time Series Using ARIMA Model93.5.1 Model Identification.93.5.2 Parameter Estimation.93.5.3 Diagnostic Test.103.5.4 Rational Prediction.11Chapter Four Building Model for Data of Chinese Arrival Tourists.124.1 Identification of Model.124.1.1 Steady Processing of Data.124.1.2 Identifying Model.144.2 Estimation and Diagnosis of Model.194.3 Prediction of Model21Chapter Five Conclusion .225.1 Tests and Results.225.2 Conclusion.225.3 Further study.23Appendix.25References27Acknowledgements.28中 文 摘 要入境旅游是中国旅游市场的重要组成部分,在国际旅游中占有很重要的位置,在中国旅游业产业地位的提高和强化方面处于关键地位。同时它也是我国赚取外汇和解决就业的主要途径。正确认识及时把握入境旅游市场的动态和趋向,探讨我国的入境旅游情况及其在国际旅游业中的地位,对于制定我国的旅游和经济政策有着很重要的参考意义。中国作为世界旅游大国之一,有着极为丰富的旅游资源,有着非常巨大的旅游客源市场,还有着非常广阔的发展前景,研究入境旅游情况显得尤为必要。随着我国经济的持续高速增长和人均收入的提高,我国旅游市场呈迅速扩张态势。旅游业作为朝阳产业将对我国经济发展产生日益明显的推动作用,中国将成为世界一流旅游大国。建立科学的、可操作的旅游需求预测模型,进行准确预测是实现我国旅游业持续健康发展的基础性前提。旅游需求预测模型研究一直是旅游学研究的重要课题。旅游研究人员、决策者以及从业人员都意识到对旅游需求进行准确的预测是非常必要的,但具体用什么数学模型来进行旅游需求的预测分析至今没有一个统一的范式。目前常用的主要是基于统计学的数学模型:时间序列预测模型、回归模型(包括线性的和非线性的回归模型)。本文运用国际著名的大型集成软件系统中的时间序列方法,根据1978年-2003年历年的数据对我国的入境旅游人数作了预测分析,为我国选择预测入境旅游人数的统计模型提供了参考。作者用求和自回归滑动平均(ARIMA)方法作了各种参数搭配的比较,得到了一个较好的模型ARIMA(2,2,0)。关键词: 入境旅游人数;时间序列;ARIMA模型;预测The analysis for Chinese Arrival tourism development based on ARIMA modelABSTRACTThe Arrival tourism is important constitution in the Chinese traveling market, which holds the very important position in the international traveling, is at the essential position in the Chinese tourism industry status enhancement and the strengthened aspect. Simultaneously it also is our country earns the foreign exchange and the solution employment main way. The correct understanding prompt assurance enters a country the traveling market tendency and the trend, discusses our country to enter a country the traveling situation and its in the international tourisms status, regarding formulates our country traveling and the economic policy has the very important reference significance.China took one of world traveling great nations, has the extremely rich traveling resources, has the extremely huge traveling source of tourists market, but also has the extremely broad prospects for development , the research enters a country the traveling situation to appear especially essential. Continues along with our country economy high speed to grow and the average per person income enhancement, our country traveling market assumes the rapid expansion trend. The tourism took the sunrise industry will have the obvious impetus function to our country economy development , China becomes the world first-class traveling great nation day by day. The establishment science, may operate the traveling demand forecast mode l, carries on the accurate forecast is realizes our country tourism to continue the health development the foundational premise. The traveling demand forecast model study always is the traveling study research important topic. The traveling researcher, the policy-maker as well as the jobholders all realizes to the traveling demand carries on the accurate forecast is extremely essential, but makes concrete with any mathematical Model carries on the traveling demand the forecast analysis until now not to have a unified model. At present is commonly used mainly is based on statistics mathematical model: Time series forecast model, return model (including linear and non-linear return model). This article utilizes in the international famous large-scale integrated software system the time series method, -2003 year all previous years data entered a country the traveling population according to 1978 to our country to make the forecast analysis, chose the forecast for our country to enter a country the traveling population statistical model to provide the reference. The author (ARIMA) the method has made the comparison with the summation from the return running mean which each kind of parameter matches , obtained better model ARIMA (2,2,0).Keywords: the traveling population entering a country;time series; ARIMA model; prediction; 第一章引言1.1 中国入境旅游发展分析预测的研究意义1.1.1 中国入境旅游发展分析预测的研究意义随着社会经济的发展和人民生活水平的提高,人们在满足了自身物质需求以后,开始追求更高层次的需求,即精神文化需求,旅游产业由此应运而生。当前许多地区都把旅游业作为其未来经济发展的支柱产业,希望借助旅游业的发展带动整个社会经济的发展。为此,必须作好旅游业的规划和经营管理工作,只有这样,才能保持和实现旅游业的稳定和持续发展。入境旅游是中国旅游市场的重要组成部分,在国际旅游中占有很重要的位置,在中国旅游业产业地位的提高和强化方面处于关键地位。同时它也是我国赚取外汇和解决就业的主要途径。正确认识及时把握入境旅游市场的动态和趋向,探讨我国的入境旅游情况及其在国际旅游业中的地位,对于制定我国的旅游和经济政策有着很重要的参考意义。中国作为世界旅游大国之一,有着极为丰富的旅游资源,有着非常巨大的旅游客源市场,还有着非常广阔的发展前景,研究入境旅游情况显得尤为必要。入境旅游是指他国居民前来我国的旅游活动。对外开放是入境旅游的前提,只有对外开放才有入境旅游,而且对外开放的层次和程度决定着入境旅游的范围和规模。本文中的入境旅游是指中国大陆以外地区的居民进人我国大陆的旅游活动,所以入境旅游的游客包括来华旅游的外国人,港、澳侨胞和台湾同胞。据国家旅游局官员介绍,自1978年改革开放以来,旅游业已经成为中国第三产业中最具活力与潜力的新兴产业,旅游业在国民经济中的地位不断得到巩固和提高。2004年,入境旅游接待人数达到1.09亿人次,是1978年的60倍,入境过夜旅游人数4176万人次,预计超过意大利跃居世界第4位。旅游外汇收入达257亿元美元,预计超过德国和英国,跃居世界第五位。旅游总收入6840亿元人民币,相当于全国GDP的5.01%。另据官方数字显示,中国国内旅游人数突破10亿人次,中国公民出境人数为2885万人次。中国已成为亚洲地区快速增长的新兴客源输出国,可以组团前往旅游的中国公民出境旅游目的地国家和地区已达64个。在旅游业的规划与经营管理过程中,旅游需求预测扮演了关键性的角色。对某地旅游产品的需求量是该地政府、旅游部门和旅游营销人员都十分关切的问题。从宏观产业经济需求的角度讲,旅游需求预测可为国家旅游经济主管部门制定未来旅游需求的科学需求战略规划和切实可行的市场开拓策略提供依据,可为宏观产业经济政策的制定提供参考,还可为地方政府评估旅游业对当地经济需求的总体贡献从而制定旅游业需求政策,引导旅游市场资源的合理利用与配置提供技术支持。从中观行业管理的角度讲,旅游需求预测有利于行业管理部门制定有关的行业管理法规,有效地加强对整个行业的宏观控制,通过设置适当进入和退出壁垒提高整个行业的经济效益和实现规模效益。因此,研究我国的入境旅游市场,对于制定我国入境旅游开发对策有着积极的参考价值。建立科学的、可操作的旅游需求预测模型,进行准确预测是实现我国旅游业持续健康发展的基础性前提。本文研究意义在于:它为中国入境旅游预测研究提供了一种定量化的研究思路和方法,对于其它事件如大型活动对旅游预测研究具有借鉴意义;本研究结果可以为国家旅游发展决策提供依据。1.1.2 旅游发展分析预测的研究现状1)国外研究现状本文是有关旅游预测研究方面的论文。由于旅游业最早是在国外西方发达国家开始出现,因此国外在旅游市场研究方面历史较长,尤其是旅游发达国家,如西班牙、澳大利亚等等。这些旅游发达国家都有专门机构对旅游业进行规划和管理,也都配有人员齐备的调查小组,每年都要进行入境旅游的动向调查,并整理成入境旅游调查报告。如西班牙旅游研究协会就负责需求方调查,国家统计协会负责供应方统计和旅游卫星账户系统。国外学者在研究旅游市场时多采用定量分析的方法,注重统计工具的运用,如Stephen F. Witt和Christine A. Witt于1992年共同撰写的“Modeling and forecasting demand in tourism。 2)国内研究现状在国内,有关入境旅游市场研究方面,已经有相当数量的关于中国国际旅游业发展状况的文章,但基本上都是对旅游统计年鉴上的统计数字做一些简单的统计分析。对近些年来有关中国入境旅游市场研究的文章进行归纳,主要有以下几类:(I)针对中国入境旅游市场进行研究的文章,如李天顺在陕西师范大学学报(自然科学版)1993年第1期上发表的“中国入境旅游的主要客源地及其拓展研究”,焦华富在旅游经济1993年第5期上发表的“我国国际旅游客源市场探析”,蒋晓萍在旅游经济1993年第5期上发表的“我国发展国际旅游业的前景和对策”,任志远在西北大学学报(自然科学版)2000年第8期上发表的“中国旅游的国外客源市场态势分析”等等。(2)针对各个省份的国际旅游客源市场分析,如李悦铮在经济地理1997年第1期发表的“山东市海外客源市场结构分析”,阎希娟在人文地理2001年第2期发表的“西安国外客源市场现状分析与拓展”等等。(3)针对中国的入境旅游建立预测模型,如孙根年在地理科学1998年第10期发表的“我国境外旅游本底趋势线的建立及科学意义”,苟小东、孙根年在陕西师范大学学报(自然科学版)2000年第6期发表的“上海入境旅游本底趋势线的建立及其应用”,秦立公在桂林工学院学报2000年第4期发表的“桂林入境旅游发展的非线性回归拟合与自惯性预测研究”等等,几乎都是一些零星的关于中国或中国一些省份、直辖市入境旅游研究的文章。(4)系统分析中国入境旅游,如马耀峰、李天顺等著的中国入境旅游研究,它主要是从地理学、统计学的角度进行分析。1.2 本文的工作本文运用国际著名的大型集成软件系统中的时间序列方法,根据1978年-2003年历年的数据对我国的入境旅游人数作了预测分析,为我国选择预测入境旅游人数的统计模型提供了参考。作者用求和自回归滑动平均(ARIMA)方法作了各种参数搭配的比较,得到了一个较好的模型ARIMA(2,2,0)。1.3 内容组织本篇文章是这样安排的:第一章为引言,主要介绍论文的选题背景以及国内外关于该课题的研究现状及趋势;第二章主要介绍了国内外近期关于旅游需求预测所使用的主要方法,并对这些方法进行了比较和评价,得出本文使用的方法求和自回归移动平均(ARIMA)模型;第三章对ARIMA模型的特征和建模思想作了简单介绍;第四章是实证分析,利用ARIMA模型对我国入境旅游人数进行建模,从模型的识别到模型的估计与诊断,得到了一个较好的预测效果;第五章是结论,从得到的ARIMA模型可以预测和分析我国未来几年入境旅游的人数。第二章 旅游需求预测的方法2.1 旅游需求预测方法简介2.1.1 旅游需求预测方法旅游需求预测模型研究一直是旅游学研究的重要课题。旅游研究人员、决策者以及从业人员都意识到对旅游需求进行准确的预测是非常必要的,但具体用什么数学模型来进行旅游需求的预测分析至今没有一个统一的范式。目前常用的主要是基于统计学的数学模型:时间序列预测模型、回归模型(包括线性的和非线性的回归模型)。2.1.2 旅游需求预测方法比较斯蒂芬.L .J史密斯(1991)对时间序列模型、回归模型和德尔菲法比较如下表:表1 时间序列模型、回归模型和德尔菲法比较表模型名称时间序列模型回归模型德尔菲法技术知识要求低-中中-高低-中数据类型时间序列数据截面数据、时间序列事实、观点数据精确度中-高高低计算能力要求弱-一般一般-高无预测水平短期长期长期预测成本低高不一定,复杂最适合的预测类型简单、稳定或周期性复杂、有己知的定量关系有己知的定性的关系及很强的不确定因素2.2 旅游需求预测方法评价赵西萍,王磊,邹慧萍(1996)介绍了国际上预测旅游需求的常用方法:时间序列法、回归模型法和德尔菲法。并比较了三种预测模型方法特点,认为在对旅游人数的预测上,时间序列法优于回归模型法;而由于诸多影响因素对旅游者开支的影响远大于对目的地抉择的影响,所以回归模型在预测旅游者开支时会最有效。德尔菲法争议最大,普遍认为在不能使用其它方法的情况下,该法在帮助旅游规划者和政策分析者预测可能的未来发展方向时颇有价值。徐国丰(1999)按预测性质,将统计预测方法分为定性预测法、回归预测法、时间序列预测法和组合预测法四类。定性预测法适用于对缺少历史统计资料或趋势面临转折的事件进行预测。回归预测法主要用于研究变量与变量之间的相互关系。时间序列方法只需要序列本身的历史数据来建立模型,应用广泛。组合预测法将不同的预测模型组合起来,产生一个新的模型,理论和实践都表明,组合预测法可能导致一个比任何一个独立预测法更好的预测结果。林依颖(2003)利用1985年至2000年12月共192笔月资料,进行国外旅客赴中国大陆旅游业需求预测。研究方法采用十种不同的时间序列模型,包含简算法(一)、简算法(二)、简单线性回归、二次曲线回归、指数曲线非线性回归、波动性时间序列非线性回归模型、自相关模型、滑动平均模型、季节性与非季节性自相关整合移动平均模型、豪特温特斯模型。结果发现ARIMA模型预测能力最佳。由此可见,需求预测的研究方法很多,但实践结果表明针对旅游业的需求预测以Box和Jenkins的ARIMA模型和多元线性回归模型有较好的预测效果。其中ARIMA模型充分注意到旅游统计资料的时差性,构建了随机差分方程,可较好模拟有时间间隔的动态变量的变化趋势。自回归求积整合移动平均(ARIMA)模型是时间序列常用的估计和预测模型, 也是宏观交通管理中常用的预测方法。ARIMA模型带有三个模型参数p、d、q,所以也常写为ARIMA(d,p,q),d为差分阶数,其中p为自回归周期数,q为移动平均周期数。建立ARIMA时间序列模型通常包括三个步骤: 模型的识别,就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定 d,p,q的取值。模型参数的估计,就是待初步确定模型形式后对模型参数进行估计。诊断与检验,就是以样本为基础检验拟合的模型,以求发现某些不妥之处。如果估计的模型某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。综上所述,本文采用求和自回归移动平均(ARIMA)模型对我国入境旅游发展进行行之有效的分析、预测。第三章 求和自回归移动平均(ARIMA)模型3.1 预测方法与预测模型随着科学技术的飞速发展,预测理论与方法也日趋成熟、完善。统计预测理沦与计算机技术相结合,使许多预测手段的算法实现。现行软件系统中包含了丰富的预测用程序组,运行便捷、分析内容完备。ARIMA模型就是比较成熟的时间序列预测模型,可以有效预测消耗材料需求量,为管理人员提供决策依据;而时间序列分析技术在经济、气象、地质、水文、军事等领域的成功应用,已产生了巨大的经济效益与社会效益;国内外的医学界也正在寻求借助时序分析技术解决医学科研实际问题的途径。计算机技术的迅速发展与普及,使得定量预测中许多复杂的计算问题得以解决,随着预测理论的发展,其应用深入到经济、气象、工业等领域,并产生了良好的经济效益与社会效益。凡此种种,都使得定量预测的理论与实践正以空前的速度走向完善。时间序列分析的意义可以概括为:由时间序列估计随机过程的数字特征,对指标的演变规律进行统计描述与推断;对时间序列进行模型拟合,并依照相关准则考察拟合优度;利用历史值、当前值及所建立的模型对未来值进行预测。常用的时间序列定量预测方法有很多,如移动平均数法、趋势预测法、指数平滑法、趋势季节模型预测法、Markov链预测方法、灰色模型及ARIMA模型方法等。其中,ARIMA模型的数学理论成熟,适用范围广泛,实践中不乏成功的应用实例。ARIMA模型在建模方面,既考虑完善已有模型的约束条件,又在尝试新的模型形式以实现更为理想的时序拟合与预测。实际应用中,时间序列经常具有季节性,呈明显的周期变化。Wing-Kuen Tam 和 Gregory C.Reinsel指出,时间序列的季节成分有确定性和非确定性两类表现,含所谓确定性季节成分是指序列可以表述成某一确定形式周期函数与平稳噪声项之和;与此对应的随机性季节成分则指某时序-特定时点值依赖于以往周期段中对应时点的取值。对含确定性季节成分的时序进行差分将导致无法通过逆推实现拟合与预测;对随机性季节成分必须实施季节差分,否则无法实现平稳化。3.2 ARIMA模型的概念ARIMA模型又称博克斯-詹金斯( Box-Jerkins)模型,是由美国统计学家G. C. P. Box和G. M. Jerkins于1970年首次系统提出的,该模型有三种基本模式:自回归模型、移动平均模型与自回归移动平均模型。我们使用的“求和自回归移动平均(Auto Regressive Integrated Moving Average)模型,简记为ARIMA(p,d,q)模型,广泛应用于各种时间序列数据的分析方法,是一种预测精度相当高的短期预测方法。建立ARIMA(p,d,q)模型计算复杂,必须借助于计算机才能完成当前国际上最为流行的统计分析软件-SAS。3.3 ARIMA模型的建模思想ARIMA模型的建模基本思想可归纳如下:3.3.1 根据时间序列的散点图自相关函数(ACF图和偏自相关函数(PACF)图以及ADF单位根检验观察其方差、趋势及其季节性变化规律,识别该序列的平稳性。3.3.2 数据进行平稳化处理如果数据序列是非平稳的,如存在一定的增长或下降趋势等则需对数据进行差分处理;如果数据序列存在异方差性,则需对数据进行对数转换或者开方处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。3.3.3 根据时间序列模型的识别规则,建立相应的模型1)若平稳时间序列的偏相关函数是截尾的,而自相关函数是拖尾的,则可断定此序列适合AR模型;2)若平稳时间序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定此序列适合MA模型;3)若平稳时间序列的偏相关函数和自相关函数均是拖尾的,则此序列适合ARMA模型,这时阶数(p,q)不能直接得出,需结合其他方法定阶,通过多种定阶方法对(p,q)进行试探性识别,再通过检验来确定。3.4 ARIMA模型表达式当序列为平稳序列,其模型表达式为: p,q为自回归和移动平均的阶数,相应参数分别为自回归和移动平均系数。当序列为非平稳序列,但通过差分可使序列平稳时,采用的模型称作自回归求和移动平均模型,即ARIMA模型。鉴于三种基本模式可视作ARIMA模型的特例,故ARIMA模型又常被作为这一族模型的总称。ARIMA模型(p, d, q)又称为自回归求积移动平均模型。其中AR指自回归,p为模型的自回归项数;MA为移动平均;q为模型的移动平均项数;I指积分,d为时间序列成为平稳之间必须取其差分的次数。其一般的表达式为:3.5 利用ARIMA模型对时间序列进行分析利用ARIMA模型对时间序列的分析可概括为四个阶段:1)模型识别;2)参数估计;3)诊断检验;4)预测。3.5.1 模型识别对于单指标时间序列,计算其自相关函数、逆自相关函数和偏自相关函数,据绘制的函数图形确定模型形式。一般而言,前p个偏自相关函数值与零有显著性差异(绝对值大于1.96/,其中N为序列长度,即偏自相关函数在P处截尾(Cut off),而此时自相关函数缓慢衰减,呈拖尾(tail off)趋势,这时时间序列宜用p阶自回归模型AR(p)进行拟合;反之,前q个自相关函数取值r1,r2,rq与零有显著性差异(绝对值大于1.96/,其中N为序列长度),即自相关函数在q处截尾,而此时偏自相关函数拖尾,这时时间序列宜用q阶移动平均模型MA(q)进行拟合。当均拖尾时,考虑用ARMA(p,q)模型拟合。对于非平稳时序,使用ARIMA(p,d,q)模型拟合。模型的适用性检验常从残差分析入手,其思路是,当不拒绝残差序列为一白噪声序列时,拟合的模型是适用的;否则,说明残差中包含非随机信息,所选模型不够合适。3.5.2 参数估计自相关函数rk的意义是任意时刻观测值序列与前k期观测值序列相关程度与方向的度量,rk可由给定时间序列求得: 通常,平稳自回归过程的自相关函数的变化趋势是由衰减指数和衰减正弦振荡指数构成,自回归参数的估计值与样本自相关函数间有如下关系:通常将上式称为Yulc-Walker方程,所得自回归参数估计值称作Yule-Walker估计。记上式的样本值、估计值均由理论值代替,则上式变为此即由自相关表示的参数的解。令p=2,则Yule-Walker方程成为3.5.3 诊断检验模型诊断检验至少包括以下内容:1)平稳可逆性检验。要求方程和诸根均位于单位园外,即根的模均大于1。当平稳可逆性检验未通过时,调整差分阶数是可行的措施。2)残差序列检验。当残差序列的自相关函数绝对值均小于为考虑差分后用于拟合的有效样本容量,则认为残差序列中不再包含可供建模的非随机成分,此时的残差可视作白噪声,拟合效果良好。也可对前m个自相关函数值rk构造统计量 ,Q近似服从分布,其中P,q为自回归及移动平均阶数,n为有效样本容量。3)过拟合检验。一方面删除模型中的多余参数,另一方面尝试提高模型阶数,考察残差平方和有无明显减小,从而评价当前模型是否参数不足。3.5.4 合理预测模型确定后,利用拟合好的模型进行预测第四章 对我国入境旅游人数数据建模预测是时间序列分析的主要目的之一,对时间序列建模并进行预测时,其隐含的前提是该序列能够被同一组参数构成的模型描述,并假设模型在预测阶段仍适用。用ARIMA模型拟合时间序列有模型识别、参数估计和诊断检验三个步骤,其中诊断检验又包括三方面的内容:平稳可逆性检验要求的诸根都位于单位圆内;残差序列的白噪声检验,当残差序列的自相关函数绝对值均小于-d为考虑差分后用于拟合的有效样本容量,则认为残差序列中不再包含可供建模的非随机成分,此时的残差可视做白噪声,说明拟合效果良好,另一方案是基于统计量的所谓一揽子检验(portmanteau model checking test),Q近似服从X2( m-p-q)分布,其中p、q为自回归及移动平均阶数,n为有效样本容量,m为参与考核的自回归阶数;尝试提高模型阶数,考察残差平方和有无明显减小,从而评价当前模型是否参数个数不足,所谓“过拟合(overfitting)检验”。SAS/ETS软件中的ARIMA过程提供了一个综合工具包来进行一元时间序列的模型识别、参数估计以及预测分析。数学上纯模型记作:其中t代表年份,代表响应序列或地插分,为均值项,B使延迟算子,表示独立扰动或称为随机误差。4.1 模型的识别4.1.1 数据进行平稳化处理首先,我们先进行平稳性检验。对序列的平稳性检验有两种方法:1)根据时序图和自相关图显示的特征做出判断的图检验方法;2)构造检验统计量进行假设检验的单位根检验(unit root test)方法。SAS/ETS中提供了第一种检验方法,根据我国入境旅游人数数据作时序图如下:图1我国入境旅游人数数据散点图在“识别”阶段,从原始数据的散点图可看出明显的上升趋势,初步认为该序列不平稳,那么就需要对数据进行平稳化处理,经过逐次尝试,最后决定对数据取二阶插分。经处理得到的数据见下表:表2:一次插分、二次插分、二阶插分表年份人数一次插分二阶插分二次插分年份人数一次插分二阶插分二次插分 19781809221199133349757588793688483632927509197942039012394680199238114945476518810653124-11227481980570253614986353893315-89604519934152694534120008177188-1353188198177670962064560356319556592519944368445621575115569511-1254489198279242611571652221725-190739519954638651127020554859566544544198394770051552744170990913955791996511275164741005744306020389501984128521853375180492792418224361997575879236460407112014121719402198517833097498091283560921605732199863478401589047812350885-569929198622819450498635399672655441199972795594931719315207671342671519872690226740828179069170-9035362000834438811064828719965480133109419883169480447925378875354709720200189012924556904316217330-5079244198924501394-7193410-2400873-1.2E+0720029790825288953281446437133262851990274618212960427-423298310153837200391662082-62461702649158-1.5E+07所以取d=24.1.2 识别模型下面对p和q进行筛选。首先观察图中程序输出的有关时间序列变量人数的自相关系数图,发现自相关图在二步截尾,偏自相关图在二步截尾,则进一步说明该序列确实为非平稳序列。尝试做一步插分,二步插分,二次插分,再结合白噪声检验,得出二步插分可以消去非平稳趋势,而且是其中最优的。图2 一次插分图图3:二次插分图图4:二步插分图接下来检验该平稳随机列是否为白噪声:如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的数据序列,即过去的行为对未来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析下去,需要对平稳序列进行纯随机性检验。程序运行结果如下图:图5 程序运行结果图平稳序列通常具有短期相关性,只要序列时期足够长,自相关系数都会收敛于零。所以,如果序列值之间存在显著的相关关系,通常只存在延迟时期比较短的序列值之间,而如果短期延迟的序列之间都不存在显著的相关关系,那么长期延迟之间就更不会存在显著的相关关系。从图5中明显看出延迟6期的QLB统计量为11.56,p已经很小,拒绝序列为白噪声的原假设,即拒绝延迟期

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论