




免费预览已结束,剩余50页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要青岛有着丰富的旅游资源,旅游业是青岛重要的经济来源之一。因此准确的预测旅游业的发展,合理有效的分配旅游资源,能够对环境、交通以及景区等方面的建设起到重大的指导作用。本文以青岛市为研究区域,利用青岛市2000年至2012连续12年的各季度旅游人数作为基础,借助matlab和r软件采用多项式插值、拟合模型、余弦趋势的拟合模型、时间序列分析法中的求和自回归移动平均模型(arima)预测分析法分别对青岛市未来两年的旅游收入状况进行预测分析。最后对以上几种预测分析方法作比较以确定最优的预测方法。结果表明,arima模型能很好的的预测出青岛市未来的总旅游人数变化的趋势。关键词:青岛旅游,matlab,r软件,arima模型,时间序列 iabstractqingdao has abundant tourism resources,and tourism is an important economic source of qingdao.therefore, accurate prediction of the development of tourism, reasonable and effective allocation of tourism resources, will play an important role in guiding to environment, transport and construction of scenic spot, etc . in this paper, we takes qingdao city as the study area,and makes use of data about 12 years which ranges from the first quarter 2000 to the last quarter of 2011 as the foundation.the models we have taken contain polynomial interpolation, fitting model, and cosine trend fitting model,as well as arima model in time series analysis programmed by matlab and r software to respectively forecast and analyze tourism income of qingdao city over the next two years. in this paper,we also choose the best model of several kinds of prediction analysis method above as the final prediction method. consequently,results show that the arima model is the best method to predict the qingdao future trends in the number of total travel.key words: qingdao tourism, matlab, r software, the arima model, time series ii目录1绪论11.1论文研究背景11.2论文研究目的21.3论文研究意义22对旅游人数的分析研究32.1数据的收集与来源32.2旅游人数预测的传统方法介绍32.3时间序列模型93基于arima模型的旅游人数预测分析113.1 arima模型建模步骤113.2 青岛市旅游人数时间序列分析143.3季节模型预测234结 论25致 谢27参考文献28附录29iii1绪论1.1论文研究背景 青岛市地处山东半岛南部,胶洲湾畔,是我国东部沿海重要的经济中心城市,是国家级历史文化名城和著名的海滨风景旅游胜地,是我国海洋科学研究中心,是一个依托港口发展起来的城市。改革开放以来青岛凭借得天独厚的自然和人文资源优势,大力发展旅游业,已经成为中国和亚太地区著名的海滨旅游城市。旅游业已成为青岛市经济发展的支柱产业,形成了海滨风光、历史名城和崂山名胜为主题的旅游格局,旅游业发展势头迅猛。进入新世纪,中国社会经济平稳发展,成功加入wto,北京申奥成功尤其青岛市荣幸成为北京举办奥运的唯一伙伴城市,这些都为青岛这座旅游潜力极大的海滨城市旅游业可持续发展开拓了更大、更广泛的拓展空间。时间序列,也叫时间数列或者动态数列,是指同一种现象在不同时间上的相继观察值排列而成的一组数字排列,它反映了要素随时间变化发展的过程。时间序列分析的基本思想是:通过时间序列的历史数据揭示现象随时间变化的规律,并将规律延伸至未来的某个时段,从而对该现象的未来做出预测分析。其预测分析法主要有:移动平均法、指数平滑法、自回归移动平均模型分析法和求和自回归移动平均模型分析法等预测分析方法。随着社会经济的发展,旅游收入作为一个国家或者地区经济收入的最重要组成部分也在不断的提高。因此,对旅游方面的预测也在不断的增加。如:吴家宝、叶家玮运用时间序列分析法中的图形识别法对珠海游艇旅游收入进行了预测分析。程刚、王宪杰成功应用线性回归和势分析模型对山东省、山东半岛城市群和胶东半岛各空间旅游入境收入进行了统计分析和预测。许虹以1983 年至1999 年旅游基础数据对四川省未来若干年的国际国内游客接待量和旅游收入进行了预测。厦门大学赵国顺运用多种时间序列分析模型对股票价格趋势进行预测研究。青岛市作为国家级历史文化名城和著名的海滨风景旅游胜地,有必要对青岛市旅游收入进行预测分析。本文运用时间序列预测法对青岛市未来两年的旅游人数进行预测分析,给青岛市政府在制定未来青岛地区旅游业的发展的方针政策方面提供一个良好的依据。1.2论文研究目的本文主要通过对青岛旅游人数的时间序列分析,预测来青岛旅游人数随季节和时间的变化,从而对环境、交通以及景区等方面建设提供参考,同时分析总结出了旅游业现如今在发展过程中所存在的相关问题以及进一步分析了这些问题所产生的原因,最后针对青岛旅游业在发展过程中存在的问题提出了相应的建议与发展策略。1.3论文研究意义在旅游人数预测的问题中,由于旅游人数变动有强烈的季节性与自相关性,因此简单的插值拟合无法消除季节性因素,也不能很好地利用数据之间的自相关性,导致预测的结果出现很大的误差。而时间序列就是按照时间的顺序记录的一列有序数据,通过观察、研究,找寻它变化发展的规律,预测它将来的走势。时间序列分析在日常生活中随处可见,有着非常广泛的应用领域。例如在日股票闭盘价、月价格指数、年降水与干旱指数等都采用时间序列模型。本文采用时间序列分析方法中的求和自回归移动平均模型(arima)预测分析法,对2000年第一季度至2011年第三季度的青岛市国内旅游人数,进行了时间序列拟合,建立arima模型,对未来几年青岛的旅游人数进行预测。结果表明,与真实值进行比较,arima模型的预测值有较好的拟合效果,从而提供了一个青岛市旅游人数预测的有效方法。同时本文尝试用r软件编程来实现青岛市旅游人数的时间序列分析,而不同于以往常用的eviews、spss等软件。这也会为以后研究时间序列分析的统计人员提供很好的借鉴。 2对旅游人数的分析研究2.1数据的收集与来源本文选取的数据源于青岛统计信息网,包含2000年2011年各季度的国内旅游人数(单位:万人)。青岛市2000至2011年各季度国内旅游人数(单位:万人)年份qtr1 qtr2 qtr3qtr42000185.52372.31527.09200.142001233.56417.33592.1276.142002280.18509.01718.73286.982003310.99202.96795.87344.752004336.21559.07901.65360.512005375.23637.21995.39441.32006436.2733.61096.79534.242007502.86830.591282643.332008522.9744955.01561155.21756.332009612.071066.921438.05786.382010661.661234.71618.88881.412011729.561398.821853.68974.05表2-1青岛市2000至2011年各季度国内旅游人数5(单位:万人)2.2旅游人数预测的传统方法介绍2.2.1多项式拟合 假设给定数据点(i=0,1,m),为所有次数不超过的多项式构成的函数类,现求一,使得 当拟合函数为多项式时,称为多项式拟合,满足上式的称为最小二乘拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。显然为的多元函数,故使上述问题即取得极小值的参数所构成的多项式即为所求的多项式。 因为数据只有48组故可以在有限次拟合中找出拟合误差最小的多项式,其中拟合的多项式中发现拟合的10次多项式误差最小为 2.0568e+003。以下为根据数据拟合所得3次(红色)、6次(蓝色)和10次(紫色)多项式图象,黑点表示离散的数据点。图2-1 多项式拟合拟合的10次多项式的各系数为p10 = 1.0e+017 *-0.0000 0.0000 -0.0000 0.0000 0.0000 -0.0000 -0.0000 0.0000 0.0000 -0.0020 1.2759误差= 2.0568e+003 由图像不难看出,拟合的多项尽管能够表示出国内旅游人数逐年递增趋势,但是不能很好地体现出旅游人数的季度变化,因此拟合的误差很大,不能作为预测下一年的旅游人数的模型。2.2.2拉格朗日插值多项式 若,是a,b上的n+1个节点,则中是可以用于逼近的多项式,即 。当时,称为线性插值,拉格朗日多项式为:当时,即为抛物插值,这也是一种常用的代数插值。根据给定函数在三个相异节点的函数值,构造次数不超过二次的多项式,为:当插值点增加到个时,就可以通过个不同的已知点来构造一个次数为的代数多项式。拉格朗日多项式为: 如下图图2-2所示为2000年至2011年青岛市的国内旅游人数的趋势图,在该图中显示青岛市旅游人数总体呈上升趋势,局部有明显的季节性变化。在利用拉格朗日插值法插值逼近函数图象时,如图2-3所示由于插值节点太多,同时时间轴的数据太接近,导致误差很大matlab无法画出准确的函数图象。因此下面通过比较之后,选取了2009年至2011年近两年的数据进行拉格朗日插值,同时对时间轴的坐标做了一下处理后所得图像及数据如图2-4所示: 图2-2 2000年至2011年各季度的旅游人数散点图图2-3拉格朗日插值后的图象图2-4 2009年第二季度至2011年第三季度旅游人数10次插值的图象插值10次所得的多项式为y=42050070325701.25+(-35753439798658.24)*x1+13501523503749.38*x2-2972085789066.978*x3+420292654814.4023*x4-39595802260.9117*x5+2485159311.0956*x6-100201396.7043*x7+2355109.9719*x8 -24584.8969*x9将x=2012带入所求的多项式得2012年的预测值为-5.208* 1e4 拉格朗日插值多项式对于低阶的插值会比较准确,但对于高阶的插值误差会很大。由所得多项式的表达式可以看出,由于多项式的系数太大,所以对于时间轴上的极小变动都会导致很大的误差,也正如预测的2012年旅游人数可以看出,误差确实很大,因为旅游人数不可能会出现负值,因此该插值多项式不是一个很好的预测模型。但又由2009年至2011年各季度旅游人数的插值图像可以看出,利用该模型来计算已得到2009年至2011年内各时间段内的旅游人数还是比较准确的。2.2.3余弦趋势拟合 由图2-2 2000年至2011年各季度的散点图可以看出数据季节性趋势非常明显,因此某些情况下,季节性趋势可以间接的用余弦曲线来模型化,余弦曲线能在反映一个时期到另一个时期的平滑变化的同时仍然保留季节性。以下方程表示余弦曲线:其中(0)为曲线的振幅,为曲线的频率,为曲线的相位。随着时间的变化,曲线在最大值和最小值之间变动,鉴于每个时间单位曲线严格重复自身,被称作余弦波动的周期。表示在时间轴上的任意初始值。对用时间标记1,2的季度数据,最重要的频率是,因为这样的余弦波动在每4个季度重复一次。对上面的余弦曲线化简得:其中, 而且,求逆得到, 这类趋势模型中最简单的可以表示如下:以下图表为余弦趋势模型估计与预测coefficients: estimate std. error t value pr(|t|) (intercept) 699.28 46.00 15.202 2e-16 *har.cos(2*pi*t) -324.52 65.05 -4.988 9.56e-06 *har.sin(2*pi*t) 101.33 65.05 1.558 0.126 表2-2余弦趋势模型估计与预测图2-5余弦趋势图 由2000年至2011年各季度的散点图,我们发现,旅游人数呈现明显的季节变化,单纯的线性回归模型还是低阶的多项式插值、拟合不能很好地表现出季节波动,考虑到这一点,观察散点图旅游人数的波动类似于余弦函数波动。于是我们选择余弦趋势模型来拟合该图像。如图2-5所示为余弦趋势模型拟合的图象,由图像不难发现,尽管旅游人数呈现出明显的季节变化,但是同时总体上还表现出逐步上升趋势。在振幅不变的预测趋势模型中显然不能体现出这点,因此图2-5显示出拟合图象有很大的误差,不能作为预测的模型。2.3时间序列模型在统计研究中,常用时间顺序排列的一组随机变量 来表示一个随机事件的时间序列,简记为.其中时间序列模型有四种:自回归模型ar、移动平均模型ma、自回归移动平均模型arma、自回归差分移动平均模型arima,可以说前三种都是arima模型的特殊形式。2.3.1 自回归模型ar(p) p 阶自回归模型记作ar(p),满足下面的方程: 其中:参数 c 为常数;1,2 ,p 是自回归模型系数;p为自回归模型阶数;是均值为0方差为 的白噪声序列。 2.3.2移动平均模型ma(q) q 阶移动平均模型记作ma(q) ,满足下面的方程: 其中:参数为常数;是 q 阶移动平均模型的系数;是均值为0,方差为 的白噪声序列。2.3.3自回归移动平均模型arma(p,q)模型 该模型主要用于拟合平稳序列的模型,主要满足一下方程: 其中是均值为0,方差为 的白噪声序列。显然此模型是模型ar(p)与ma(q)的组合形式,称为混合模型,常记作arma(p,q)。当 p=0 时,arma(0, q) = ma(q);当q = 0时,arma(p, 0) = ar(p)。2.3.4求和自回归移动平均模型arima(p,d,q)模型 该模型主要用于拟合非平稳序列的模型,主要满足以下方程: 其中式中; 为平稳可逆的arma(p,q)模型的自回归系数的多项式; 为平稳可逆的arma(p,q)模型的移动平滑系数的多项式。 简记模型令,为平稳序列,即 i(0) ,于是可以对 建立arma(p,q) 模型 : 如果时间序列经过d次差分后是一个arima(p,q)过程,则称原时间序列是一个p阶自回归、d阶求整、q阶移动平均过程,记作arima(p,d,q),d代表差分的次数。3基于arima模型的旅游人数预测分析 arma模型主要是针对平稳时间序列的分析方法。实际上,在现实中绝大部分序列都是非平稳的,因而对非平稳序列的分析更普遍、更重要。以下我们将运用arima模型对青岛市旅游人数变化进行预测。3.1 arima模型建模步骤3.1.1 数据平稳化处理首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用adf单位根检验来精确判断该序列的平稳性。本文中我们采取了观察折线图、线性回归的图还有单位根检验三种方法来判别平稳性,最终都得出相同的结论,该时间序列是非平稳的。通过观察对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。本文为了简便起见,只采取了差分的方法。重复以上过程,直至成为平稳序列。此时差分的次数即为模型中的阶数。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过2次。数据平稳化处理后,模型即转化为模型。3.1.2 模型识别 我们引入自相关系数和偏自相关系数这两个统计量来识别模型的系数特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。在平稳时间序列自相关函数和偏自相关函数上初步识别模型阶数和,然后利用aic定则准确定阶。aic准则:最小信息准则,同时给出模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算aic值,最后确定使其值最小的阶数是模型的合适阶数。关于模型,aic函数定义如下:式中:平稳序列为样本数,为拟合残差平方和,为参数。 aic准则定阶方法可写为:其中:,为模型阶数的上限值,一般取为根号或。实际应用中,一般不超过2。3.1.3 参数估计确定模型阶数后,应对模型进行参数估计。本文采用最小二乘法ols进行参数估计,需要注意的是,模型的参数估计相对困难,应尽量避免使用高阶的移动平均模型或包含高阶移动平均项的模型。3.1.4 模型检验完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该作下一步修改。这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t检验完成的q检验的零假设是即模型的误差项是一个白噪声过程。q统计量定义为近似服从分布,其中表示样本容量,表示用残差序列计算的自相关系数值,表示自相关系数的个数,表示模型自回归部分的最大滞后值,表示移动平均部分的最大滞后值。用残差序列计算q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。判别规则是: 若,则接受; 若,则拒绝。 3.1.5运用arima(p,d,q)模型预测的流程图:观察时间序列图平稳性检验差分运算拟合模型白噪声检验分析结束 图3-1 arima(p,d,q)模型预测的流程图3.2 青岛市旅游人数时间序列分析在模型中,时间序列是由一个零均值的平稳随机过程产生,即其过程的随机性质具有时间上的不变性,在图形上表现为所有样本点都在某一水平线上下随机波动。而青岛市旅游人数变化由于受地域、季节、奥运会、天灾人祸及经济发展状况等的影响,因此应属于非平稳的时间序列。对于非平稳时间序列,需要预先对时间序列进行平稳化处理。3.2.1 平稳性检查首先我们绘制青岛市旅游人数的时间序列图, 直观的观察时间序列图的平稳性。再进行线性回归,考察斜率值是否在置信区间内接近于零,接近于零则为平稳序列,最后进行单位根检验。图3-2 青岛市旅游人数的时间序列图图3-3 线性回归图象与原时间序列图 augmented dickey-fuller testdata: dat1dickey-fuller = -1.197, lag order = 3, p-value = 0.8948alternative hypothesis: stationary 图3-4 adf单位根检验 从图3-2可以看出青岛市旅游人数在伴有季节性波动的同时,具有很明显的上升趋势,因此该时间序列显然是非平稳的。进一步进行线性回归检测,发现回归图象如图3-3所示为一条单调递增的直线,斜率值为正值,显然在图形上表现为所有样本点不是在某一水平线上下随机波动,同时进行adf单位根检验,p值为0.8948,故该时间序列不符合零均值的平稳随机过程模型。3.2.2 模型识别在识别阶段,我们可以利用自相关函数和偏自相关函数来试探性用arima模型表现数据的产生机制。如下图3-5为旅游人数的样本acf(即季节均值模型残差的样本自相关系数):图3-5 旅游人数的样本自相关图acf图3-6旅游人数的样本偏相关图pacf从图3-5可以看出,旅游人数的自相关函数随着时间的间隔的增加,很缓慢的下降,在图3-6中,偏相关图的前几个值都在规定的标准差之外,因此序列是非平稳的。这些年来旅游人数有明显的增长趋势从中也可以判断其不是平稳的,因此为了能够对序列进行分析,要使其平稳化。故将选择差分法,对序列进行平稳化处理,从而进一步分析预测。现在对旅游人数y进行一次差分,如下图3-7所示:图3-7旅游人数的一次差分序列图 正如图3-7所印证的那样,此时序列中一般性的上升趋势已然不在,而强烈的季节性仍然存在,因此用季节差分法所得的序列能够建立更为简约的模型。我们再次利用相关函数和偏自相关函数进行检验得图3-8旅游人数的一次差分序列的样本acf图与图3-9旅游人数的一次差分序列的样本pacf图图3-8 旅游人数的一次差分序列的样本acf图图3-9 旅游人数的一次差分序列的样本pacf图 augmented dickey-fuller testdata: diff(dat1) dickey-fuller = -6.3784, lag order = 3, p-value = 0.01alternative hypothesis: stationary 警告信息:in adf.test(diff(dat1) : p-value smaller than printed p-value图3-10 旅游人数的一次差分序列后的adf单位根检验由图3-8显示的旅游人数的一次差分序列的样本acf图看出一阶差分后序列的自相关系数呈衰减趋于零,表现为拖尾性。同时样本的偏相关图pacf图在一阶差分之后也表现拖尾性,即偏相关系数呈衰减趋于零。又由图3-10 adf单位根检验得此时的旅游人数的时间序列已趋近于平稳。我们再次作旅游人数经过一次差分和季节差分后的时间序列图3-11,此时可以看出序列的明显上升趋势已经没有了,如下所示:图3-11旅游人数经过一次差分和季节差分后的时间序列 由图3-11旅游人数经过一次差分和季节差分后的时间序列图看出大部分的季节性已经消失。对旅游人数经过一次差分和季节差分后的样本自相关图acf与偏相关图pacf,如图3-12与图3-13所示:图3-12 旅游人数经过一次差分和季节差分后的样本acf图图3-13旅游人数经过一次差分和季节差分后的样本pacf图 augmented dickey-fuller testdata: diff(diff(dat1), lag = 4) dickey-fuller = -5.3022, lag order = 3, p-value = 0.01alternative hypothesis: stationary 图3-14旅游人数经过一次差分和季节差分后的单位根检验由图3-12印证了经过两次差分后的时间序列已经几乎不再具有自相关性。同时由单位根检验得p0.01,表明该序列已经平稳。此图说明只需建立一个只在滞后1上具有自相关性的简单模型季节模型:以上将在模型构建的诊断阶段予以修订。3.2.3 模型拟合在建立季节模型后,接下来要做的是尽可能有效地估计出模型的参数。对于旅游人数的时间序列模型季节模型,图3-15给出了极大似然估计及其标准误差:coefficients: 估计值 -0.8769 -0.2881s.e. 0.0751 0.1373sigma2 estimated as 8740: log likelihood = -257.23, aic = 518.47图3-15 旅游人数arima模型的参数估计所有的系数估计值都是高度显著地,同时应用aic准则,尝试对p和q取其他值进行比较aic值的大小,以进一步确定最合适的arima模型。经计算得结果如下:arima(0,1,1)arima(0,1,2)arima(1,1,0)arima(2,1,0)aic值518.47 521.41531.76 529.08表3-1 旅游人数arima模型的参数估计由计算的结果显示当p=0,q=1时的aic值最小,即取arima(0,1,1)模型是最合适的模型。3.2.4诊断性检验为了对估计后的季节模型进行检验,首先需要观察残差的时间序列图,图3-16给出了标准残差图。图3-16模型的残差检验在图3-16给出的标准残差图中,除了序列中间存在某些异常行为外,次残差图并没有表明模型有任何主要的不规则,鉴于模型在2004年第二季度的标准残差看上去很可疑,我们将在改进的模型中进一步对模型做异常值检验。下面需要对残差的样本acf即自相关系数与偏相关系数pacf作进一步分析,如下图3-17与图3-18所示:图3-17模型残差acf图3-18模型残差pacf由图表看出“统计上显著的”相关系数位于滞后21,其值仅为0.3相关性非常小,而且滞后21上的依赖关系难以给出合理的解释。最终,在所示的48个自相关系数中只有一个是统计上显著的,这一点并不奇怪,这种情况很容易碰巧发生。除了滞后21处的边缘显著性以外,此模型看起来已经捕捉到了序列中依赖关系的本质。下面借助于残差来研究误差项的正态性问题。图3-19显示的是残差直方图,图3-20显示的是残差的qq正态图。图3-19 模型的残差图3-20残差的qq正态图:模型由上图我们注意到旅游人数大体服从正态分布。在图3-20的残差的qq正态图中,我们看到有多个异常值,因此对模型可以作进一步检验.3.3季节模型预测我们利用模型对青岛市旅游人数进行预测。图3-21给出了预测值以及所拟合的前置时间为一年的模型的95%预测极限。图中也显示了观测数据最后一年的值。预测值很好地模仿出了序列的随机周期性,而且预测极限也显示出预测值精度令人满意。由的参数估计得最终的预测模型为:同时我们青岛市未来两年的旅游人数分别作了短期两年与长期五年的的预测,最终图像显示青岛市旅游人数将会呈现出稳步上升的趋势,如下图图3-21与图3-22所示:图3-21青岛市未来短期两年的旅游人数预测图3-22青岛市未来长期五年的旅游人数预测 4结 论本文使用时间序列分析的方法对青岛市各季度旅游人数数据序列进行了时间序列分析,并运用模型预测方法对我青岛市以后各季度旅游人数变化进行了小规模的预测。 通过模型识别、比较以及检验,最终选定模型。由拟合图象图3-21、与图3-22可以看出我们取得了较为理想的预测结果。由本文得到的较为满意的拟和结果可知时间序列短期预测精度是比较高的。由此可见,时间序列预测法是一种重要的预测方法,其模型比较简单,对资料的要求比较单一,只需变量本身的历史数据,在实际中有着广泛的适用性。在应用中,应该根据所要解决的问题及问题的特点等方面因素来综合考虑并选择相对最优的模型。 当然由于一个城市的旅游人数受多个方面的因素影响,不单纯的一个模型就可以完全预测的。比如2009年第三季度旅游人数受经济危机的影响出现了很大的变动,与以前的变动趋势有较大的出入。这是我们无法预料到的。为了对青岛市旅游业做一个全面科学的评价,本文除了对来青旅游的国内旅游人数做了预测外,还对涉外旅游人数进行了时间序列分析,如下图3-23青岛市涉外旅游人数、图3-24青岛市涉外旅游收入所示:图3-23青岛市涉外旅游人数预测图3-24青岛市涉外旅游人数预测在对青岛市涉外旅游人数及收入进行arima模型预测时发现涉外旅游人数及收入不适合该模型,因此仅进行简单的时间序列观测。但不论是青岛市国内旅游人数还是对外旅游人数,均表明青岛市的旅游业正处于上升期,青岛市当地的政府部门应关注该支柱产业的发展,加大对涉外旅游的优惠政策,引导青岛市旅游业的长足发展。致 谢毕业论文暂告收尾,这也意味着我在山东科技大学的四年的学习生活既将结束。回首既往,自己一生最宝贵的时光能于这样的校园之中,能在众多学富五车、才华横溢的老师们的熏陶下度过,实是荣幸之极。在这四年的时间里,我在学习上和思想上都受益非浅。这除了自身努力外,与各位老师、同学和朋友的关心、支持和鼓励是分不开的论文的写作是枯燥艰辛而又富有挑战的。时间序列分析是在统计学与数学领域一直探讨的热门话题,老师的谆谆诱导、同学的出谋划策及家长的支持鼓励,是我坚持完成论文的动力源泉。在此,我特别要感谢我的导师邹玉梅老师。从论文的选题、文献的采集、框架的设计、结构的布局到最终的论文定稿,从内容到格式,从标题到标点,她都费尽心血。没有邹玉梅老师的辛勤栽培、孜孜教诲,就没有我论文的顺利完成。感谢我统计专业的各位同学,特别是我的舍友,与他们的交流使我受益颇多。最后要感谢我的家人以及我的朋友们对我的理解、支持、鼓励和帮助,正是因为有了他们,我所做的一切才更有意义;也正是因为有了他们,我才有了追求进步的勇气和信心。参考文献1王燕.应用时间序列分析m.北京:中国人民大学出版社,2005:1-239.2张树京,齐立心.时间序列分析简明教程m.北京:清华大学出版社,2003:5-15.3徐国祥统计预测和决策(第二版)m上海:上海财经大学出版社,2005:148-1494易丹辉.统计预测2方法与应用m.北京:中国统计出版社,2001:177- 251.5青岛统计信息网,/statsqd/index/index.shtml6时间序列分析及应用:r语言(原书第2版)/(美)克莱尔(cryer,j.d.)等著;潘红宇等译。-北京:机械工业出版社,2011.17abraham,b.and ledolter,j.(1983).statistical methods for forecasting.new york: john wiley & sons.8sumei tang, e. a. selvanathan and s. selvanathan. foreign direct investment, domestic investment and economic growth in china: a time series analysis.the world economy, 2008.10,1467-9701. 附录1、matlab实现的多项式拟合程序x=2000:0.25:2011.75y=185.52,372.31,527.09,200.14,233.56,417.33,592.1,276.14,280.18,509.01,718.73,286.98,310.99,202.96,795.87,344.75,336.21,559.07,901.65,360.51,375.23,637.21,995.39,441.3,436.2,733.6,1096.79,534.24,502.86,830.59,1282,643.33,522.97,955.0156,1155.21,756.33,612.07,1066.92,1438.05,786.38,661.66,1234.7,1618.88,881.41,729.56,1398.82,1853.68,974.05plot(x,y,k.,markersize,25)axis(2000 2011 100 1500)p3=polyfit(x,y,3)p6=polyfit(x,y,6)t=2000:0.25:2011.75s3=polyval(p3,t)s6=polyval(p6,t)hold onplot(t,s3,r-,linewidth,2)plot(t,s6,b-,linewidth,2)grid2、 matlab实现的拉格朗日差值程序x=9.5:0.25:11.75;x=xy=1438.05;786.38;661.66;1234.7;1618.88;881.41;729.56;1398.82;1853.68;974.05;%画出已知n个点的位置plot(x,y,r:*);hold on%n次拉格朗日多项式为 y=a0+a1*x+a2*x2+a(n-1)*x(n-1) %其中a0 a1 a2a(n-1)为待求系数n=length(x);x=vandermonde(x,1)inv(x)a=inv(x)*y%a=xy;%绘制插值函数图象x1=linspace(min(x),max(x);x2=vandermonde(x1,n);y1=x2*a;plot(x1,y1);hold on%显示公式func=y= ,num2str(a(1);for i=2:n; b=+ ,num2str(a(i),*x,num2str(i-1); func=func,b;endtext(0.8,0.8,func);3、r软件实现时间序列分析程序#载入软件包与数据library(tsa)lv=c(185.52,372.31,527.09,200.14,233.56,417.33,592.1,276.14,280.18,509.01,718.73,286.98,310.99,202.96,795.87,344.75,336.21,559.07,901.65,360.51,375.23,637.21,995.39,441.3,436.2,733.6,1096.79,534.24,502.86,830.59,1282,643.33,522.97,955.0156,1155.21,756.33,612.07,1066.92,1438.05,786.38,661.66,1234.7,1618.88,881.41,729.56,1398.82,1853.68,974.05)win.graph(width=4.875, height=3,pointsize=8)#旅游人数的散点图plot(lv,ylab=y,main=青岛市旅游人数)#旅游人数的折线图dat1=ts(lv,start=c(2000,1),frequency=4)dat1model1=lm(dat1time(dat1)summary(model1)plot(dat1,type=o,ylab=y)abline(model1)#adf单位根检验adf.test(dat1)# 在折线图上标注季度plot(window(dat1,start=c(2000,1),main=青岛市旅游人数, ylab=y)jidu=c(1季度,2季度,3季度,4季度)points(window(dat1,strat=c(2000,1),pch=jidu)# 样本自相关序列图与偏相关图par(mfrow=c(1,1)acf(as.vector(dat1),lag.max=48,main=expression(sampleacfof旅游人数levels)win.graph(width=4.875, height=3,pointsize=8)pacf(as.vector(dat1),lag.max=48,main=expression(samplepacfof旅游人数levels)#旅游人数第一次差分图plot(diff(dat1),main=expression(timeseriesplotofthefirstdifferencesof旅游人数levels), ylab=expression(firstdifferenceof旅游人数) # 旅游人数第一次差分后的样本自相关序列图与偏相关图acf(as.vector(diff(dat1),lag.max=48,main=expression(sampleacfofthefirstdifferencesof旅游人数levels)pacf(as.vector(diff(dat1),lag.max=48,main=expression(samplepacfofthefirstdifferencesof旅游人数levels)#旅游人数第一次差分后的adf单位根检验adf.test(diff(dat1)# 旅游人数差分后的季节差分(二次差分)plot(diff(diff(dat1),lag=4),main=expression(timeseriesplotofthefirstandseasonaldifferencesof旅游levels), ylab=expression(firstandseasonaldifferenceof旅游) # 旅游人数二次差分后的样本自相关序列图与偏相关图acf(as.vector(diff(diff(dat1),lag=4),lag.max=48,ci.type=ma,main=expression(sampleacfofthefirstandseasonaldifferencesof旅游人数levels)pacf(as.vector(diff(diff(dat1),lag=4),lag.max=48,ci.type=ma,main=expression(samplepacfofthefirstandseasonaldifferencesof旅游人数levels)# 旅游人数二次差分后的adf单位根检验adf.test(diff(diff(dat1),lag=4)# 旅游人数arima模型的参数估计与aic值的计算m1.dat=arima(dat1,order=c(0,1,1),seasonal=list(order=c(0,1,1),period=4)m1.datm2.dat=arima(dat1,order=c(2,1,0),seasonal=list(order=c(2,1,0),period=4)m2.datm3.dat=arima(dat1,order=c(0,1,1),seasonal=list(order=c(0,1,1),period=4)m3.datm4.dat=arima(dat1,order=c(0,1,2),seasonal=list(order=c(0,1,2),period=4)m4.dat#arima模型的残
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国家开发银行2026年校园招聘笔试模拟试题及答案解析
- 2025重庆市奉节县事业单位面向服务期满且考核合格“三支一扶”人员招聘工作人员26人笔试模拟试题及答案解析
- 2026中国邮政储蓄银行望江县支行校园招聘笔试备考试题及答案解析
- 2025广西柳州市社会福利医院编外聘用人员招聘19人笔试参考题库附答案解析
- 2025河南郑州惠济区卫生健康系统卫生专业人才引进及特岗全科医生、特招医学院校毕业生引进41人笔试模拟试题及答案解析
- 2026华能(苏州工业园区)发电有限责任公司应届高校毕业生招聘(江苏)笔试模拟试题及答案解析
- 国家能源武汉市2025秋招半结构化面试模拟30问及答案
- 矿业权评估师职业资格考试(矿业权评估实务与案例固体矿产资源勘查与实物量估算)模拟试题及答案(2025年川省)
- 2025年高级经济师考试(高级经济实务运输经济)综合试题及答案
- 矿业权评估师考试(矿业权评估实务与案例固体矿产资源勘查与实物量估算)练习题及答案(2025年湖南湘西州)
- (2025秋新版)外研版八年级英语上册全册教案
- GB/T 45870.1-2025弹簧测量和试验参数第1部分:冷成形圆柱螺旋压缩弹簧
- 数据备份课件
- 银行集团管理办法
- 人行国内证管理办法
- 电厂钢结构安装方案(3篇)
- 部编版六年级下册语文小升初《词语积累与运用》专项检测卷 含答案
- 残运会应急预案管理办法
- T/SFABA 2-2016食品安全团体标准食品配料焙烤食品预拌粉
- 村集体合作入股协议书
- A-Level化学(A2)2024-2025年有机合成与分析化学深度学习试题
评论
0/150
提交评论