基于时间序列分析的股票价格趋势预测_第1页
基于时间序列分析的股票价格趋势预测_第2页
基于时间序列分析的股票价格趋势预测_第3页
基于时间序列分析的股票价格趋势预测_第4页
基于时间序列分析的股票价格趋势预测_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华北科技学院毕业论文目 录摘要IIIABSTRACTIII第1章 绪论11.1研究背景及意义1第2章 股票价格预测理论与方法22.1股票基础知识22.2 股票预测理论的发展32.3股票预测分析的传统方法4第3章 时间序列分析的理论与方法63.1时间序列分析发展历史63.2时间序列分析方法概述73.3 随机时间序列分析的特性分析93.3.1 随机过程的基本概念93.3.2 时序特性的研究工具93.4时间序列模型简介103.4.1ARMA模型103.4.2ARIMA模型123.5建立时间序列模型的一般步骤13第4章 实例预测144.1数据录入144.2平稳性检验154.3模型识别154.4模型诊断

2、检验184.5模型拟合194.6预测21第5章 结论22附录23致谢24基于时间序列分析的股票价格趋势预测摘要随着人们生活水平的提高,人们的投资方式也在发生着巨大的变化,越来越多的人开始关注并参与到股票市场投资中去。股票具有高收益的同时也具有高风险性,股票市场受众多因素的影响,价格令人无法捉摸,股票价格预测的研究具有巨大的价值,因此对于股票价格的预测从股票市场诞生之日起,就成了股民与学者们不懈探索的难题。时间序列分析是经济领域研究的重要工具之一,它不仅可以描述历史数据随时间变化的规律,还可以用于经济领域的研究预测。在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者提供决策依据。

3、本文对时间序列相关的理论知识做了简单的介绍,重点对预测模型进行了研究。最后使用上证指数的历史数据,运用时间序列预测法对上证指数进行了短期预测,得到了较好的预测效果。 关键词:时间序列;预测;股票价格;EViewsAbstractWith the improvement of people's living standard, people's investment mode is changing. More and more people begin to pay attention to the stock market and put their money into t

4、he stock market. Stock has high earnings but also has high risk. There are many factors that influence the stock market. The price of the stock is always unexpected. Therefore the research on stock price prediction is of great value. It has been the hot topic of research. The prediction of stock pri

5、ce has not been stopped since the birth of stock market.Time series analysis is an important tool in the economic research field. It can not only describe the law of historical data over time, but also can be used to research in the economic field. Time series forecasting method is often used to pre

6、dict the stock price trend. It can offer the decision information for investors. In this paper, we briefly introduced the relevant theoretical knowledge of time series and focus on the research of time series prediction model. Finally, we used the time series analysis method to forecast the short-te

7、rm price of Shanghai composite index. We find the constructed model has excellent short-term prediction ability, and get a good result.Key words:Time series; Forecast; Stock price; EViews; III华北科技学院毕业论文第1章 绪论1.1研究背景及意义我国于1985年发行了第一支股票,我国的沪深股市是从一个地方股市发展而成为全国性的股市的。在1990年12月正式营业时,上市的股票数量只有为数很少的几只,其规模很小

8、,且上市的股票基本上都是上海或深圳的本地股。目前已有沪、深两大交易所,上百家证券公司,5000多个证券营业部,1亿多证券投资者。股票市场是金融市场的重要组成部分,与经济的发展密切相关,股票作为一种虚拟资本的代表,资本证券化的工具,具有快速融资的作用。同时股票作为一种投资方式也很受投资者亲睐,股票具有高收益的同时也具有高风险。由于股票市场受政治、经济、社会文化等因素(如上市公司的经营状况、财务状况、利率水平、汇率变动、国际收支、物价因素、经济政策等)的影响,其内部规律非常复杂,变化周期难以捉摸。从股票市场表面上来看,其缺乏一定的规律性,股票市场的变化难以预测。同时我国股票市场投资者在结构上具有特

9、殊性,投资者的心理状态,对股票交易行为可产生直接影响,从而导致股价波动,使股价走势变化莫测,难以把握。人们对于股票价格预测的研究,从股票市场诞生之时起,就从未停止过。期间出现了许多的预测方法,此后这些方法也逐渐得到了完善,例如K线图分析法、移动平均法、柱状图分析法、道琼斯分析法、趋势分析法等。随着计算机技术的发展以及数学理论研究的深入,人们试图使用数学方法解开股票市场的运动规律,并取得了一些成果。时间序列分析方法便是其中耀眼的一颗明星。一些经典的时间序列模型例如ARMA、GRACH、ARCH已经被广泛的适用于金融时间序列的预测当中。目前证券投资已经成为人们投资的一个重要方式之一,股票市场的变化

10、与整个市场经济的发展有着密不可分的关系,其在市场经济中始终发挥着国民经济晴雨表的作用。其作用不仅受到广大投资者的关注,更被政府所重视。对股票投资者来说,未来股价变化趋势预测越准确,对利润的获取及风险的规避就越有把握;对国家的经济发展和建设而言,股票预测研究同样具有重要作用。因此对股票价格趋势预测的研究有着十分重要的意义。第2章 股票价格预测理论与方法2.1股票基础知识股票是一种由股份有限公司签发的用以证明股东所持股份的凭证,它表明股票的持有者对股份公司的部分资本拥有所有权。由于股票具有一定的经济利益,且可以上市流通转让,因此股票也是一种有价证券。普通投资者可以通过证券经济公司开立证券账户,进行

11、股票的投资。股票的价格包括开盘价、收盘价、最高价、最低价。目前主要使用K线图来表示。股票的价格围绕股票价值上下波动,同时也受供求关系、市场、政策等因素的影响,根据内容和性质分归为以下四点,宏观因素、微观经济因素、市场因素和非经济因素。股票投资的收益由股息收入、资本损益和资本增值收益三部分组成。股息收益的来源是公司的税后净利,税后净利是公司分配股息的基础和最高限额,但要作必要的公积金、公益金的扣除。资本损益又称资本利得,是投资者在股票市场上利用价格波动低买高卖赚取的差价收入,当卖出价大于买入价时为资本收益,卖出价小于买入价时为资本损失。资本增值收益的形式是送股,但送股的资金不是来自当年可分配的盈

12、利,而是来自公司提取的法定公积金和任意公积金。股票价格指数就是用以反映整个股票市场上各种股票市场价格的总体水平及其变动情况的指标。简称为股票指数。它是由证券交易所或金融服务机构编制的表明股票行市变动的一种供参考的指示数字。由于股票价格起伏无常,投资者必然面临市场价格风险。对于具体某一种股票的价格变化,投资者容易了解,而对于多种股票的价格变化,要逐一了解,既不容易,也不胜其烦。为了适应这种情况和需要,一些金融服务机构就利用自己的业务知识和熟悉市场的优势,编制出股票价格指数,比如道富投资,公开发布,作为市场价格变动的指标。投资者据此就可以检验自己投资的效果,并用以预测股票市场的动向。同时,新闻界、

13、公司老板等也以此为参考指标,来观察、预测经济发展形势。上证指数及上证综合指数是我国最早发行的指数,是以上海证券交易所挂牌上市的全部股票为计算范围,以发行量为权数的加权综合股价指数。上证指数从100点开始,开始于1991年,上证指数计算以各个股票总市值为权数,以1991年为基期。新上证综指发布以2005年12月30日为基日,以当日所有样本股票的市价总值为基期,基点为1000点。2.2 股票预测理论的发展全球的股票市场从诞生之日起至今已经有几百年的历史了,但是人们对股票市场的真正理解和认识是在近几十年才开始的,并且取得了较大的发展。人们使用科学的方法对股票市场进行研究分析也只是从近代才开始的。在过

14、去相当长的一段时间里,因为股票市场的规模不大,信息共享流通的速度过慢以及分析股票的技术限制,人们只能通过自己的主观判断来进行决策和投资。随着近几十年股票市场的快速发展,信息披露规范化和信息分享的多样化,人们开始寻求一些有效的预测方法来对股票市场进行分析研究从而更有效的进行投资。但是股票市场是一个复杂的系统,它不仅受到市场外部的综合因素影响,而且还会受到来自自身内部的影响,对于股票市场的的预测确实难于把握。不过由于对于金钱的渴望以及利益的诱惑,长期以来人们并没有停止过对股票市场预测研究的探索。本杰明·格雷厄姆(Benjamin Graham)和戴维·多德(David L.Do

15、dd)通过对1929年美国股票市场暴跌的深刻反思认为股价的无序波动是建立在股票的“内在价值”的基础之上。由于各种非理性原因的存在股票价格会偏离其“内在价值”,然而一段时间后,这种偏离便会得到相应的纠正,进而回到其“内在价值”。因此经济学家认为判断股价的未来表现,可以通过其“内在价值”来参考。然而公司未来盈利能力决定了“内在价值”。所以预测股票价格的关键因素取决于对公司未来盈利能力和现金流的准确把握。此后戈登(Gordon)在对“内在价值”进行深入的量化分析的基础之上提出了著名的股票定价现金流模型。但是现金流具有不确定性,因此给该模型的广泛应用带来了不便,因此早期对于股票价格预测的研究主要集中在

16、解决如何确定现金流的问题上。在实际投资中,很少有投资者会将所有的投资集中在一直股票上。因此哈里·马科维茨(Harry Markowitz)在1938年提出了投资组合模型的概念,并建立了现代证券组合理论,以统计学上的均值和方差等概念来衡量投资组合的风险和收益,并将风险分为了系统和非系统风险。投资者可以根据自己的风险承受能力建立自己的最优投资组合来实现收益最大化。罗伯茨(Roberts)和奥斯本(Osborne)经过对股票价格的长期研究之后发现,市场价格遵循着“随机游动”的规律,以法玛(Fama)教授为代表的经济学家提出的有效市场假说,认为投资者会对市场信息做出合理的反应,将市场信息与股

17、票价格相结合。有效市场假说理论将有效市场分成了以下三个层次:弱有效市场:在该市场中以往价格的所有信息已经完全反映在当前的价格之中,所以人们利用分析历史价格信息的技术分析方法无法获得外收益。半强型有效市场:在该市场中,以往所有公开的信息例如年报、简报、财务报表等都已反映在当前的价格之中,人们无法通过分析这些公开信息来获得格外受益。强有效市场:在该市场中所有信息都已经反映在了股票价格之中,包括公开信息以及内幕信息等。没有人可以利用这些信息获得额外收益。市场对不同信息的反映程度是市场效率中的关键因素,它包括对历史信息、公开信息、内部信息的不同反应。有效市场假说认为,在弱有效市场的条件下,历史信息对未

18、来价格的某种影响,其实已经体现在现在的价格序列中,两者存在着某种联系。对于投资者来说不能简单的根据过去的信息来获得收益,过去的信息对未来的收益影响只是随机的。进入二十世纪八十年代,投资者在寻求一般均衡定价模型进展不大的情况下,开始由定价理论的研究转向了市场信息的调查。大多数经济学家都认为信息与股价之间存在某种必然的联系,并且弗伦奇(French)和罗尔(Roll)的实证研究也证明了这一点,可获得信息量与股价波动幅度之间存在着良好的正相关关系。此外,投资者们为了从巨量数据中将隐藏的重要信息挖掘出来,于一九八九年提出了数据挖掘的概念。我们可以从数据集中识别提取出潜在的具有决策性的信息。其中比较著名

19、的研究理论有混沌理论、灰色模糊理论、神经网络等。2.3股票预测分析的传统方法股票预测的传统方法主要可以分为基本分析法和技术分析法。 一、基本分析法 基本分析,又称基本面分析,是股票投资分析师根据经济学、金融学、财务管理学及投资学等基本原理,对决定证券价值及价格的基本要素(宏观经济指标、经济政策走势、行业发展状况、产品市场状况、公司销售和财务状况)进行分析,评估证券的投资价值,判断证券的合理价位提出对应投资建议的一种分析方法。 影响股票价格的因素比较多,主要包括宏观经济因素、行业发展因素以及公司自身因素三大方面。宏观经济因素主要是各项经济指标和经济政策对证券价格的影响;行业发展因素主要是企业所在

20、行业以及相关行业的发展状况;公司自身因素主要包括公司的经营管理能力、竞争能力、盈利能力、发展能力、财务状况、经营业绩。 基本面分析包括以下两方面:宏观:研究一个国家的财政政策、货币政策、通过科学的分析方法,找出市场的内在价值,并与目前市场实际价值作比较,从而挑选出最具投资价值的股票。微观:研究上市公司经济行为和相应的经济变量,为买卖股票提供参考依据。二、技术分析法 技术分析是指以市场行为为研究对象,来判断市场趋势并跟随趋势的周期性变化来进行股票及一切金融衍生物交易决策的方法总和。证券的市场行为可以有多种表现形式,其中证券的市场价格、成交价和成交量的变化以及完成这些变化所经历的时间是市场行为最基

21、本的表现形式。技术分析是建立在以下三点假设的前提之上的:1、 市场行为包容消化一切2、 价格沿趋势运动3、历史会重演技术分析的方法比较多,我们对这些方法粗略的进行划分,可以将技术分析方法分为以下五类:K线类:K线类方法是通过对若干天的K线组合情况的研究,推测股票市场多空双方力量的对比,进而判断股票市场多空双方的情况。K线图是进行各种技术分析的重要的依据。切线类:切线类是按照一定的原则和方法在由股票价格的数据所绘制的图表中画出一些直线,然后我们可以根据这些直线的情况推测股票价格的未来趋势,这些直线就叫切线。例如支撑线和压力线,通过支撑线和压力线我们可以知道相应的支撑位和压力位,有助于我们对价格趋

22、势的预测。形态类:形态类是根据股票价格图表中过去一段时间走过的轨迹形态来预测股票价格未来趋势的方法。根据技术分析的前提可知,市场行为包容消化一切。价格过去时间的轨迹形态是股票市场对所有信息进行消化后的结果,由此我们可以推测出证券市场所处的大环境,因此通过价格形态来推测股票价格趋势具有重要意义。指标类:指标类主要是通过各种数据历史资料,建立一个数学模型,给出数学上的计算公式,得到一个体现股票市场的某个方面内在实质的指标值。从指标中我们可以获得到从行情报表中无法直接得到的信息。指标可以为我们的投资行为提供指导方向。波浪类:波浪类是把股价的上下变动和不同时期的持续上涨、下跌看成是波浪的上下起伏。波浪

23、理论认为股票的价格运动也遵循波浪起伏的规律。波浪理论能够提前很长时间预测出到行情的底部和顶部,从而帮助我们分析出股票价格运动的趋势。 在证券投资中,投资者需要解决的问题有两个,一个是投资什么样的股票,另一个是如何把握股票买卖的时机。这也正是基本分析和技术分析所要解决的问题。在实际的金融市场中,股票价格的波动,不仅是受到上市公司的经营状况的影响,此外各种各样因素的变化也会直接或间接地影响股票价格。基本面分析可以帮助我们选择股票的种类,而技术分析则可以帮助我们选择合适的买卖时机。第3章 时间序列分析的理论与方法3.1时间序列分析发展历史在自然科学、社会科学以及工程技术的许多领域,普遍存在着按时间顺

24、序发生的具有概率特征的各种随机现象,人们通过观测值把这些现象记录下来,便成为了可供分析的随机数据。我们按照时间的先后顺序将某一指标在不同时刻上的不同数值排列起来,进而组成数列就称此数列为时间序列。这些数据有时候本身就是离散的,有时是随机的连续信号的采样值。实际上,时间序列就是离散的随机过程。例如太阳黑子的数目变化、地震波的变化、人脑电波的变化、市场物价 的变化等等,都属于随机过程。人们希望通过分析这些数据序列,来认识事物,找到他们的规律。但是,只是通过简单的统计分析来处理这些数据是远远达不到要求的。为了较为准确地找出时间序列内在的发展规律性和统计特性,时间序列分析方法由此而生。时间序列分析提供

25、了一套具有科学依据的动态数据处理方法,该方法的主要手段是对各种类型的数据,采用相应的数学模型去近似拟合。通过对模型的分析研究,便可以更好的了解数据的结构特征和内在规律,从而实现对其发展趋势进行预测和控制。时间序列预测技术源远流长,一般分为确定性时间序列方法和随机性时间序列方法。确定性时间序列预测应用很早,随机性时间序列预测则出现在上世纪二战后。时间序列分析方法是博克斯、詹金斯在一九七六年创立的,为了纪念他们我们经常称时间序列分析方法为B-J方法。时间序列分析演变到今天已经逐步发展出了单维ARMA模型和多维ARMA模型、非平稳时间序列模型以及非线性时间序列模型等等。并且被广泛应用于自然科学以及金

26、融等各个领域。3.2时间序列分析方法概述一、描述性时序分析早期的时间序列分析都是通过绘图观察进行直观的数据比较,从中寻找出序列的发展规律,我们称这种分析方法为描述性时序分析。古代埃及人通过这种分析方法发现了尼罗河泛滥的规律。而在天文、物理、海洋学等自然科学领域,这种简单的描述性时序分析也常常能发挥出意想不到的效果,使人们发现意想不到的规律。描述性时序分析方法具有操作简单、直观有效的特点,从史前直到现在一直被人们广泛使用,它通常是人们进行统计时序分析的第一步。二、统计时序分析随着研究领域的不断拓宽,人们发现单纯的描述性时序分析有很大的局限性。在金融、保险、法律、人口和心理学等社会科学研究领域,相

27、关变量的发展通常会呈现出非常强的随机性,要想仅仅通过对序列简单的观察和描述,得到随机变量的发展变化规律,并准确预测出它们将来的趋势,一般来说是非常困难的。为了准确地估计随机序列发展的变化规律,从1920开始,学术界开始使用数理统计原理分析时间序列。研究的重心从表面现象的分析转移到分析序列值内在的相关关系上,时间序列分析由此诞生。时间序列分析方法可以分为以下两类。1.频域分析方法频域分析方法也称为“频谱分析”或“谱分析”方法。早期的频域分析法,假设任何一种无趋势的时间序列都可以分解为若干种不同频率的周期波动,借助傅立叶分析从频率的角度来揭示时间序列的规律,后来又借助了傅立叶变换,用正弦、余弦项之

28、和来逼近某个函数。1960年,伯格在分析地震信号时提出了最大熵谱估计理论,该理论克服了传统分析固有的分辨率不高和频率泄漏等缺点,使谱分析进入一个新的阶段,我们称之为现代谱分析阶段。目前谱分析方法主要应用于电力工程、物理学、天文学、信息工程、海洋学和气象科学等领域,它是一种非常有用的纵向数据分析方法。但是由于谱分析过程一般都比较复杂,研究人员通常要具有很强的数学基础才能熟练使用它,同时它的分析结果也比较抽象,不易于进行直观解释,导致了谱分析方法的使用具有教大的局限性。2.时域分析方法时域分析方法主要是通过从序列自相关的角度,揭示时间序列的发展运动的规律。相对于谱分析方法,它具有理论基础知识扎实、

29、操作步骤规范、分析结果易于解释等优点。目前它已广泛应用于自然科学和社会科学的各个领域,成为时间序列分析的主流方法。本文所使用的方法就是时域分析方法。时域分析方法的基本思想是事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在一定的相关关系,而且这种相关关系具有某种统计规律性。我们分析的重点就是寻找这种规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合的模型来预测序列未来的走势。时域分析方法具有相对固定的分析套路,通常都遵循如下分析步骤:(1)考察观察值序列的特征(2)根据序列的特征选择适当的拟合模型(3)根据序列的观察数据确定模型的口径(4)检验模型,优化模型

30、(5)利用拟合好的模型来预测序列未来的发展3.3 随机时间序列分析的特性分析3.3.1 随机过程的基本概念简单的说,随机过程是一簇随机变量,他们通常与时间有关。我们熟悉单变量随机变量。例如某日上证指数的收益率,对新的一天的开始,人们不知道这一天收益率的大小,所以收益率是随机的。如果关心一段时间内,例如一个月内,每日上证指数的收益率,在这一段时间,每日的收益率都是随机结果,这一个月的收益率的变化,在数学上用随机过程来表示。定义:设T是实数集合R=(-,+)的子集,俗称足标集,对任意固定的tT,Yt是随机变量,tT的全体Yt,tT是一个随机过程,记为Yt。3.3.2 时序特性的研究工具运用B-J方

31、法研究时间序列,最重要的工具是自相关和偏自相关。一、自相关构成时间序列的每个序列值Yt,Yt-1,Yt-k之间的简单相关关系称之为自相关。自相关程度由自相关系数rk度量,表示时间序列中相隔k期的观测值之间的相关程度。 rk=t=1n-k(yt-y)(yt-k-y)t=1n(yt-y)2 (3.3.1)式中,n是样本量;k为滞后期;y代表样本数据的算数平均值。与简单相关系数一样,自相关系数rk的取值范围是-1,1,并且|rk|越接近1,自相关程度越高。二、偏自相关偏自相关是对于时间序列yt,在给定yt-1,yt-2,yt-k+1的条件下,yt与yt-k之间的条件相关关系。其相关程度用偏自相关系数

32、kk度量,有-1kk1。 kk=r1, k=1 rk-j=1k-1k-1,jrk-j1-j=1k-1k-1,jrj, k=2,3, (3.3.2)式中,rk是之后k期的自相关系数。 k,j=k-1,j-kk·k-1,k-j, j=1,2,k-1 (3.3.3)在实际应用中,应综合考察序列的自相关与偏自相关。将时间序列的自(偏自)相关系数绘制成图,并标出一定的随机区间,称之为自(偏自)相关分析图。它是对时间序列进行自(偏自)相关分析的主要工具。我们引入了自相关系数和偏自相关系数这两个统计量来识别ARMA(p,q) 模型的系数特点和模型的阶数。但是,在实际操作中,自相关系数和偏自相关系数

33、是通过要识别序列的样本数据估计出来的,并且随着抽样的不同而不同,其估计值只能同理论上的大致趋势保持一致,并不能精确的相同。因此,在实际的模型识别中,自相关系数和偏自相关系数只能作为模型识别过程中的一个参考,并不能通过它们准确的识别模型的具体形式。具体的模型形式,还要通过自相关和偏自相关系数给出的信息,经过反复的试验及检验,最终挑选出各项统计指标均符合要求的模型形式。 3.4时间序列模型简介3.4.1ARMA模型ARMA模型有三种基本类型:自回归(auto-regressive, AR)模型、移动平均(moving average, MA)模型以及自回归移动平均(auto-regressive

34、moving average, ARMA)模型。一、 自回归模型如果时间序列yt是它的前期值和随机项的线性函数,即可表示为: yt=1yt-1+2yt-2+pyt-p+ut (3.4.1)则称该时间序列yt是自回归序列,式(3.4.1)为p阶自回归模型,记为AR(p)。其中实参数1,2,p称为自回归系数,是模型的待估参数。随机项ut是相互独立的白噪声序列,且服从均值为0,方差为u2的正态分布。随机项ut与滞后变量yt-1, yt-2,yt-p不相关。为不是一般性,在式(3.4.1)中假定序列yt均值为0。若Eyt=0,则令yt'=yt-,可将yt'写成式(3.4.1)的形式。记

35、Bk为步滞后算子,即 Bkyt=yt-k则模型(3.4.1)可以表示为: yt=1Byt+2B2yt+pBpyt+ut (3.4.2)令 B=1-1B-2B2-pBp模型可以简写为: Byt=ut (3.4.3)AR(p)过程平稳的条件是滞后多项式B的根均在单位圆外,即B=0的根大于1。二、 移动平均模型如果时间序列yt是它的当期和前期的随机误差项的线性函数,即可表示为: yt=ut-1ut-1-2ut-2-qut-q (3.4.4)则称该时间序列yt是移动平均序列,式(3.4.4)为q阶移动平均模型,记为MA(q)。其中实参数1,2,q为移动平均系数,是模型的待估参数。引入滞后算子,并令 B

36、=1-1B-2B2-qBq则式(3.4.4)可简写为: yt=But (3.4.5)移动平均过程无条件平稳,但通常希望AR过程与MA过程能相互表出,即为可逆过程。三、 自回归移动平均模型如果时间序列yt是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为: yt=1yt-1+2yt-2+pyt-p+ut-1ut-1 -2ut-2-qut-q (3.4.6)则称该时间序列yt是自回归移动序列,式(3.4.6)为(p,q)阶自回归移动平均模型,记为ARMA(p,q)。其中实参数1,2,p为自回归系数,1,2,q为移动平均系数,都是模型的待估参数。显然式(3.4.1)和式(3.4.4)都是式

37、(3.4.6)的特殊情况,即对于ARMA(p,q),若阶数q=0,则是自回归模型AR(p);若阶数p=0,则成为移动平均模型MA(q)。引入滞后算子B,式(3.4.6)可简记为: Byt=But (3.4.6)ARMA(p,q)过程的平稳条件是滞后多项式B的根均在单位圆外,可逆的条件是B的根都在单位圆外。AR模型的特征是在t时刻的响应Xt仅与其以前时刻的响应有关,而与其以前时刻进入系统的扰动无关;MA模型是与以前时刻的响应无关只与以前时刻的进入系统的扰动项有关;ARMA模型不仅与以前时刻响应有关,而且与其以前时刻的进入系统的扰动项有关。总的来说,ARMA模型是AR模型和MA模型的综合体,在不能

38、应用其中一个解决问题的时候,可以选择使用ARMA模型,ARMA模型的优点是兼顾自回归和滑动平均过程,满足时间序列的依赖性。3.4.2ARIMA模型当对数据进行平稳性检验后发现数据是非平稳的,那么我们就需要对原始数据进行处理,使其变得平稳。非平稳序列图形的特点(1)不稳定在一个常数水平上,或者有明显趋势,或者虽然没有明显趋势但是并不经常回到某个常数水平上;(2)方差不是常数,并且随着时间的增加趋于无穷;(3)预测不收敛到均值;在Box和Jenkins之前处理非平稳序列的方法是从序列中提取时间t的确定性函数,认为均值是t的多项式,把提取确定趋势后的序列看作是平稳的随机序列。然后对平稳序列建立ARM

39、A模型。这样做的含义是认为趋势是确定性的,但是经济序列经常出现随机趋势。当趋势是随机的时,这种做法是错误的。对此,Box和Jenkins提出了差分转换方法。对非平稳序列差分,只要进行一次或多次差分就可以转化为平稳序列。差分的次数称为阶数,这样的序列成为其次非平稳序列。这样的序列用自回归求和滑动平均模型来描述。表示为ARIMA(p,d,q),d是差分的次数。ARIMA过程(Autoregressive Integrated Moving Average)令Wt=(1-L)dYt,Wt是一个ARMA(p,q)过程 (L)Wt=(L)t (3.4.7) 过程Yt被称为ARIMA(p,d,q),通常差

40、分次数小于等于3。可以看出当d=0时,ARIMA(p,d,q)的模型实际上就是ARMA(p,q)模型当p=0时,ARIMA(p,d,q)的模型可以简记为IMA(d,q)模型当q=0时,ARIMA(p,d,q)的模型可以简记为ARI( p,d )模型ARIMA模型的实质就是差分运算与ARMA模型的组合。由此说明任何非平稳序列,只要通过适当的阶数差分实现来达到差分平稳,就可以对差分后序列进行ARMA模型拟合了。而ARMA模型的分析方法已经很成熟了,这就意味着对差分平稳序列的分析将会非常简单可靠。3.5建立时间序列模型的一般步骤(1)收集数据,选定样本数据,做出时序图;(2)对原序列进行平稳性检验,

41、如果序列不满足平稳性条件,可以通过差分变换(阶数为d,则进行d阶差分)或者其他变换,如对数差分变换使序列满足平稳性条件;(3)通过计算能够描述序列特征的一些统计量(如自相关系数和偏自相关系数),来确定ARMA模型的阶数p和q,并在初始估计中选择尽可能少的参数;(4)进行诊断分析,检验参数的显著性,以及模型本身的合理性;(5)证实所得模型确实与所观察到的数据特征相符;(6)确定模型,并进行预测分析; 对于建模中的第4、5步,需要一些统计量和检验来分析在第3步中的模型形式选择得是否合适,所需要的统计量和检验如下:1、检验模型参数显著性水平的t统计量;2、为保证ARMA(p,q) 模型的平稳性,模型

42、的特征根的倒数皆小于1;3、模型的残差序列应当是一个白噪声序列; 第4章 实例预测本章实例预测研究的对象是上证指数。该指数较好地代表了上证市场整体的价格水平,能准确及时地反映我国股市的行情动态,具有较高的预测意义和较好的可预测性。本例分析的数据使用的是上证指数自2009年3月3日到2013年3月29日的7日的历史收盘数据,研究的目的是希望能够对其运行趋势和价格在短期内做出一个判断。数据来源于大智慧软件,数据分析工具使用的是EViews。4.1数据录入对收集到的上证指数历史数据进行预处理,由于法定节假日的原因,我们需要将数据补齐,这里采用的方式是,平均数法,将空缺日期的价格用前后两日的均价来代替

43、。然后使用EViews软件绘制出上证指数时序图。如下图4.11所示图4.1.14.2平稳性检验对序列平稳性水平进行单位根检验,采用ADF方法,选择含有截距和时间趋势,滞后0阶(由AIC和SC准则确定)。结果如图4.21所示,T统计量的P值(0.0257)小于5%显著水平,所以拒绝存在单位根的原假设,即该序列为平稳序列。Lag Length: 0 (Automatic based on SIC, MAXLAG=21)t-Statistic  Prob.*Augmented Dickey-Fuller test statistic-3.656690 0.0257Tes

44、t critical values:1% level-3.9668625% level-3.41412310% level-3.129165图4.2.14.3模型识别使用EViews得出相关图如图4.3.1所示可知:图4.3.1自相关拖尾,偏相关一阶截尾,可以用多种ARMA模型。经检验优选(先按趋势初定ARMA(1,0),然后观察模型后的残差相关图,在10阶还存在超过两倍标准差如图4.3.3,所以再选择ARMA(1,1O).然后再观察模型后的残差相关图,此时,残差为白噪声,满足条件),确定为ARMA(1,10)模型。图4.3.2经OLS回归,参数估计结果如图4.3.3:Sample (adju

45、sted): 3/31/2009 3/29/2013Included observations: 1044 after adjustmentsConvergence achieved after 6 iterationsMA Backcast: 3/17/2009 3/30/2009VariableCoefficientStd. Errort-StatisticProb.  C2609.198204.408612.764620.0000AR(1)0.9940410.003475286.01680.0000MA(10)0.1066780.0310593.4346840.000

46、6R-squared0.989712    Mean dependent var2627.093Adjusted R-squared0.989692    S.D. dependent var350.1774S.E. of regression35.55258    Akaike info criterion9.982772Sum squared resid1315809.    Schwarz criterion9.996998Log

47、 likelihood-5208.007    Hannan-Quinn criter.9.988168F-statistic50072.27    Durbin-Watson stat1.977789Prob(F-statistic)0.000000图4.3.3该模型表达式为:S = 2609.198236 + AR(1)=0.994040561985,MA(10)=0.1066783547134.4模型诊断检验1、如图4.3.3所示变量系数均通过显著性检验,模型F统计量(50072.27)较大,方程总体显著。D

48、W(1.977789)接近2,说明不存在自相关。2、模型的特征根倒数在单位圆内如图4.4.1所示,表明所建模型稳定。图4.4.13、经过LM检验,F统计量等的P值均大于5%的显著水平,所以接受不存在自相关的原假设。Breusch-Godfrey Serial Correlation LM Test:F-statistic0.086746    Prob. F(2,1039)0.9169Obs*R-squared0.174126    Prob. Chi-Square(2)0.9166图4.4.24、残差序列检验,自

49、相关和偏相关系数均在两倍标准差范围内,并且P值大于5%显著水平,即接受相关系数为零的原假设,表明残差序列已为白噪声序列(纯随机序列),模型已充分吸收了序列的信息。图4.4.34.5模型拟合实际值、拟合值、残差趋势图如图4.5.1所示图4.5.1截选2013年3月1日到2013年3月29日的实际值与拟合值,计算误差率如下所示:日期实际值拟合值误差率%2013-3-12359.512366.5950.3002692013-3-42273.42360.2243.8191062013-3-52326.312271.099-2.373352013-3-62347.182329.376-0.7585220

50、13-3-72324.292341.1760.7265032013-3-82318.612324.3950.2495022013-3-112310.592321.5280.4733972013-3-122286.612308.7490.9681812013-3-132263.972290.4941.1715612013-3-142270.282271.4440.0512542013-3-152278.42271.544-0.300912013-3-182240.022271.1091.3878972013-3-192257.432248.11-0.412862013-3-202317.372261.426-2.414132013-3-212324.242317.308-0.298262013-3-222328.282325.321-0.127092013-3-252326.722328.7870.0888482013-3-262297.672326.0421.2348042013-3-272301.262296.697-0.198282013-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论