毕业论文——基于SAS对1995-2011年中国GDP的数据分析和预测.doc_第1页
毕业论文——基于SAS对1995-2011年中国GDP的数据分析和预测.doc_第2页
毕业论文——基于SAS对1995-2011年中国GDP的数据分析和预测.doc_第3页
毕业论文——基于SAS对1995-2011年中国GDP的数据分析和预测.doc_第4页
毕业论文——基于SAS对1995-2011年中国GDP的数据分析和预测.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于SAS对1995-2011年中国GDP的数据分析和预测摘要在经济学中,常用GDP和GNI(国民总收入,gross national Income)共同来衡量该国或地区的经济发展综合水平通用的指标。这也是目前各个国家和地区常采用的衡量手段。GDP是宏观经济中最受关注的经济统计数字,因为它被认为是衡量国民经济发展情况最重要的一个指标。一般来说,国内生产总值有三种形态,即价值形态、收入形态和产品形态。从价值形态看,它是所有常驻单位在一定时期内生产的全部货物和服务价值与同期投入的全部非固定资产货物和服务价值的差额,即所有常驻单位的增加值之和;从收入形态看,它是所有常驻单位在一定时期内直接创造的收入之和;从产品形态看,它是货物和服务最终使用减去货物和服务进口。 GDP反映的是国民经济各部门的增加值的总额。人们的一切活动,其根本目的无不在于认识和改造客观世界。时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在关系及其变化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制现象的未来行为,修正和重新设计系统以达到利用和改造客观只目的。本文基于时间序列理论,以我国1995年至2011年十七年的国内生产总值为基础,对数据进行绘图分析、模型识别、模型估计,及预测。 关键词:人均GDP 非平稳时间序列 ARIMA过程 AbstractIn economics, the common GDP and GNI (gross national income, gross national Income), to measure the country or regional economic development comprehensive level indicators. This is also the various countries and regions is often used to measure means. GDP is the most closely watched economic statistics in the macroeconomic, because it is a measure of one of the most important indicators of the development of the national economy. In general, the gross domestic product (GDP) has three forms, ie value, income, and products. Form of value, it is the production of all resident units during a given period the value of all goods and services and investment in the same period all the difference between the value of fixed assets, goods and services of the value added of all resident units; from income form, which is the direct creation of the income of all resident units during a certain period of time; the form of products, it is the final goods and services minus imports of goods and services. GDP reflects the total added value of national economic sectors.All the activities of the people, the fundamental purpose of all is to understand and transform the objective world. Time series analysis not only reveal a phenomenon from a number of developments and changes in law or from a dynamic perspective to depict the inherent relationship between the change regularity of a phenomenon and other phenomena to achieve the purpose to understand the objective world, and the use of the time series the model can predict the future behavior of the control phenomenon, revised and re-design system in order to achieve the only purpose of the use and transformation of the objective.Based on the theory of time series, the 1995-2011 seventeen years of gross domestic product (GDP) data for mapping analysis, model identification, model estimation, and forecasting.目录摘要ABSTRACT1. 引言1.1 GDP概述及研究意义1.2 本文的主要工作2. 时间序列分析基本方法2.1时间序列分析数据处理 2.1.1差分运算 2.1.2平稳性检验2.2 时间序列基本模型 2.2.1自回归模型 2.2.2 移动平均模型 2.2.3自回归移动平均模型2.3 ARMA模型建模步骤 2.3.1 绘图分析2.3.2模型识别2.3.3 模型估计2.3.4 预测3. 基于时间序列模型的GDP预测实例分析3.1 我国GDP时间序列分析3.1.1 平稳性检查3.1.2 平稳化处理3.2 时间序列模型的建立3.2.1 模型识别3.2.2 模型估计3.3 我国GDP短期预测及分析结论致谢参考文献1.1 GDP概述及研究意义 国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、政府支出和净出口额。用公式表示为:。式中:为消费、为私人投资、为政府支出、为净出口额。一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。一般而言,GDP公布的形式不外乎两种,以总额和百分比率为计算单位。当GDP的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入衰退时期了。国内生产总值是指一定时间内所生产的商品与劳务的总量乘以“货币价格”或“市价”而得到的数字,即名义国内生产总值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨胀率之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值仍然是会上升的。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实质性影响的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,还必须通过GDP缩减指数,对名义国内生产总值做出调整,从而精确地反映产出的实际变动。因此,一个季度GDP缩减指数的增加,便足以表明当季的通货膨胀状况。如果GDP缩减指数大幅度地增加,便会对经济产生负面影响,同时也是货币供给紧缩、利率上升、进而外汇汇率上升的先兆。一国的GDP大幅增长,反映出该国经济发展蓬勃,国民收入增加,消费能力也随之增强。在这种情况下,该国中央银行将有可能提高利率,紧缩货币供应,国家经济表现良好及利率的上升会增加该国货币的吸引力。反过来说,如果一国的GDP出现负增长,显示该国经济处于衰退状态,消费能力减低时,该国中央银行将可能减息以刺激经济再度增长,利率下降加上经济表现不振,该国货币的吸引力也就随之而减低了。因此,一般来说,高经济增长率会推动本国货币汇率的上涨,而低经济增长率则会造成该国货币汇率下跌。例如,1995-1999年,美国GDP的年平均增长率为4.1%,而欧元区11国中除爱尔兰较高外(9.0%),法、德、意等主要国家的GDP增长率仅为2.2%、1.5%和1.2%,大大低于美国的水平。这促使欧元自1999年1月1日启动以来,对美元汇率一路下滑,在不到两年的时间里贬值了30%。但实际上,经济增长率差异对汇率变动产生的影响是多方面的:一是一国经济增长率高,意味着收入增加,国内需求水平提高,将增加该国的进口,从而导致经常项目逆差,这样,会使本国货币汇率下跌。二是如果该国经济是以出口导向的,经济增长是为了生产更多的出口产品,则出口的增长会弥补进口的增加,减缓本国货币汇率下跌的压力。三是一国经济增长率高,意味着劳动生产率提高很快,成本降低改善本国产品的竞争地位而有利于增加出口,抑制进口,并且经济增长率高使得该国货币在外汇市场上被看好,因而该国货币汇率会有上升的趋势。国内生产总值(GDP)是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中,为评价和衡量国家经济状况、经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度,可以说,它是影响经济生活乃至社会生活的最重要的经济指标。对其进行的分析预测具有重要的理论与现实意义。本文以我国为例,利用时间序列分析方法,建立我国GDP时间序列模型,分析经济增长的内在特征。并对未来五年我国经济发展做出预测,为政府制定经济发展战略提供依据。1.2 本文的主要工作从中国统计年鉴中选取我国1995年2011年共17年的GDP作为数据,运用时间序列分析的基本的分析方法随机时序分析,进行模型识别、参数估计和模型检验,应用选定时间序列方法预测未来GDP,并讨论此时间序列类型、误差的主要来源。2 时间序列分析基本方法2.1 时间序列分析的预处理2.1.1 差分运算一阶差分 阶差分 步差分 差分方法是一种非常简便、有效的确定性信息提取方法,Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息。差分运算的实质是使用自回归的方式提取确定性信息: 差分方式的选择: 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息。2.1.2 平稳性检验平稳性是某些时间序列具有的一种统计特征。对于平稳的序列我们就可以运用已知的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法的关键步骤。平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。 对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。通常我们都选用图检验方法检验序列平稳性并用单位根统计检验法加以辅助。(1) 自相关图法自相关函数和偏自相关函数的定义:构成时间序列的每个序列值,之间的简单相关关系称为自相关。自相关程度由自相关系数度量,表示时间序列中相隔期的观测值之间的相关程度。 (2-1)其中,是样本量,为滞后期,代表样本数据的算术平均值。自相系数的取值范围是并且越小,自相关程度越高。偏自相关是指对于时间序列,在给定的条件下,与之间的条件相关关系。其相关程度用偏自相关系数度量,有。 (2-2)其中是滞后期的自相关系数。如果序列的自相关系数很快地(滞后阶数大于2或3时)趋于0,即落入随机区间,时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落在随机区间以外,即与零有显著不同,时间序列就是不平稳的。自相关图法仅从直观的判断平稳时间序列与非平稳时间序列的区别。也可用以下的方法在理论上检验。(2) 单位根检验法时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用的两种方法是DF和ADF。DF检验法是Dickey和Fuller在70年代和80年代的一系列文章中建立的。其基本思想是:一阶回归模型中,时,序列是平稳的。若,则序列是非平稳的,存在单位根,通过检验是否可能为1,判断序列是否平稳序列。DF检验的假设是。(a) DF检验序列有如下三种形式:不包含常数项和线性时间趋势项 (2-3)包含常数项 (2-4)包含常数项和线性时间趋势项 (2-5)其中,。检验假设为: 序列存在单位根的零假设下,对参数估计值进行显著性检验的t统计量不服从常规的t分布,DF(Diekey&Fuller)于1979年给出了检验用的模拟的临界值,故称检验称为DF检验。一般地,如果序列在0均值上下波动,则应该选择不包含常数和时间趋势项地检验方程,即(2-3)式;如果序列具有非0均值,但没有时间趋势,可选择(2-4)作为检验方程;序列随时间变化有上升或下降趋势,应采用(2-5)的形式。(b) ADF检验在DF检验中,对于(2-3)式,常常因为序列存在高阶滞后相关而破坏了随机扰动项是白噪声的假设,ADF检验对此做了改进。它假定序列服从AR(P)过程。检验分程为 (2-6)式中的参数视具体情况而定,一般选择能保证是白噪声的最小的值。与DF检验一样,ADF检验也可以有包含常数项和同时含有常数和线性时间趋势项两形,只需在(2-6)式右边加上或与。2.2 时间序列基本模型随机时间序列分析模型分为三种类型:自回归模型(Auto-regressive model,AR)、移动平均模型(Moving Average model,MA)和自回归移动平均模型(Auto-regressive Moving Average model,ARMA)。2.2.1 自回归模型如果一个随机过程可表达为 其中, 是自回归参数,是白噪声过程,则称为阶自回归过程,用表示。是由它的个滞后变量的加权和以及相加而成。若用滞后算子表示 其中称为特征多项式或自回归算子。与自回归模型常联系在一起的是平稳性问题。对于自回归过程,如果其特征方程:的所有根的绝对值都大于1,则是一个平稳的随机过程。 过程中最常用的是、过程,保持其平稳性的条件是特征方程根的绝对值必须大于1,满足|,也就是:。2.2.2 移动平均模型如果一个线性随机过程可用下式表达 其中是回归参数,为白噪声过程,则上式称为阶移动平均过程,记为 。之所以称“移动平均”,是因为是由个和滞后项的加权和构造而成。“移动”指的变化,“平均”指加权和。注意:(1)由定义知任何一个 阶移动平均过程都是由个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。(2)与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程的全部根的绝对值必须大于1。 2.2.3 自回归滑动平均模型由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为, 其中,别表示自回归和移动平均部分的最大阶数。的一般表达式是 即 或 其中 和 分别表示的,阶特征多项式。表2-1 模型特征模型自相关系数偏自相关系数拖尾阶截尾阶截尾拖尾拖尾拖尾2.3 ARIMA模型建模步骤2.3.1 数据平稳化处理2首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF单位根检验来精确判断该序列的平稳性。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为 模型中的阶数。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过2次。 数据平稳化处理后,模型即转化为模型。2.3.2 模型识别我们引入自相关系数和偏自相关系数这两个统计量来识别模型的系数特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。在平稳时间序列自相关函数和偏自相关函数上初步识别模型阶数和,然后利用AIC定则准确定阶。AIC准则3:最小信息准则,同时给出模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。关于模型,AIC函数定义如下:式中:平稳序列为样本数,为拟合残差平方和,为参数。 AIC准则定阶方法可写为:其中:,为模型阶数的上限值,一般取为根号或。实际应用中,一般不超过2。2.3.3 参数估计确定模型阶数后,应对模型进行参数估计。本文采用最小二乘法OLS进行参数估计,需要注意的是,模型的参数估计相对困难,应尽量避免使用高阶的移动平均模型或包含高阶移动平均项的模型。2.3.4 模型检验完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t检验完成的Q检验的零假设是即模型的误差项是一个白噪声过程。Q统计量定义为 近似服从分布,其中表示样本容量,表示用残差序列计算的自相关系数值,表示自相关系数的个数,表示模型自回归部分的最大滞后值,表示移动平均部分的最大滞后值。用残差序列计算Q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则值将很大,反之值将很小。判别规则是: 若,则接受。 若,则拒绝。其中表示检验水平。3 基于时间序列模型的GDP预测实例分析 国内生产总值(GDP)受经济基础、人口增长、资源、科技文化、环境、体制、发展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的因果模型分析和预测GDP往往比较困难。将历年的GDP 作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意义。下面以我国19952011年国内生产总值数据(见表3-1)为例,介绍用时间序列分析法对数据分析的过程,并通过其预测2009及2010两年的国内生产总值与实际的国内生产总值比较,选取最为合理的预测方法对未来5年我国GDP的做出预测。表3-1 我国19952011年国内生产总值5(单位:亿元)年份GDP年份GDP年份GDP199560793.72001109655.22007265810.3199671176.62002120332.72008314045.4199778973.02003135822.82009340902.8199884402.32004159878.32010401202.0199989677.12005184937.42011471564.0200099214.62006216314.43.1 我国GDP时间序列分析在模型中,时间序列是由一个零均值的平稳随机过程产生,即其过程的随机性质具有时间上的不变性,在图形上表现为所有样本点都在某一水平线上下随机波动。对于非平稳时间序列,需要预先对时间序列进行平稳化处理。3.1.1 平稳性检查首先我们绘制原始GDP的时间序列图, 从图3-1可以看出我国GDP具有很明显的上升趋势,可以看出原始序列显然是非平稳的。进一步进行ADF单位根检验,从图3-2可以看出,检验未能通过,表明原始GDP序列是非平稳的。为了能够对序列进行分析,要使其平稳化。故将选择两种方法:取对数法和差分法,对序列进行平稳化处理,从而进一步分析预测。 The SAS System 09:03 Wednesday, April 28, 2012 1 The ARIMA ProcedureWARNING: The value of NLAG is larger than 25% of the series length. The asymptotic approximations used for correlation based statistics and confidence intervals may be poor. Name of Variable = gdp Mean of Working Series 188511.9 Standard Deviation 122767.2 Number of Observations 17 Autocorrelations Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error 0 1.50718E10 1.00000 | |*| 0 1 1.1734E10 0.77854 | . |* | 0.242536 2 8855169442 0.58753 | . |* . | 0.360738 3 6406643387 0.42508 | . |* . | 0.413211 4 3798133567 0.25200 | . |* . | 0.438179 5 1495850985 0.09925 | . |* . | 0.446623 6 -299474142 -.01987 | . | . | 0.447918 7 -1.81483E9 -.12041 | . *| . | 0.447970 8 -3.09972E9 -.20566 | . *| . | 0.449870 9 -4.06482E9 -.26970 | . *| . | 0.455367 10 -4.74805E9 -.31503 | . *| . | 0.464668 11 -5.20787E9 -.34554 | . *| . | 0.477066 12 -5.37724E9 -.35678 |. *| .| 0.491568 . marks two standard errors The SAS System 09:03 Wednesday, April 28, 2012 2 The ARIMA Procedure Inverse Autocorrelations Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 -0.48814 | *| . | 2 0.03619 | . |* . | 3 -0.06652 | . *| . | 4 0.02588 | . |* . | 5 0.02222 | . | . | 6 -0.00402 | . | . | 7 -0.03503 | . *| . | 8 0.04969 | . |* . | Partial Autocorrelations Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 0.77854 | . |* | 2 -0.04719 | . *| . | 3 -0.04373 | .

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论