




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于多项式模型 GDP 趋势的预测与研究 摘要 国内生产总值 GDP 是现代国民经济核算体系的核心指标 是衡量一个 国家综合国力的重要指标 本文就 1800 年到 2010 年的生产总值 GDP 等相关 统计数据 先建立了关于 GDP 的点点对应关系图形 大致观察出点点之间的变 化趋势 之后预测出年份与 GDP 之间的关系函数为 y a exp x b 利用 matlab 软件对函数拟合求出相应的参数 从而预测了出在之后几年里的 GDP 的多少年的 GDP 总量 为了得到更好的预测结果 本文建立了指数模型 通 过计算相关函数来衡量模型的可靠性和可用性 选取该指数模型 预计中国 GDP 将继续保持增长 不过增长率缓慢下降 猜想 GDP 年增长率最后将趋于 稳定 关键词 GDP 回归预测模型 指数模型 Abstract Gross domestic product GDP is a key index of modern system of national economic accounting is an important indicator to measure a country s comprehensive national strength Our country in 1800 to 2010 gross domestic product GDP and other related statistical data first established on the GDP bit corresponding relationship graph generally observed trends between the points then predict the relation function between year and GDP as Y a exp x b Using MATLAB software to function fitting to compute the corresponding parameters can be predicted in the years GDP years of total GDP In order to predict the results better this paper established the index model Reliability and availability by calculating the correlation function to measure model The selection of the index model is expected to Chinese GDP will continue to maintain growth but growth rate slow down Guess GDP annual growth rate of the stable Keywords GDP regression model exponential model 1 引言 1 1 研究的背景及意义 国内生产总值 Gross Domestic Product 简称 GDP 是指在一定时期内 一个 季度或一年 一个国家或地区的经济中所生产出的全部最终产品和劳务的价值 常被公认为衡量国家经济状况的最佳指标 它不但可反映一个国家的经济表现 更可以反映一国的国力与财富 一般来说 国内生产总值共有四个不同的 组成部分 其中包括消费 私人投资 政府支出和净出口额 用公式表示为 GDPCAICBX 式中 CA 为消费 I 为私人投资 CB 为政府支出 X 为净出口 额 一个国家或地区的经济究竟处于增长抑或衰退阶段 从这个数字的变化便 可以观察到 一般而言 GDP 公布的形式不外乎两种 以总额和百分比率为计 算单位 当 GDP 的增长数字处于正数时 即显示该地区经济处于扩张阶段 反 之 如果处于负数 即表示该地区的经济进入衰退时期了 国内生产总值是指一定时间内所生产的商品与劳务的总量乘以 货币 价格 或 市价 而得到的数字 即名义国内生产总值 而名义国内生产总值 增长率等于实际国内生产总值增长率与通货膨胀率之和 因此 即使总产量没 有增加 仅价格水平上升 名义国内生产总值仍然是会上升的 在价格上涨的 情况下 国内生产总值的上升只是一种假象 有实质性影响的还是实际国内生 产总值变化率 所以使用国内生产总值这个指标时 还必须通过 GDP 缩减指数 对名义国内生产总值做出调整 从而精确地反映产出的实际变动 因此 一个 季度 GDP 缩减指数的增加 便足以表明当季的通货膨胀状况 如果 GDP 缩减 指数大幅度地增加 便会对经济产生负面影响 同时也是货币供给紧缩 利率 上升 进而外汇汇率上升的先兆 一国的 GDP 大幅增长 反映出该国经济发 展蓬勃 国民收入增加 消费能力也随之增强 在这种情况下 该国中央银行 将有可能提高利率 紧缩货币供应 国家经济表现良好及利率的上升会增加该 国货币的吸引力 反过来说 如果一国的 GDP 出现负增长 显示该国经济处于 衰退状态 消费能力减低时 该国中央银行将可能减息以刺激经济再度增长 利率下降加上经济表现不振 该国货币的吸引力也就随之而减低了 因此 一 般来说 高经济增长率会推动本国货币汇率的上涨 而低经济增长率则会造成 该国货币汇率下跌 例如 1995 1999 年 美国 GDP 的年平均增长率为 4 1 而欧元区 11 国中除爱尔兰较高外 9 0 法 德 意等主要国家的 GDP 增长 率仅为 2 2 1 5 和 1 2 大大低于美国的水平 这促使欧元自 1999 年 1 月 1 日启动以来 对美元汇率一路下滑 在不到两年的时间里贬值了 30 但实 际上 经济增长率差异对汇率变动产生的影响是多方面的 一是一国经济增长率高 意味着收入增加 国内需求水平提高 将增加该 国的进口 从而导致经常项目逆差 这样 会使本国货币汇率下跌 二是如果该国经济是以出口导向的 经济增长是为了生产更多的出口产品 则出口的增长会弥补进口的增加 减缓本国货币汇率下跌的压力 三是一国经济增长率高 意味着劳动生产率提高很快 成本降低改善本国 产品的竞争地位而有利于增加出口 抑制进口 并且经济增长率高使得该国货 币在外汇市场上被看好 因而该国货币汇率会有上升的趋势 国内生产总值 GDP 是指一个国家或地区所有常住单位在一定时期内生 产活动的最终成果 这个指标把国民经济全部活动的产出成果概括在一个极为 简明的统计数字之中 为评价和衡量国家经济状况 经济增长趋势及社会财富 的经济表现提供了一个最为综合的尺度 可以说 它是影响经济生活乃至社会 生活的最重要的经济指标 对其进行的分析预测具有重要的理论与现实意义 1 2 研究的趋势和发展现状 GDP 核算有三种方法 即生产法 收入法和支出法 三种方法从不同的角 度反映国民经济生产活动成果 生产法是从生产的角度衡量常住单位在核算期 内新创造价值的一种方法 即从国民经济各个部门在核算期内生产的总产品价 值中 扣除生产过程中投入的中间产品价值 得到增加值 核算公式为 增加 值 总产出 中间投入 收入法是从生产过程创造收入的角度 根据生产要素在 生产过程中应得的收入份额反映最终成果的一种核算方法 按照这种核算方法 增加值由劳动者报酬 生产税净额 固定资产折旧和营业盈余四部分相加得到 支出法是从最终使用的角度衡量核算期内产品和服务的最终去向 包括最终消 费支出 资本形成总额和货物与服务净出口三个部分 支出法核算 GDP 就是从产品的使用出发 把一年内购买的各项最终产品 的支出加总而计算出的该年内生产的最终产品的市场价值 这种方法又称最终 产品法 产品流动法 从支出法来看 国内生产总值包括一个国家 或地区 所 有常住单位在一定时期内用于最终消费 资本形成总额 以及货物和服务的净 出口总额 它反映本期生产的国内生产总值的使用及构成 1 3 本论文的主要内容 本文以我国为例 建立数学模型 分析经济增长的内在特征 并对未来五 年我国经济发展做出预测 为政府制定经济发展战略提供依据 ARIMA p d q 模型是用于非平稳时间序列的建模方法 由美国统计学家 Box 和 Jenkins 于 1970 年首次提出 时间序列分析技术经过近几十年的发展 已经成为一门相对完整并且独立的学科 它通过对过去行为的建模来分析序列 对当前的影响 而无需重复考虑影响序列的其他因素 即把影响预测目标变化 的一切因素全部都由 时间 综合起来而加以描述 2 多项式模型的建立 2 1 回归分析模型 1 2 1 1 模型简介 多项式回归模型为 1 1 N Nx bxbxbby 2 210 将数据点代入 有 1 2 ii x yin i n iniii xbxbxbby 2 210 i 0 1 n 1 2 式中是未知参数 为剩余残差项或随机扰动项 反映所有其他因素 01 b b i 对因变量的影响 i y 在运用回归方法进行预测时 要求满足一定的条件 其中最重要的是必 i 须具备如下特征 1 是一个随机变量 2 的数学期望值为零 即 i i 3 在每一个时期中 的方差为一常量 即 4 各个 0 i E i 2 i D 间相互独立 5 与自变量无关 大多数情况下 假定 i i 2 0 i N 2 1 2 一元线性回归模型建立的步骤 建立一元线性回归模型分以下步骤 1 建立理论模型 针对某一因变量 寻找适当的自变量 建立如 1 y 1 的理论模型 2 估计参数 运用普通的最小二乘法或其他方法评估参数的值 建 01 bb和 立如下的一元线性回归预测模型 i n iniii xbxbxbby 2 210 i 0 1 n 1 2 这里分别是的估计值 如果是采用最小二 01 bb和 01 b b 乘法估计的值 即时残差平方和 也称剩余平方和 01 bb和 3 进行检验 回归模型建立之后 能否用来进行实际预测 取决于它与实 际数据是否有较好的拟合度 模型的线性关系是否显著等 为此 在实际用来 测量之前 还需要对模型进行一系列评价检验 1 标准误差 标准误差是估计值与因变量值间的平均平方误差 其计算公式为 1 4 2 1 2 n ii i yy S n 它可以用来衡量拟合优度 2 判定系数 2 R 判定系数是衡量拟合优度的一个重要指标 它的取值介于 0 与 1 之间 2 R 其计算公式为 1 5 2 2 1 2 1 1 n ii i n i i yy R yy 越接近于 1 拟合程度越好 反之越差 2 R 3 相关系数 相关系数是一个用于测定因变量与自变量之间线性相关程度的指标 其计算公式为 1 6 1 22 11 n ii i nn ii ii xxyy r xxyy 相关系数 与判定系数之间存在关系式 r 2 R 2 rR 但两者的概念不同 判定系数用来衡量拟合优度 而相关系数 用来判 2 Rr 定因变量与自变量之间的线性相关程度 相关检验要利用相关系数表 步骤如下 首先计算样本相关系数 值 然后根据给定的样本容量和显著性水平查rna 相关系数表 得临界值 最后进行检验判断 a r a a rrx rrx 若则与y有显著的线性关系 若则与y的线性相关关系不显著 4 回归系数显著性检验 回归系数的显著性检验可用 检验法进行 令t 1 7 1 1 1 b b b t S 取显著性水平 则回归系数显著 此检验对常 1 aba P tttt 若 1 b 数项亦适用 5 检验F 统计量 1 8 2 1 2 1 2 n i i n ii i yy F yy n 服从分布 取显著性水平 则表明回归模型 1 2 Fn FF 若 1 n 2 显著 如果 则表明回归模型不显著 改回归模型不能用于预测 1 2 FFn 6 统计量DW 统计量是用来检验回归模型的剩余项之间是否存在自相关的一种十DW i 分有效的方法 1 9 2 1 2 2 1 n ii i n i i DW 式中 iii yy 将利用式 1 9 计算而得到的值与不同显著性水平下的值之DW DW 上限和下限进行比较 来确定是否存在自相关 值应在之间 d DW04 根据经验 统计量的值在之间时表示没有显著自相关问题 DW1 52 5 以上检验可利用统计软件包进行回归时同时完成 4 进行预测 预测可分为点预测和区间预测两类 在一元线性回归中 所 谓点预测 就是当给定时 利用样本回归方程求出相应的样本拟合值 0 xx 以此作为因变量个别值和其均值的估计 0100 xbby 0 y 0 yE 区间预测是给出一个在一定概率保证程度下的预测置信区间 进行区间预 测 首先要进行点预测 确定的值 求得的预测值 的置信度为 0 x 0 y 0 y 0 y 的预测区间的端点为 1 10 1 100 00 Scty 2 2 ARIMA 模型建模步骤 2 2 1 数据平稳化处理 2 首先要对时间序列数据进行平稳性检验 可以通过时间序列的散点图或折 线图对序列进行初步的平稳性判断 一般采用 ADF 单位根检验来精确判断该序 列的平稳性 对非平稳的时间序列 我们可以先对数据进行取对数或进行差分 处理 然后判断经处理后序列的平稳性 重复以上过程 直至成为平稳序列 此时差分的次数即为 模型中的阶数 从理论上而言 足够多 ARIMA p d qd 次的差分运算可以充分地提取序列中的非平稳确定性信息 但应当注意的是 差分运算的阶数并不是越多越好 因为差分运算是一种对信息的提取 加工过 程 每次差分都会有信息的损失 所以在实际应用中差分运算的阶数要适当 应当避免过度差分 简称过差分的现象 一般差分次数不超过 2 次 2 2 2 模型识别 在平稳时间序列自相关函数和偏自相关函数上初步识别模型阶数ARMA 和 然后利用 AIC 定则准确定阶 AIC 准则 3 最小信息准则 同时给出pq 模型阶数和参数的最佳估计 适用于样本数据较少的问题 目的是判断ARMA 预测目标的发展过程与哪一随机过程最为接近 因为只有当样本量足够大时 样本的自相关函数才非常接近母体的自相关函数 具体运用时 在规定范围内 使模型阶数从低到高 分别计算 AIC 值 最后确定使其值最小的阶数是模型的 合适阶数 关于模型 AIC 函数定义如下 ARMA p q 式中 平稳序列为样本数 为拟合残差平方和 2 log2AICnpq n 2 为参数 pq AIC 准则定阶方法可写为 其中 为模型阶 min 0 0 k l AIC p qAIC k lkMlH MNARMA 数的上限值 一般取为根号或 实际应用中 一般不超过 2 n 10npq 2 2 3 参数估计 确定模型阶数后 应对模型进行参数估计 本文采用最小二乘法ARMA OLS 进行参数估计 需要注意的是 模型的参数估计相对困难 应尽量避MA 免使用高阶的移动平均模型或包含高阶移动平均项的模型 ARMA 3 模型的建立与求解 3 1 问题 模型的建立和求解 3 1 1 评价结果的显著性分析差异分析 1 应用原理 相关系数是用两个随机变量的协方差与这两个随机变量的 方差平方根乘积的比值来反映两个随机变量之间的线性相关程度的指标 当这 个数值越接近 1 说明这样的两个变量之间的相关性越强 2 配对设计资料具有一一对应的特点 研究者关心的是变量对整体的效 应的差值而不是对某个或者某些效应的差值 如果只有很少的点没有在所求的 函数附近则不影响整体的效果 3 1 2 对置信区间的说明 区间展现的是这个参数的真实在统计学中 一个概率样本的置信区间是对 这个样本的某个总体参数的区间估计 置信值有一定概率落在测量结果的周围 的程度 置信区间给出的是被测量参数的测量值的可信程度 即前面所要求的 一定概率 这个概率被称为置信水平 3 1 3 建立函数模型 用 matlab 软件做出表格中的数据对应的散点图观察散点图 起初 GDP 增长 很慢很慢但是随着时间的延长之后经历着非常快的增加所以通过对所描绘的散 点猜想大致与这样的散点对应的函数有 y a exp x b 这样的函数关系 其中 x 为自变量年份 y 为因变量 GDP 的数值 3 1 4 求解函数 对于函数 y a exp x b 的求解过程可借助于 matlab 的编程来完成 首先 函数 y a exp x b 比较复杂可以对函数进行变换成一次函数的形式来解决 经 变换后 ln y ln a x b ln a 即化成 m a x b 的这种形式 然后利用函数 b bint r rint stats regress Y M b bint stats 来求解 在 matlab 中下面编程求解 GDP 增长率的计算公式为 以 1978 年为基年 通过计算到表一的数据 100 GDP GDP GDP 上期 上期本期 年增长率GDP 3 2 数据分析 利用 Matlab 对表一中的数据进行处理 得到图 1 与图 2 19751980198519901995200020052010 0 0 5 1 1 5 2 2 5 3 3 5x 10 5 亿 1 GDP亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 GDP 亿 亿 1979 1982 1985 1988 1991 1994 1997 2000 2003 2006 5 10 15 20 25 30 35 40 亿 2 GDP亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 亿 GDP亿 亿 亿 亿 观察图 1 可得 自 1978 年开始中国的 GDP 一直保存增长状态 通过图二 从 GDP 的年增长率来看 GDP 年增长率的变化真是太快了 GDP 年增 长率在 1980 年到 1981 年处于下降 1981 年到 1985 年保持上升 经过 1986 年 的下降 接下来两年又保持上升状态 然后又是两年下降 随后到 1994 年一直 增长达到最大值 接着连续 5 年下降 于 1999 年达到谷底 最后一直到 2008 年 GDP 年增长率起起伏伏 但变化非常小 总体上保持增长状态 表一 1978 2008 年的 GDP 概况 年份 GDP GDP 年增长率年份 GDP GDP 年增 长率 19783624 1 0 0 199448198 0 36 4 19794038 2 11 4 199560794 0 26 1 19804517 8 11 9 199671176 6 17 1 19814862 4 7 6 199778973 0 11 0 19825294 7 8 9 199884402 3 6 9 19835934 5 12 1 199989677 1 6 2 19847171 9 20 9 200099214 6 10 6 19858964 4 25 0 2001109655 2 10 5 198610202 2 13 8 2002120332 7 9 7 198711962 5 17 3 2003135822 8 12 9 198814928 3 24 8 2004159878 3 17 7 198916909 2 13 3 2005183217 4 14 6 199018547 9 9 7 2006211923 5 15 7 199121617 8 16 6 2007257305 6 21 4 199226638 1 23 2 2008314045 0 22 1 199335334 0 32 6 4 模型求解与分析 4 1 回归分析模型的模型求解 从图 1 中我们大致可以确定该图与幂函数多项式的图象较为相近 所以我 们建立了多项式模型 运用 matlab 计算可以得到结果 根据多项式模型的检验方法 二次 三次及四次多项式大部分指标差别不 大 拟合效果比较差 从五次到七次多项式拟合效果越来越好 到八次多项式 F 值突然减小 造成拟合效果下降 于是本文选择了七次多项式来拟合 利用 matlab 统计工具求解 得到回归系数估计值及置信区间 置信水平 0 05 见表 2 于是得到回归方程 432 95 8665x1124 7878x6564 1066xx16126 75083967 15706 y 其中 x 表示具体年度减去 1977 765 0 0007x0 0880 x4 1564x 绘图如图 3 表 2 模型计算结果 参数参数估计值参数置信区间 0 15706 3967 388 8805 31023 9129 1 16126 7508 31514 2175 739 2841 2 6564 1066 1431 6056 11696 6077 3 1124 7878 1914 9731 334 6024 4 95 8665 32 2050 159 5281 5 4 1564 6 9269 1 3860 6 0 0880 0 02631 0 1496 7 0 0007 0 0013 0 0002 05101520253035 0 0 5 1 1 5 2 2 5 3 3 5 x 10 5 亿 3 GDP亿 亿 亿 亿 亿 亿 亿 亿 亿 GDP亿 亿 亿 亿 亿 亿 亿 亿 由图 3 我们可以进一步确定拟合效果非常好 根据所求得的函数关系式 我们对未来 10 年对相关书籍的产量进行了预测 预测结果见表 3 所示 表 3 GDP 预测值 年度GDP 预测值年度GDP 预测值 2009851262907 1007 20142034266360 6777 20101023896987 2565 20152387256851 8095 20111224770444 2175 20162789855917 6535 20121457461011 2787 20173247481667 7247 20131725874960 0751 20183765982116 2781 4 2 ARIMA 模型求解 通过计算自相关函数和偏相关函数 确定取 2 利用 AIC 准则对表五定d 阶 取 ARIMA 1 2 2 模型 计算得 表 4 年度预测值年度预测值 2009 374405 847 7 2014 693984
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东佛山市高明区明城镇社区卫生服务中心招聘合同制专业技术人员2人告笔试参考题库附答案解析
- (2025年标准)家长义工协议书
- 2025年神经内科帕金森病辅助检查与治疗措施模拟试卷答案及解析
- 城市轨道交通扩建经济技术指标合理性分析及控制造价措施
- 建筑工地文明施工及文物保护措施
- 人力资源信用评价预控措施
- 智慧城市建设施工协调配合措施
- 供电网络建设安全文明施工及环境保护措施
- 土地勘测定界合同协议书范文与技术要求
- 印刷行业质量保证措施优化
- 2025四川省公安厅招聘辅警(448人)笔试参考题库附答案解析
- 2025秋苏教版(2024)小学科学二年级上册(全册)课时练习及答案(附目录)
- 巡察整改工作课件模板
- 2025年城镇燃气条例竞赛题库
- GB/T 22030-2025车用乙醇汽油调合组分油
- 肺癌的护理新进展
- 2025年煤炭矿山职业技能鉴定考试-综采考试历年参考题库含答案解析(5套100道单选题合辑)
- 供电公司保密培训课件
- 车务段安全培训课件
- DB42T 1891-2022 人防工程防护及防化通风设备安装标准
- 2025发展对象考试题及答案
评论
0/150
提交评论