统计预测与决策课程设计论文.doc_第1页
统计预测与决策课程设计论文.doc_第2页
统计预测与决策课程设计论文.doc_第3页
统计预测与决策课程设计论文.doc_第4页
统计预测与决策课程设计论文.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目目 录录 1 引言 1 2 预测方法介绍 2 2 1 多元回归分析法 2 2 2 ARIMA 模型的基本原理 2 2 3 灰色预测法 3 2 4 组合预测模型 3 3 模型的建立及预测 3 3 1 线性回归预测 4 3 2 建立 ARIMA 模型 5 3 2 1 平稳化处理 5 3 2 2 模型定阶 7 3 2 3 模型检验 8 3 2 4 模型预测 9 3 3 灰色预测模型 9 3 3 1 残差检验 10 3 3 2 模型修正 10 3 4 组合模型 11 4 模型精度比较及预测 12 5 结论 13 参考文献 13 附 录 14 1 1 1 引言引言 能源是人类社会赖以存在的物质条件之一 是经济发展和社会进步的重要 资源 但是现在的能源结构中大部分都是不可再生资源 能源的利用一直是一 个世界性的问题 能源是一个国家经济增长和社会发展的重要物质基础 能源 短缺曾长期制约我国经济的发展 经济的可持续发展对于合理的能源消费提出 了更高的要求随着改革的进一步深化 我国已经顺利地实现了现代化建设的前两 个目标 在向第三个迈的过程中 能源的短缺已经成为制约我国经济发展的瓶颈 我 国人口众多资源相对不足 所以有关能源消费的预测和协调显得越来越重要 21 世纪以来 我国的能源消费无论在消费速度还是消费结构上一直都是世 界能源问题的焦点 世界一次能源消费在 2007 年增长了 2 4 我国占据了全 球能源消费增长的一半 我国对煤炭 石油 天然气等能源消费全面的增长成 了世界能源消费的 一枝独秀 自 2001 年以来 国民经济进入了一个新的发 展阶段 固定资产投资迅速增加 重工业比重增大 钢铁 建材 电解铝等一 些高能耗产业迅速扩张 由此导致了能源消费量的急剧增加 甚至超过了经济 增长速度 2002 2007 年我国 GDP 增长速度分别为 7 5 8 3 9 5 9 5 10 7 和 11 4 同期一次能源消费量的增长速度分 别为 9 9 15 3 16 1 10 6 9 6 和 7 8 能源大多具备不可再生性 在良性的经济体中 经济的增长绝不能只靠能源消费的增长拉动 我国能源的 高速消耗 却有着较低的利用效率 说明能源消费从整体上讲还属于粗放型能 源利用方式 能源消费强度很高 我国经济增长尚未完全摆脱高能耗拉动依赖 与现代集约型经济发展的要求还有很大的差距 我国能源消费现状 不能不让 我们深思我国经济 能源的安全 国家能源的消耗存在如此大的问题 我们通过对近 30 年能源消耗数据的研 究与分析 运用统计理论与方法预测我国未来几年的能源消耗数量及其比例 通过预测的数据合理整合国家能源 调整能源的消耗结构 了解未来能源的远 景需求 对于保持我国社会经济健康 持续 稳定发展具有重要的理论与现实 意义 本文以我国 1978 2008 年的全国能源消耗的数据为基础 建立了回归预测 2 法 ARIMA 预测模型 灰色预测模型和基于这三种模型的组合模型 并进行了 精度比较 最后选择最优的组合预测模型对 2009 2011 年的全国能源消耗总量 进行预测 本文中全国能源消耗数据的来源为 2010 年的中国统计年鉴 2 2 预测方法介绍预测方法介绍 2 12 1 多元回归分析法多元回归分析法 研究变量间的函数关系一般使用回归分析法 回归模型为 Y f X 回归分析预测法 是在分析市场现象自变量和因变量之间相关关系的基础上 建立变量之间的回归方程 并将回归方程作为预测模型 根据自变量在预测期 的数量变化来预测因变量关系大多表现为相关关系 因此 回归分析预测法是 一种重要的预测方法 当我们在对未来发展状况和水平进行预测时 如果能将 影响预测对象的主要因素找到 并且能够取得其数量资料 就可以采用回归分 析预测法进行预测 它是一种具体的 行之有效的 实用价值很高的常用市场 预测方法 回归分析就是通过样本观测数据对模型进行估计 用最小二乘法分 析随机误差项的分布特征 估计出回归系数 再使用该模型进行预测 一个 好的估计量应满足一致性 无偏性和有效性的要求 随着回归分析中变量的增多 回归分析的计算量成倍增加 因此 多元 回归分析必须借助计算机 利用 EXCEL 等软件进行回归分析 计算残差 制作 残差图以及线性拟合图 从而根据线性图进行预测 2 22 2 ARIMAARIMA 模型的基本原理模型的基本原理 ARIMA 模型是 Box 和 Jenkins1970 年提出的以随机理论为基础的时间序列 分析方法 又称为 Box Jenkins 模型 这以模型在经济领域的预测分析中得 到了广泛的应用 时间序列是依赖时间 t 的一组随机变量 构成该时序的单个 序列值虽然具有不确定性 但对整个时间序列来说 它的变化却有一定的规律 性 可以用相应的数学模型来近似描述 ARIMA 模型有三种基本类型 自回归 模型 移动平均模型 单整自回归移动平均模型 单整是指将一个时间序列有非平稳性变为平稳性所要经过的差分的次数 这是对非平稳时间序列进行时间序列分析的必经步骤 假设一个随机过程含有 d 个单位根 其经过 d 次差分之后可以变换为一个平稳的自回归移动平均过程 3 则该随机过程称为单整自回归移动平均模型 模型中 AR 称为自回归分量 P 为 自回归分量的阶数 MA 为移动平均分量 q 为移动平均分量的阶数 I 为差分 d 为使时间序列具有平稳性所需要的差分次数 p 阶自回归过程 AR p 的一般表达式为 其中白噪声过程 1122tttptpt XXXX t q 阶的移动平均过程 MA q 可以表示为 为白噪声过程 1122ttttqt q X t ARIMA p d q 模型一般表达式为 011221122tttptptttqt q XXXX 2 32 3 灰色预测法灰色预测法 灰色预测法是一种对含有不确定因素的系统进行预测的方法 一般是利用 时间序列数据 通过建立 GM 1 1 模型进行预测 灰色预测模型的预测步骤 如下 1 首先对原始时间序列数据 做一次累加生成 得到新的序列 0 x 1 x 2 利用一次累加生成序列拟合微分方程 得到参数和 1 1 dx ax dt a 3 解微分方程得到预测模型函数 1 0 1 1 ak XkXe aa 4 将得到的序列进行一次累减得到预测序列 1 X 0 X 5 利用历史数据对数据模型进行精度检验 若通不过检验 则利用残差对原 模 型进行修正 6 通过预测方程进行预测 2 42 4 组合预测模型组合预测模型 不同的预测方法根据相同的信息 往往会提供不同的结果 如果简单的将 误差较大的一些方法舍弃掉 将会丢弃一些有用的信息 使得模型的精度不高 组合预测法是指通过建立一个组合预测模型 把多种预测方法所得到的预测结 果进行综合 由于组合模型能够较大限度地利用各种预测样本信息 所以它比 单项预测模型考虑问题更系统 更全面 因而能够有效地减少单个预测模型受 随机因素的影响 可以提高预测的精度和稳定性 4 3 3 模型的建立及预测模型的建立及预测 3 13 1 线性回归预测线性回归预测 对全国能源消耗总量 1978 年 2009 年的消耗数据进行绘图 如下图 图 1 全国能源 1978 年 2009 年的消耗总量散点图 当预测对象依时间变化呈现某种上升或下降的趋势 并且无明显的季节波 动 又能找到一条合适的函数曲线反应这种变化趋势时 就可用时间 t 为自变 量 时序数值 y 为因变量 将 1978 年的时刻定了时刻 t 1 依次累加 建立趋 势模型 三次多项式预测模型是趋势外推预测模型中的一种比较常 yf t 用的模型 为了探究时序数据变化的趋势 作出全国能源消费总量 y 的散点图 如图所示 5 全国能源消耗总量 0 50000 100000 150000 200000 250000 300000 05101520253035 系列1 由图可知全国能源消耗总量没有明显的季节波动 而且大致呈抛物线或指 数的趋势上升 但经过精度比较之后 三次多项式的拟合的最好 所以本文采 用三次多项式模型进行拟合 利用软件 EXCEL 进行回归得到结果如下表一所示 表一 三次多项式模型结果 变量系数标准差T统计量P值 常数项34209 538549 9254 0011500 0004 T10136 882277 3004 4512700 0001 T 2 646 4941163 9748 3 9426440 0005 T 318 582983 3716555 5115310 0000 其中模型的F统计量为345 9252 相伴概率为0 00 小于0 05 所以拒绝原 假设 即模型是显著的 而且各系数的显著性检验的P值都小于0 05 通过了显 著性检验 模型的调整的为0 971825 接近于1 说明模型拟合效果好 因 2 R 此 建立三次多项式模型如下 32 18 583646 49410136 8834209 53yxxx 用该模型对 2004 2011 年的全国能源消费总量进行预测得到结果如表二所示 表二 2004 2011 年全国能源消费总量三次多项式预测值 年份 20042005200620072008200920102011 真实值 203226 7224682246270265583285000 预测值 202380 4219124 89237698 4258212 3280778 2305507 6332511 9361902 6 6 相对误差 百分比 0 412 473 482 771 48 3 23 2 建立建立 ARIMAARIMA 模型模型 3 2 13 2 1 平稳化处理平稳化处理 用 ARIMA 模型拟合的时间序列必须是平稳的 如果序列不平稳 则要通过 差分或序列变换等先将序列平稳化 绘制原始序列的时序图得到图形如图三所 示 50 000 100 000 150 000 200 000 250 000 300 000 1980198519901995200020052010 Y 图三 y 时序图 由图可从直观上看出原始序列存在明显的长期递增趋势 原始序列不平稳 利用软件 EViews6 0 运用单位根检验方法对序列进行平稳性检验发现原始序 列确定不平稳 因此本文先对该序列取对数 令 然后对 y l 进行log yly 差分 差分两次之后得到平稳的序列 ylii 单位根检验结果如下表二所示 表三 单位根检验结果 ADF 值P 值 临界值 a 1 临界值 a 5 临界值 a 10 原始序列 y1 7585820 9995 3 68919 2 97185 2 62512 取对数后 yl0 6275170 988 3 68919 2 97185 2 62512 一阶差分 yli 2 958250 0529 3 72407 2 98623 2 6326 7 二阶差分 ylii 4 765430 0007 3 69987 2 97626 2 62742 由表可知 取对数后再做两次一步差分之后的序列 yliiADF 检验的 p 值为 0 0007 小于 0 05 因此拒绝序列非平稳的原假设 可以接受序列为平稳的备 择假设 在此可知 ARIMA 模型定阶为 d 2 也可由图标直观说明序列的平稳性 作出 ylii 的时序图如图四所示 08 06 04 02 00 02 04 06 08 10 1980198519901995200020052010 YLII 图四 ylii 时序图 时序图也显示 ylii 序列平稳 结果与单位根检验相符 3 2 23 2 2 模型定阶模型定阶 模型定阶的方法有多中 本文选择基于自相关函数和偏自相关函数的定阶 方法确定模型的阶数 首先 考察平稳序列 ylii 的自相关图和偏自相关的性质 为拟合模型定阶 自相关函数 ACF 和偏自相关函数 PACF 图形如图五所示 图五 8 由图形可知 对处理后的序列ylii可以选择建立ARIMA 1 2 1 ARIMA 1 2 2 ARMA 2 2 1 ARIMA 2 2 2 4种模型 分别拟合这四种模型得到结果如表四所 示 表四 4种模型拟合结果 模型变量估计系数T 统计量 伴生概 率 P 值 调整 2 R AICSC ARIMA 1 2 1 AR 1 0 37510 1 22811 0 23040 0 17179 4 13804 4 04288 MA 1 0 74524 3 23898 0 00330 ARIMA 1 2 2 AR 1 0 32632 1 53493 0 13740 0 27357 4 23696 4 09422 MA 1 0 25253 1 74264 0 09370 MA 2 0 73255 5 34026 0 00000 ARIMA 2 2 1 AR 1 0 25552 0 95215 0 35050 0 18863 4 15745 4 01347 AR 2 0 23472 1 22733 0 23160 MA 1 0 59424 2 30532 0 03010 ARIMA 2 2 2 AR 1 0 76684 5 24699 0 00000 0 28900 4 25798 4 06601 AR 2 0 59005 3 94857 0 00060 MA 1 1 24653 20 40994 0 00000 MA 2 0 92659 20 03634 0 00000 其中只有ARIMA 2 2 2 模型的各系数通过了显著性检验 而且其模型的调整 是四个模型中最大的 虽然它的AIC SC的绝对值不是最小的 ARIMA 1 2 1 模 2 R 型的AIC最小 ARIMA 2 2 1 的SC最小 但它们的系数都没有通过显著性检验 而且调整也较小 所以本文选择ARIMA 2 2 2 模型 模型表达式为 2 R 9 2 2 1 1 246530 92659 1 1 log 10 766840 59005 t BB yliiBBy BB e 3 2 33 2 3 模型检验模型检验 用ARIMA 2 2 2 模型做拟合得到残差序列 对残差序列进行自相关和偏自相 t e 关分析 得到结果如图三所示 图六 由图可知 残差序列 P 值几乎都是大于 0 05 的 说明残差序列近于白噪声 基 本没有可提取的信息了 模型已经提取了有规律的信息 说明模型拟合效果较 好 3 2 43 2 4 模型预测模型预测 利用 1978 2008 年的时间序列建立的 ARMA 2 2 2 模型 来预测 2004 2010 年的能 2 2 1 1 246530 92659 1 1 log 1 0 766840 59005 t BB yliiBBy BB 源消耗总量 结果如表五所示 表五 2004 2010 年全国能源消耗总量 ARIMA 2 2 2 模型预测值 年份2004 00 2005 00 2006 00 2007 00 2008 00 2009 00 2010 00 2011 00 实际值203226 68 224682 00 246270 00 265583 00 285000 00 预测值202971 88 233243 50 268974 47 311049 59 358189 95 413129 35 477104 00 549931 36 绝对相对误差 百分比 0 13 3 81 9 22 17 12 25 68 3 33 3 灰色模型预测灰色模型预测 根据历史数据序列 做一次累加得到生成序列 对于微分方程 0 x 1 x 10 构造数据矩阵 B 和数据向量 Y 解该微分方程 得到 1 1 dx ax dt 其中 YBA 1 1 1 1 1 1 1 2 1 2 2 3 1 2 30 31 1 2 XX XX B XX 0 0 0 2 3 31 X X Y X a A 进行矩阵运算得到发展灰数 a 0 055673 内生控制灰数 45508 908 得到预 测模型为 1 0 055673 1 874576 3817432 3 k Xke 3 3 13 3 1 残差检验残差检验 将得到的序列进行一次累减生成预测序列 将预测值与真实值比 1 X 0 X 较得到绝对误差序列为 t e 0 8516 84 7337 171 3478 379 2894 069 3479 306 4761 587 6752 0 808 6917 228 8466 436 10356 31 9561 971 6328 756 6120 155 5915 77 1 6827 269 7321 323 9152 556 9938 481 1402 44 11990 47 18629 48 22636 52 27218 27 28376 96 15499 22 1831 269 11756 32 21153 92 27 578 59 33369 39 计算相对误差后发现其中有些较大 甚至大于 10 最后五项的平均相对 误差为 7 36319507 残差检验没有通过 下面进行关联度检验 当 0 5 时 关联度大于 0 6 时就可以通过关联度检验了 由残差的绝对序列可知 0 33369 39 根据公式 0 min 0 max 计算每个序列值的关联系数 0 0 0 0 min max 1 2 0 5 max ii i ii ki 再求平均得到关联度 r 0 650237 本文取取 0 5 r 0 6 因此模型通过了关联 度检验 虽然模型通过了关联度检验 但模型没有通过残差检验 精度不够理 想 所以本文对该模型进行残差修正 3 3 23 3 2 模型修正模型修正 根据模型得到的残差序列 去掉第一项得到新的序列 然后进行累加 t e 0 e 11 得到序列 在此基础上建立相应的模型 1 e 1 1 GM 模型两边求导得到残差修正项为 1 0 1 1 e a k ee ee aa ekee uu 原预测模型加上此修正项得到修正后的预测 1 0 1 1 e a k e e e a ekaee u 模型为 其中 1 1 0 0 1 1 1 1 e akak e e e a XkXekaee aau 为修正系数 最后进行累减得到原始序列预测模型 1 2 1 0 2 k k k 根据所得数据 利用 Excel 软件 得到 0 1 1 1 1 XkXkXk e a 0 06924 2893 212 根据修正项的计算公式 可得 e u 这样经过残差修正后的模型为 1 0 06924 1 3482 92 k eke 其中 1 0 0556730 06924 1 874576 3817432 3 1 3482 92 kk Xkeke 在此序列的基础上进行累减得到 2004 2011 年的全国能源 1 2 1 0 2 k k k 消耗总量的预测值如下表六所示 表六 2004 2011 年全国能源消耗总量灰色模型预测值 年份 20042005200620072008200920102011 实际值 203226 7224682246270265583285000 预测值 201439 6212966 946225154 6238040 3251664 1266068 2281297 3297398 4 相对误差百 分比 0 875 218 5710 3711 69 3 43 4 组合模型组合模型 以上三种方法有些精度较高 有些精度较低 但由于各自理论的缺陷 会 使预测产生系统偏差 为了更充分的提取样本信息 提高预测精度 本文将以 上三种预测模型进行组合得到一个组合的预测模型 组合模型的权重有多种 可以等概率取权重 可以采用最小二乘估计法取权重 也可以使权重 12 其中为残差标准差 m 为单一模型的个数 或者使权 1 1 1 1 m ii i im i i w m i 重 其中为第 i 个单一模型误差平方和 m 为单一模型个数 1 1 1 i im i i D w D 1 i D 本文采用第三种取取权重的方法 即 利用 Excel 软件求得 1 1 1 1 m ii i im i i w m 权重分别为 0 466858 0 171932824 0 361209557 根据预测模型 1 w 2 w 3 w 对 2004 2011 年的全国能源消耗总量进行预测结果如下 112233tttt yw yw yw y 表七所示 表七 2004 2011 年全国能源消耗总量组合预测值 年份 20042005200620072008200920102011 真实值 203226 68224682246270265583285000 预测值 202142 34219328 12238544 92260010 57283571 66309765 5338872 9370931 5 相对误差 百分比 0 532 383 132 090 50 4 4 模型精度比较及预测模型精度比较及预测 对预测全国能源消耗总量的各个模型进行评价的指标体系采用平均绝对相 对误差百分比 其计算公式为 1 1 MAPE100 n ii i i YY nY 平均绝对相对误差百分比 各种方法预测结果的精度见表八 表八 四种方法预测结果的平均绝对相对误差 方法 ARIMA 2 2 2 灰色模型回归预测组合模型 平均绝对相对误 MAPE 11 19 7 34 2 12 1 73 由表可知 在三个单一的预测模型中 回归预测模型的平均绝对相对误差 最低为 2 12 预测精度最高 组合预测模型结合了单一预测模型的优势 其 13 精度大大提高 平均绝对相对误差百分比为 1 73 是四种预测模型中最低的 因此本文采用组合预测模型往后作三期预测 得到 2009 2010 年全国能源消耗 总量的预测值如表九所示 表九 2009 2010 年全国能源消耗总量预测值 年份 200920102011 预测值 309765 54338872 92370931 54 5 5 结论结论 国家能源的消耗是经济发展指标的重要指标 通过预测国家的能源消耗可 以为宏观的能源政策提供可信的依据 同时也可以通过预测未来几年的能源消 耗总量发现我国能源消耗上的问题 制定出相关的措施 使国家经济稳定健康 的增长 回归分析运用线性模型进行拟合 因此精度高 但是通过散点图拟合时也 可能找不到十分吻合的线性模型 ARIMA 预测模型由于不需要对时间序列的发 展模式作先验的假设 可通过反复识别修改 直至获得满意的模型 模型还考 察到了误差的重要性 这样有利于提高模型的精度 在灰色预测法中首先重视 的是数据的累加 其次是矩阵的计算 另外 要用用后验差检验法检验 求出 进行方差比与小误差概率的计算分析 只有达到预测精度要求的模型 01 S SCP 才能用以预测 通过对全国能源消耗总量的实例分析 发现基于回归预测预测 模型 ARIMA 预测模型和灰色模型的组合模型的精度最高 组合模型较大限度 地利用各种预测样本信息 考虑问题更系统 更全面 因此 利用组合模型对 全国能源消耗总量进行预测 为能源规划及政策的制定提供科学的依据 参考文献参考文献 1 中国国家统计局 中国统计年鉴 2009 2 徐国祥编著 统计预测与决策 上海财经大学出版社 2009 3 刘勇 汪旭辉 ARIMA 模型在我国能源消费预测中的应用 经济经纬 2007 4 徐国祥 统计预测与决策 上海 上海财经大学出版社 2008 5 赵彦云 宏观经济统计分析 北京 中国统计出版社 2003 6 国家统计局 中国统计年鉴 2010 7 何晓群 多元统计分析 M 北京 中国人民大学出版社 2009 8 徐国祥 统计预测与决策 上海 上海财经大学出版社 2010 7 14 9 王 燕 应用时间序列分析 M 北京 中国人民大学出版社 2009 附件附件 本文利用 中国统计年鉴 得到全国能源 1978 2009 消耗总量如下表一所示 全国能源消耗总量 单位 万吨标准煤 年份 能源消耗总量 万吨标 准煤 原煤原油天然气新型能源 19785714441715 1213657 42571 441200 024 19795858842534 8913943 94644 4681464 7 19806027543699 3814164 63723 31687 7 19815944743396 3113613 36713 3641723 963 19826206745060 6414151 28806 8712048 211 19836604048077 1214859858 522245 36 19847090451759 9215527 981063 562552 544 19857

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论