eviews 时间序列模型_第1页
eviews 时间序列模型_第2页
eviews 时间序列模型_第3页
eviews 时间序列模型_第4页
eviews 时间序列模型_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成都空气污染指数 API 的建模与预测 20085728 刘童超 目录 1 数据来源与数据预处理数据来源与数据预处理 1 1 1 数据来源数据来源 1 1 2 离群点和缺失值的检验离群点和缺失值的检验 2 2 直观分析和相关分析直观分析和相关分析 3 2 1 直观分析和特征分析直观分析和特征分析 3 2 2 相关分析相关分析 5 2 3 平稳性检验平稳性检验 6 3 liu t 序列的零均值序列的零均值处处理理 7 3 1 数据的零均值化数据的零均值化 7 3 2 零均值过程的检验零均值过程的检验 7 4 模型的识别和初步定阶模型的识别和初步定阶 8 5 5 模型的参数估计模型的参数估计 10 6 模型的检验模型的检验 10 6 1 参数参数的的显著性检显著性检验验 10 6 26 2 模型的适用性检验模型的适用性检验 11 7 7 模型的预测模型的预测 13 7 17 1 对序列对序列 liu1liu1 t t 的预测 的预测 13 7 27 2 对序列对序列 liu t liu t 的预测的预测 13 附录及参考文献附录及参考文献 14 附录附录 1 1 零均值化处理后的数据零均值化处理后的数据 14 参考文献参考文献 15 1 数据来源与数据预处理数据来源与数据预处理 1 1 数据来源数据来源 原始数据见附件 我们需要的数据见下表 表 1 1 模型所需的数据 时间 160159158157156155154153152151 API68608476718155453635 时间 150149148147146145144143142141 API5387889711399821009583 时间 140139138137136135134133132131 API787363444463116726962 时间 130129128127126125124123122121 API89856737425145564853 时间 120119118117116115114113112111 API46544534769685646596 时间 110109108107106105104103102101 API94869763996247646248 时间 100999897969594939291 API44876368556575856659 时间 90898887868584838281 API48354450605443455485 时间 80797877767574737271 API72494060608383917566 时间 70696867666564636261 API74735571815667879081 时间 60595857565554535251 API76582845528393696081 时间 50494847464544434241 API46525781766258654872 时间 40393837363534333231 API64638062646555797756 时间 30292827262524232221 API304274666264811005863 时间 20191817161514131211 API94868383634343465561 时间 10987654321 API65506159796240286592 此处一共 160 个数据 其中 1 150 用来建立模型 我们称为样本 151 160 用来检验预测值与真实值的误差 我们成为检验值 其中的时间的意义是 t 1 代表日期 2010 5 30 t 2 代表日期 2010 5 31 t 3 代表日期 2010 6 1 以此类 推 t 160 代表日期 2010 11 4 数据中的 API 为空气污染指数 我国目前采用的空气污染指数 API 分为 五个等级 API50 说明空气质量为优 相当于国家空气质量一级标小准 50 API100 表明空气质量良好 相当于达到国家质量二级标准 100 API200 表明空气质量为轻度污染 相当于国家空气质量三级标准 200300 表明空气质量极差 已严重污染 由 SPSS 分析出来的结果见表 1 2 表 1 2 描述统计量描述统计量 N 全距极小值极大值均值标准差方差 污染指数 150882811666 4118 069326 485 有效的 N 列表状态 150 由表1 2可以看出 数据个数为150个 没有缺失值 66 41 18 07 t X t S 数值与平均值的距离见图1 1 图 1 1 由图1 1可以看出 对任意时间t 都在 与之间 所以我们可以得 t 1t XX t S t S 出结论 该数据没有离群点 综上所述 需要建模的数据正常 既没有离群点 也没有缺失值 2 直观分析和相关分析直观分析和相关分析 2 1 直观分析和特征分析直观分析和特征分析 在 eviews 软件中 我们将该数据命名为 liu t 用 eviews 画出的折线图如图 2 1 图 2 1 20 40 60 80 100 120 255075100125150 LIU 由图可以看出 该数据围绕 60 上下波动 但有较明显的周期性 通过 eviews 画出的柱状统计图见图 2 2 图 2 2 0 2 4 6 8 10 12 14 5075100 Series LIU Sample 1 150 Observations 150 Mean 66 40667 Median 64 00000 Maximum 116 0000 Minimum 28 00000 Std Dev 18 06888 Skewness 0 238714 Kurtosis 2 543331 Jarque Bera 2 728022 Probability 0 255633 由以上图表可以看出 样本 liu t 的均值 66 4 中位数为 64 最大值为 t X 116 最小值为 28 样本标准差 18 69 偏度为 0 24 峰度为 2 54 由于相 t S 伴概率为 0 256 大于 0 05 所以我们接受数据服从正态分布的假设 故认为原 数据是正态分布数据 检验样本是否服从正态分布也可以用用 P P 图和 Q Q 图来检验 SPSS 做出 的 PP 图见图 2 3 图 2 3 P P 图基本是一条直线 说明它的分布对称 服从正态分布 进一步验证了 以上的结论 2 2 相关分析相关分析 在 eviews 中作出自相关系数和偏相关系数图 结果见图 2 4 图 2 4 自相关系数图和偏相关系数图两侧的虚线之心水平 0 05的置信带 称为 barlett线 意思是如果系数落在barlett线内 我们可以认为该系数等于零 由图2 4可以看出 两阶以后的自相关系数和偏相关系数基本都落在barlett 线内 所以我们可以认为该数据平稳 为了进一步说明这个问题 我们在进行 一次单位根检验以验证该数据的平稳性 2 3平稳性检验平稳性检验 在eviews中执行view Unite root test 检验结果如图2 5 图 2 5 由上图可以得知 t统计量的值时 6 95 小于显著性水平下的临界值 拒绝 原假设 也就是说序列liu t 不存在单位根 该系统是平稳的 进一步验证了2 2 的结果 也证明由图2 1推断出来的季节性是不存在的 由上图知 其中的检验式为 2 1 liu 0 4898 1 32 31 t liu t 3 liu t 序列的零均值处理序列的零均值处理 3 1数据的零均值化数据的零均值化 对于均值非零的数据 一般有两种处理方法 一是建立非中心化的ARMA 模型 将序列的均值作为一个参数估计 但是需要估计的参数要比中心化的 ARMA模型多一个 于是在这里我们采用另一种方法 用样本均值作为样本 t X 均值u的估计 即零均值处理 下面是具体过过程 新序列liu1 t liu t liu t 66 4 零均值化后的序列数据见附录1 t X 3 2零均值过程的检验零均值过程的检验 在对liu 1 序列执行命令 view Descriptive Statistics Histogram and Stats 得到柱状统计图 结果见图3 1 图 3 1 0 2 4 6 8 10 12 14 16 2502550 Series LIU1 Sample 1 150 Observations 149 Mean 0 165101 Median 2 400000 Maximum 49 60000 Minimum 38 40000 Std Dev 18 00653 Skewness 0 252086 Kurtosis 2 577625 Jarque Bera 2 685661 Probability 0 261106 因为时间序列liu 1 的均值为 0 165 标准差为18 样本均值落在0 t X t S t X 2当中 所以我们接受均值为0的原假设 表明序列liu 1 已经是一个零均值 t S 序列 4 模型的识别和初步定阶模型的识别和初步定阶 时间序列 liu1 t 的自相关系数和偏相关系数见图 4 1 图 4 1 由上图可以看到 样本的自相关系数较大 而其余的自相关系数都落在 1 barlett 线以内 而且 11 22 22 1 1 2 2 1 22 12 12 0 518 0 2024 150 2 12 0 2024 2 k N k N 4 1 当 k 1 时 自相关函数都落在该范围内 所以时间序列 liu1 t 在 1 步后是截 尾的 因此可以用 MA 1 模型进行拟合 对于偏相关系数 我们也可以看出 只有较大 其余都很小 且大于一 11 阶的样本偏相关系数几乎都满足 虽然为 22 0 1633 150 kk N 16 16 0 166 其绝对值略大于 0 1633 但由于简约性原则 我们仍然认为其偏相关系 数在一步之后截尾的 因此可以用 AR 1 来对数据拟合 根据 Box Jenkins 建模方法 一般初步设定的模型是 ARMA n n 1 即自回 归的阶数比移动平均的阶数高一阶 于是这里我们将初步模型定为 ARMA 2 1 5 5 模型的参数估计模型的参数估计 参数的估计一般有三种方法 矩估计 最小二乘估计 极大似然估计 但是 由于矩估计太简单 精度低 只实用于做初估计 而极大似然估计计算量非常 大 特别是对于 ARMA 模型 似然函数公式十分复杂 所以我们这里采用最小 二乘估计 利用 eviews 软件可以得到各个模型中的参数的最小二乘估计和剩余平方和 和 AIC 值 ARMA 2 1 模型结果如表 5 1 表 5 1 模型结构参数最小二乘估计 AIC 值剩余平方和 AR 1 1 0 5178500 070737 8 32205335167 39 AR 2 1 2 0 5839750 081347 0 1283850 081809 8 28444633182 94 MA 1 1 0 4991120 071460 8 33327035807 65 ARMA 1 1 1 1 0 3139770 143169 0 2805960 144999 8 31463534438 95 ARMA 2 1 1 2 1 0 5700790 341635 0 1216530 190799 0 0150820 351188 8 29803233182 29 由于 AIC 值和剩余平方和越小 模型越恰当 所以 从上表可以看到 选 用 AR 2 模型最恰当 6 模型的检验模型的检验 6 1 参数的显著性检验参数的显著性检验 该模型参数检验的目的是看是否有系数显著为零 在 eviews 命令窗口中输 入 ls liu1 ar 1 ar 2 便得到参数检验的结果 详细结果见图 6 1 图 6 1 由的相伴概率可以看出 我们应该接受 0 的原假设 令 0 继续用 2 2 2 AR 1 拟合数据 参数检验的结果如图 6 2 图 6 2 由相伴概率和单位根可以看到 利用 AR 1 模型对序列 liu1 t 进行拟合比 较恰当 6 26 2 模型的适用性检验模型的适用性检验 对 AR 1 进行适用性检验 残差序列的样本自相关系数如图 6 3 图 6 3 从自相关系数值可以看出 几乎所有 6 1 1 96 0 160 1 k k N 但 0 167 0 25 不满足式子 6 1 这说明序列 liu1 t 中 13 17 0 177 28 还有少量的自相关信息没有被提出出来 这也是该模型的不足 由图 6 2 所得到的系数可知 时间序列 liu1 t 的模型为 liu1 t 0 517850 liu1 t 1 6 2 t 原序列 liu t 的模型为 liu t liu1 t 66 41 6 3 7 7 模型的预测模型的预测 7 17 1 对序列对序列 liu1liu1 t t 的预测 的预测 对于 t 151 到 160 的数据 利用差分形式进行预测时间序列 liu1 t 即 liu1 t 0 517850 liu1 t 1 t 151 152 160 其预测值见表 7 1 表 7 1 t 151152153154155156157158159160 Liu1 t 6 93 3 59 1 86 0 96 0 50 0 25 0 13 0 07 0 04 0 02 7 27 2 对序列对序列 liu t liu t 的预测的预测 对原始时间序列 liu t 的预测采用公式 6 3 即 liu t liu1 t 66 41 其详细值见表 7 2 表 7 2 t151152153154155156157158159160 forecast59636565666666666666 real35364555817176846068 残差图如下 图 7 1 由残差图可见 该模型不是非常的拟合原数据 其实 这种结果其实在 8 2 进行使用性检验时就应该预料到 还有 在四步预测之后 预测数据就趋于一 个定值 这与实际情况已经矛盾了 所以该模型不能用来做长期预测 不过由 于 API 的划分是 0 50 为一级空气的标准 50 100 为二级空气的标准 所以 预测的空气质量等级并没有改变 这也是该模型的可取之处 附录及参考文献附录及参考文献 附录附录 1 1 零均值化处理后的数据零均值化处理后的数据 表 附录 1 t12345678910 liu1 t 25 6 1 4 38 4 26 4 4 412 6 7 4 5 4 16 4 1 4 t11121314151617181920 liu1 t 5 4 11 4 20 4 23 4 23 4 3 416 616 619 627 6 t21222324252627282930 liu1 t 3 4 8 433 614 6 2 4 4 4 0 47 6 24 4 36 4 t31323334353637383940 liu1 t 10 410 612 6 11 4 1 4 2 4 4 413 6 3 4 2 4 t41424344454647484950 liu1 t 5 6 18 4 1 4 8 4 4 49 614 6 9 4 14 4 20 4 t51525354555657585960 liu1 t 14 6 6 42 626 616 6 14 4 21 4 38 4 8 49 6 t61626364656667686970 liu1 t 14 623 620 60 6 10 414 64 6 11 46 67 6 t717273

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论