【毕业学位论文】(Word原稿)基于SARIMA和二次曲线模型增值税预测分析-统计教育学_第1页
【毕业学位论文】(Word原稿)基于SARIMA和二次曲线模型增值税预测分析-统计教育学_第2页
【毕业学位论文】(Word原稿)基于SARIMA和二次曲线模型增值税预测分析-统计教育学_第3页
【毕业学位论文】(Word原稿)基于SARIMA和二次曲线模型增值税预测分析-统计教育学_第4页
【毕业学位论文】(Word原稿)基于SARIMA和二次曲线模型增值税预测分析-统计教育学_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 基于 江西财经大学 摘要: 增值税税收与一个国家的 密切的关系,可以通过分析增值税的税收情况来反映经济的运行情况。未来更好的把握税收的收入情况,及时掌握国民经济的走势 ,有必要建立一个有效的预测模型来对税收进行预测,及时为决策者提供可靠及时的数据。在增值税的数据中即包含有随机波动的影响因素,有含有与时间相关的长期趋势 ,通过两个模型从不同的方面对税收数据进行拟合,最后综合两个模型的预测优势,做出最优的预测。 关键字: 次曲线 增值税 预测 a s AT to of of to of it is to an to on in In of is of a of 2 1、 前言: 如何对未来税收进行合理预测 ,这是制定未来税收任务应该首先解决的问题。以往对一个地区税收预测主要是通过对重点税源调查 ,将数据进行整理汇总 ,来推测出一个地区税收的总收入 ,这种处理方法工作量大而且缺乏对纳税整体的把握 ,当一个地区税源比较复杂重点税源企业税收不能占绝对优势时 ,汇总预测精度往往不够高。而现有很多政策还受计划体制响 ,税收任务的制定很多时候都是行政式的 ,不能合理反映事物发展的趋势。 一个地区经济发展过程从较长时间看 ,在市场机制的作用下呈现比较明显的趋势 ,这为预测提供了依据 ;从短期看 ,由于受 到宏观政策、市场即期需求变化等不确定因素影响 ,表现出一定的波动 ,这对预测造成了困难。目前预测经济运行一般采取的是时间序列方法 ,比较经典的有灰色理论、 多项式 曲线、 型等 ,这些模型对经济长期趋势一般把握比较准。在东部个别沿海发达城市已经将时间序列分析方法用作对经济发展指标的预测 ,并取得了很好的效果。当然在实际应用中选取何种时间序列模型要根据数据本身的特点作出具体分析。 2、 模型简介: 型全称为 自回归移动平均模型 (记 是由 博克思 ( 詹金斯 ( 70年代初提出的一著名 时间序列预测方法 ,所以又称为 型、博克思 其中 p, d, q) 称为差分自回归移动平均模型,自回归 , p 为自回归项 ; 移动平均, q 为移动平均项数, d 为时间序列成为平稳时所做的差分次数。 型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的 数学模型 来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、 计量经济模型 在某种程度上已经能够帮助企业对未来进行预测。 将预测指标随 时间推移而形成的数据序列看作是一个随机序列,这组随机变量 所具有的依存关系体现着原始数据在时间上的延续性。一方面,影 响 因 素 的 影 响 , 另 一 方 面 , 又 有 自 身 变 动 规 律 。 型( 是研究时间序列的重要方法,由自回归模型(简称 型)与滑动平均模型(简称 型)为基础 “ 混合 ” 构成。 3 型分为以 下三种: 如果时间序列 11 .独立同分布的随机变量序列,且满足: 02 以及 E(t) = 0 则称时间序列为p 阶的自回归模型。 自回归模型的平稳条件: 滞后算子多 项式 .)(1)( 1 的根均在单位圆外,即 (B) = 0 的根大于 1。 如果时间序列 .则称时间序列为 从 p 阶移动平均模型; 移动平均模型平稳条件:任何条件下都平稳。 如果时间序列 . . . . . . . . 1111则称时间序列为p,q)阶自回归滑动平均混合模型。或者记为 (B)(B)t二次 曲线模型是趋势外推法的一种,对于大量社会经济现象的发展主要是渐进型的,其发展相对于世界具有一定的规律性。因此,当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可以用时 间 t 为自变量,时序数值 y 为因变量,建立模型: y=f(t) 当有理由相信这种趋势能够延续到未来时,赋予变量 t 所需要的值,就可以得到相应时刻时间序列未来值,这就是趋势外推法。它的主要优点是可以揭示事物未来的发展,并定量地估计其功能特性。 当 y=f(t)是一个以 t 的二次方为最高次幂的时候,这个多项式模型就是二次曲线模型。 4 3、 模型的建立 1) 序列分析 图一 原始序列时序图 从数据的时序图可以明显的看到序列是存在明显的长期趋势 ,对于有长期趋势的数据,对其进行差分就可以化非平稳序列为平稳序列 ,这样就可以进 行型分析。 同时,我们根据常识和现实的数据的波动情况可以知道该序列中还含有季节 因素的信息。 差分之后, 先 对差分后的序列进行 平稳性, 白噪声检验 ,然后再做进一步分析。 5 图二 一阶差分序列时序图 从图二中,我们直观看到一阶差分的时序图是平稳性的,为了进一步确认差分后的序列平稳,对其做单位根检验。 一阶差分后的数据,虽然是平稳的,但是,我们知道该序列中是蕴含有季节影响因素的,我们为了跟好的做出模型,可以 再差分后的序列上进行 12 阶差分,以提取季节信息。 图三 一阶差分后序列 单位根检验结果 从 图三的 位根检验结果可以看到,概率 P 值( 小于给定的显著性水平 以拒绝存在单位根的原假设,即认为序列 平稳的。 6 图四 白噪声检验结果 看 一阶差分的 Q 统计量 的 P 值, 小于 拒绝 1 阶差分后的 Y 序列是 白噪声 序列 ,即认为 对该序列进行进一步的分析是有意义的。 2) 模型的识别 1、 型 做出数据的自相关图和偏 自 相关图,如图五所示,通过分析及经验可以认为该数据自相关 系数拖尾,偏自相关 系数 12 阶截尾,根据一般情况处理,这符合AM(p)模型的特征,并且 系数 p 可以取为 12。这里我们取得是 12 阶,这很可能与数据具有周期性有关系, 可能还蕴含有周期波动的信息, 我们 再建立一个把季节因素考虑进模型的 型 。 7 图五 自相关系数和偏自相关系数 2、 基于时间因素长期趋势的回归模型 我们从时序图明显的看到 该序列与时间具有与时间关系的线性关系,因此,可以通过建立 曲线 线性回归模型来对该列数据的长期趋势进行拟合,并作出预测。 通过 对比一次,二次和三次模型的 R 方和拟合残差, 选择 R 方较大的和残差相对较小的模 型是相对最优的。通过表一比较, 由于 一 次 模型 的 R 方是较次的小, 同时该模型的拟合残差又是较大的,所以首先就把这个模型排除掉 。接下来比较二次和三次模型的 的拟合 效果 , 这两个模型的 R 方和拟合残差比较接近 ,不是很好比较得出结论,但是我们从后面的分析可以知道,三次模型中的参数估计有一个是不显著的,没有通过 T 检验 。 所以综合得出, 二 次模型是相对较好 8 的模型。 表一 一次模型 二次模型 三次模型 R 方 125494 1596123 1528494 3) 模型 参数的估计 1、 型 通过模型的识别,我们选定了 2)模型,下一步就是利用序列的观察只确定该模型的口径,即估计模型中未知参数的值。 图六 模型参数估计结果 从图六的参数估计结果可以看到, 该模型的 R 方是 较大,说明该模型的拟合效果还好。 该模型 中延迟 2、 4 、 6、 7、 8、 和 11 阶的系数都是 没有通过检验,即认为该模型中,这些延迟阶数前得系数是 不显著的。 因此,我们剔除这些,建立疏系数模型。 9 图 七 疏系数模型建立的参数估计结果 这个建立的是 建立的疏系数模型 ,3,5,10,12),这里的 别为 前面把全系数模型的 小,说明这个模型更优 ,也就是说 ,在剔除了延迟 2、 4 、 6、 7、 8、 和 11 阶后建立的疏系数模型比全系数模型具有更好的拟合效果。 同时,我们看到这两个模型之间的 并且疏系数模型的 R 方是较大的,符合要求。 运用疏系数模型得出的 最后的拟合结果 方程 是: )1( 上面建立的疏系数模型 ,3,5,10,12) 具有良好的模型解释能 力,我们可以通过该模型来拟合这些数据的特征,也可以通过该模型来预测下几期数据。 在模型 拟合 之后,通过分析模型残差图,可以看到,该残差并不是白噪声序列,同时通过对该序列进行白噪声检验 ,也可以知道该序列是非白噪声序列,也就是说,我们通过上面的这个模型所提取的信息还不是很充分的。这也就是说,虽然上面的疏系数模型能够很好的拟合该列数据,但是,对原始序列信息的提取还不是很充分。因此,需要对该模型进行改进。 10 图八 疏系数模型 ,3,5,10,12)拟合残差图 2、 型 由于前面的建立的疏系数模 型 ,3,5,10,12)是一个没有考虑到季节影响因素的模型, 但是我们通过前面对数据的分析可以知道,该列数据时包含有季节影响因素的信息。为了信息的提取充 分,我们把季节因素提取出来在做进一步分析。对差分后的序列在做一次 12 阶差分,之后再次拟合 型。 我们建立简单季节模型,简单季节模型实际上就是趋势差分,季节差分之后序列即可转化为平稳,再对差分后的平稳序列进行拟合,它的模型结果通常如下: )( )(d 其中 D 为周期步长, d 为 提取趋势信息所用的差分阶数。 11 图九 剔除季节和长期趋势的序列 自相关图和偏自相关图 通过分析,这个序列的偏自相关系数 8 阶截尾,自相关系数拖尾,我们可以对 列做 )模型的拟合。 对该序列进行 拟合模型的参数的估计结果如图十, 该模型中的 R 方较大,同时,各个参数的 T 检验都通过了, 我们可以得出使用这个模型得出的拟合方程如下: 876543212 )(1( t 从结果中,我们也可以看到,该模型拟合的效果是非常好的,因此用该模型对数据进行拟合是很好的解释效果的。 12 图十 型拟合参数检验结果 这个模 型是对 型的改进,虽然这两个模型对于数据的拟合效果是非常好的,但是由于, 型没有把季节的影响因素考虑进模型,没有充分体现出数据的信息,因此才有了, 型的建立,那么这个模型对于所有的信息提取就更加的充分了,这可以从这个模型的残差图中看出来。如图十一中是 型的拟合残差图,我们对其进行白噪声检验,结果表明这个残差序列是一个白噪声序列,也就是说这个模型对于数据所包含的信息提取的很充分。同时这个模型对于数据的拟合效果也是很好的。因此,我们最终选择型来描述这个税收 数据序列 是比较可靠和具有很好的解释能力的。 这就是基于 型建立起来的时间序列模型,该模型的表达式为: 876543212 )(1( t 13 图十一 季节 型的残差序列图 2、长期趋势回归模型的建立 二次 回归模型参数 估计结果如图 十二,这个模型的拟合效果的 R 方是 有较好的拟合效果,同时模型的各个拟合参数也都通过了检验,即认为这个模型能够很好的对这组税收数据进行解释说明,同时做出预测。 图 十二 二次模型拟合结果 通过回归的拟合,我们可以得出该组税收数据 的长期回归曲线方程为: Y = + 2 可以通过这个回归方程来进行趋势往外推的预测。 14 4) 模型的预测 1、通过 型的预测结果如下: 通过 型做出的预测如下: 图十三 型下 预测 同时也还可以得到 列的具体的预测值: 表二 时间 128 129 130 131 132 133 134 135 预测值值 间 136 137 138 139 140 141 142 143 预测值值 间 144 145 146 147 148 149 预测值值 21957 通过 预测序列 就可以得出 y 序列的预测值: 表三 138 49 60 71 82 93 04 15 26 37 48 59 、 二次长期趋势预测 结果如表三所示, 138 就是 2011 年 6 月份的预测值,140 就是 2011 年 7 月份的预测值,一以此类推,可以得到这一年内的所有的预- 8 0 0 , 0 0 0- 6 0 0 , 0 0 0- 4 0 0 , 0 0 0- 2 0 0 , 0 0 002 0 0 , 0 0 04 0 0 , 0 0 06 0 0 , 0 0 08 0 0 , 0 0 025 50 75 100 125Y S F 2 S . E .F o r e c a s t : Y S FA c t u a l : Y SF o r e c a s t s a m p l e : 1 1 3 7A d j u s t e d s a m p l e : 2 2 1 3 7I n c l u d e d o b s e r v a t i o n s : 1 1 6R o o t M e a n S q u a r e d E r r o r 2 2 3 5 0 8 . 5M e a n A b s o l u t e E r r o r 1 5 4 8 0 0 . 5M e a n A b s . P e r c e n t E r r o r 1 9 2 . 9 8 4 8T h e i l I n e q u a li t y C o e f f i c i e n t 0 . 7 3 4 5 2 2B i a s P r o p o r t io n 0 . 0 0 0 0 0 7V a r ia n c e P r o p o r t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论