税收收入预测模型-计量经济学作业_第1页
税收收入预测模型-计量经济学作业_第2页
税收收入预测模型-计量经济学作业_第3页
税收收入预测模型-计量经济学作业_第4页
税收收入预测模型-计量经济学作业_第5页
已阅读5页,还剩7页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-PAGE1-计量经济学大作业税收收入预测模型选题背景:数据挖掘是涉及数据库、统计学等学科的一门相当活跃的研究领域,是从数据集中识别出有效的、新颖的、潜在有效的以及最终可理解的模式的非平凡过程。预测是数据挖掘技术中重要的组成部分。税收收入预测一直是税务部门的一项重要工作,它决定着税收计划的制定,而税收计划的制定是经济活动的一项重要内容。针对目前税收计划的制定仍以基数加预计增长率这一方式进行的现状,要求尽快建立起一套以税收收入预测为基础的科学预测的体系,从而掌握组织收入的主动性。因此利用统计学及数据挖掘的方法科学正确的进行税收预测工作对于税务部门具有非常重要的意义。本文对数据挖掘的相关概念、过程,统计学的相关知识进行了介绍,将数据挖掘应用于税收预测中,通过对大量历史数据的记录和与之相关的各种数据的分析,使用回归和滚动预测方法建立预测模型,对税收收入情况进行了预测,实现了对2005年度税收收入预测。并对各预测模型进行了实验结果的对比分析,指出滚动预测方法较回归预测方法能更好地进行税收收入分月预测,从而更好地指导税收计划的完成,为科学地建立税收计划进行了有效地探索,并为税收计划工作提供了重要的科学依据。本文的主要工作是对郑州市国税局征管系统中的征收数据进行挖掘分析,建立回归和滚动预测模型。通过对税收收入问题的研究与实现,从中探索了一些可行的方法,这为税收预测问题提出了一个新的视角。本课题的成果对于税收收入预测体系,特别是基于回归预测和滚动预测的方法具有一定的参考价值。税收收入预测是指在一定的经济理论指导下,根据经济和税收统计资料,在定性分析的基础上,运用定量方法,对未来税收收入总量和结构等发展趋势所做出的分析、判断和推测。税收收入预测对税收工作有着重要的作用,不仅可以为领导制订计划提供数理依据,同时也有助于加强组织收入工作,有助于税务工作者根据经济的变化及时调整相应的政策。1税收预测工作为税收决策提供科学依据在税收管理中,经常要做出各种决策。要做到决策科学正确,其前提应是在对客观经济税源的调查研究基础上做出科学的预测。科学的税收预测体现了税收经济规律、税收征管工作和税收发展趋势,为税收决策提供真实、准确、详实的一手材料。没有科学的预测做依据,做出的决策必然难以避免盲目与臆测的成分。2税收预测工作为制订税收计划提供依据制定税收计划不仅要掌握和分析实际税源资料,而且应掌握和分析未来经济税源的发展变化趋势。对未来经济税源的发展变化有了科学的预测,制订出的税收计划就有了切实可靠的依据,就可以把税收计划建立在既科学又稳妥的基础之上。3税收预测工作是实现税收任务的保证在税收计划执行过程中,为了掌握计划执行情况,分析计划能否完成或超额完成,要利用科学的预测方法对税收计划执行的可能结果进行预先推测,以便提前作好准备,及时采取措施,保证税收任务目标的全面实现。4税收预测工作是税源管理的起点和终点税源管理包括税收预测、计划编制、分配落实、税收分析四个环节和税源监控的基本保证,它们之间相互联系、相互作用,构成一个有机的整体。税源监控是税收计划管理的基础和保证,税源监控产生的数据是税收预测的源泉,税收预测是计划编制的前提,计划编制是分配落实的关键,税收分析是分配落实结果的反映。税收预测工作是税源管理的起点和终点。抓住了税收预测工作,就抓住了税源管理的龙头,从而可以有效带动征管工作质量的提高。税收是国家财政收入的主要来源,也是宏观调控的重要手段。为完善现行的靠经验预测来年税收收入的传统做法,需要引入现代计量经济方法;以使税收收入预测建立在更加科学的基础上,从而为制定税收计划和国家预算提供科学的依据。从1994年税制改革以来,全国税收每年以千亿元的速度递增。国民经济稳定发展和企业效益好转是全年税收增长的最重要因素。改革开放以来,我国在1984年和1994年先后进行了两次税制改革。因新税制的影响是连续的,故我们采用两个阶跃函数型干预变量分析税制改革对税收收入的影响。从税总的税收统计资料可以看出,2005年与去年同期相比,全年国内增值税完成10792.11亿元,增长19.7%,增收1775亿元;企业所得税完成5343.92亿元,增长35.04%,增收1386.59亿元;海关代征进口税收1633.81亿元,增长8.8%,增收131.91亿元。全年合计增收4612.86亿元。全年各月份、各地区收入增幅差距缩小,收入均衡性增强。在12个月份中月份收入增幅均在20%左右,同时,全国大部分地区收入增幅较高。全国的财政收入、物价水平以及国内生产总值对税收产生一定影响。下面着重分析该问题。样本数据选取关税收入(TX)单位:亿美元;财政收入(CZSR)单位:亿元国内生产总值(GDP)单位:亿元全国物价水平(CPI)单位:%以上数据均摘自《中国统计年鉴》2004年版样本数据列于表一:表一:税收收入预测模型数据年份税收收入TX(亿美元)财政收入CZSR(亿元)全国物价水平CPI(亿元)国内生产水平GDP(亿元)19945126.885218.10124.148197.919956038.046242.20117.160793.719966909.827407.99108.371176.619978234.048651.14102.878973.019989262.809875.9599.284402.3199910682.5811444.0898.689677.1200012581.5113395.23100.4109655.2200115301.3816386.04100.7120332.7200217636.4518903.6499.2135822.8200320017.3121715.25100.2159878.3200424165.6826396.47102.5183084.8200528778.5431649.29105.6109655.2选择变量和模型关系形式:本模型研究的是税收收入与财政收入、全国物价水平、国内生产总值之间的关系。其中税收收入为被解释变量,财政收入、全国物价水平、国内生产总值水平为解释变量。样本为数据期间为1994年到2003年。散点图如下:005000100001500020000250000500010000150002000025000TXCZSR901001101201300500010000150002000025000TXCPI0500001000001500000500010000150002000025000TXGDP经过散点图观察,税收收入(TX)与财政收入(CZSR)呈线性关系:TX~CZSR,税收收入与全国物价水平(CPI)呈二次关系:TX~CPI2,税收收入与国内生产总值呈三次关系:TX~GDP3。因此建立理论模型如下:TX=β0+β1CZSR+β2CPI2+β3GDP3+μ1t=1980,1981,……2001,2002,2003.参数估计:对于理论模型运用OLS进行参数估计结果如下:表(1)DependentVariable:TXMethod:LeastSquaresDate:06/05/07Sample:19942005Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.CZSR0.9506640.02716334.997970.0000CPI^(2)0.0784740.0198453.9543290.0008GDP^(3)-7.86E-143.86E-13-0.2036570.8407C-915.5302210.4654-4.3500270.0003R-squared0.999549Meandependentvar5921.509AdjustedR-squared0.999481S.D.dependentvar5661.257S.E.ofregression128.9503Akaikeinfocriterion12.70774Sumsquaredresid332563.8Schwarzcriterion12.90409Loglikelihood-148.4929F-statistic14770.37Durbin-Watsonstat0.849719Prob(F-statistic)0.000000参数估计方程如下:=-915.5301735+0.9506638428CZSR+0.07847442432CPI2-7.86×10-14GDP3(-4.350027)(34.99797)(3.954329)(-0.203657)经济意义检验:从经济意义上考虑,1、2>0,表明全国物价水平、财政收入与税收收入成正比关系,对于0<0来说,这说明当物价水平、财政收入、国内生产水平为零时是不会有税收收入的,相反,还会有更多的支出,这是符合实际情况的。1997年全国实际财政收入8

651.14亿元,其中税收收入8234.04亿元①。利用ARIMA模型和状态空间模型预测1997年税收收入分别为8200亿元和7976.84亿元,税收收入的相对预测误差分别为0.41%和3.12%。按1994年的税收政策,利用税收政策对税收收入的干预模型预测1997年税收收入为8263.53亿元,相对预测误差为0.36%。比较预测误差的大小。统计检验:(拟合优度、F检验、t检验)由以上数据可知:R2=0.999549DW=0.849719F=14770.37R2很接近于1,所以该模型的拟合效果很好。从统计角度看,以,n=24,k=3,查t分布表及F分布表,得到临界值t0.025(20)=2.086F0..05(3,20)=3.10由数据可知:t统计量和F统计量均大于临界值。但对于,n=24,k=3,dL=1.08,dU=1.66因为0<DW=0.849719<dL=1.08,所以回归模型残差项存在正自相关。六、计量经济学检验:(序列相关检验、异方差检验、多重共线性检验)对(1)表中的数据进行B—G检验得到以下数据:Breusch-GodfreySerialCorrelationLMTest:F-statistic1.823697Probability0.190021Obs*R-squared4.043788Probability0.132404TestEquation:DependentVariable:RESIDMethod:LeastSquaresDate:06/05VariableCoefficientStd.Errort-StatisticProb.CZSR-0.0082900.029159-0.2843140.7794CPI^(2)0.0014440.0191440.0754290.9407GDP^(3)1.32E-134.16E-130.3162390.7555C2.365047202.75210.0116650.9908RESID(-1)0.4624270.2441331.8941600.0744RESID(-2)-0.1974420.254668-0.7752930.4482R-squared0.168491Meandependentvar-8.34E-13AdjustedR-squared-0.062484S.D.dependentvar120.2468S.E.ofregression123.9466Akaikeinfocriterion12.68990Sumsquaredresid276529.7Schwarzcriterion12.98441Loglikelihood-146.2788F-statistic0.729479Durbin-Watsonstat1.456016Prob(F-statistic)0.610497(1)、由以上数据可知,该模型不存在序列相关。(2)、异方差检验:模拟值得差为,运用戈里瑟检验法建立方程如下:②用OLS法估计结果如下:③()()()()=0.000000F=0.575145很显然,变量都不显著;F检验值小于临界值,说明线性关系不显著;拟和优度较差。从而表明模型不存在异方差。(3)、多重共线性检验:通过判定系数法检验结果如下:DependentVariable:CZSRMethod:LeastSquaresDate:06/05Sample:19942005Includedobservations:24VariableCoefficientStd.Errort-StatisticProb.CPI^(2)0.2813770.1471281.9124590.0696GDP^(3)1.40E-115.25E-1326.697450.0000C-611.61071685.503-0.3628650.7203R-squared0.972938Meandependentvar6303.591AdjustedR-squared0.970361S.D.dependentvar6017.208S.E.ofregression1035.926Akaikeinfocriterion16.84045Sumsquaredresid22535993Schwarzcriterion16.98770Loglikelihood-199.0854F-statistic377.4989Durbin-Watsonstat0.724592Prob(F-statistic)0.000000CZSR=-611.6106756+0.2813771833CPI2+1.400855233×10-11GDP3④(-0.362865)(1.912459)(26.69745)R2=0.972938F=377.4989DW=很显然,R2基本通过拟合,且F值远大于临界值,说明存在多重共线性。由于CZSR是GDP的组成部分,故考虑删除变量GDP。结果如下:DependentVariable:TXMethod:LeastSquaresDate:06/05/07Time:20:59Sample:19942005Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.CPI^(2)0.0802000.0175314.5748010.0002CZSR0.9452120.004489210.55000.0000C-921.5906203.5405-4.5278000.0002R-squared0.999548Meandependentvar5921.509AdjustedR-squared0.999505S.D.dependentvar5661.257S.E.ofregression125.9731Akaikeinfocriterion12.62648Sumsquaredresid333253.4Schwarzcriterion12.77374Loglikelihood-148.5178F-statistic23215.17Durbin-Watsonstat0.829098Prob(F-statistic)0.000000TX=-921.5906219+0.08020014044CPI2+0.9452115559CZSR(-4.527800)(4.574801)(210.5500)R2=0.999548F=23215.17由dL=1.17,dU=1.54,DW=0.829098,可知,仍存在一介正序列相关。修复序列相关性。根据模型存在一阶自相关的特点,运用广义差分法:来变换模型,得⑤即⑥首先对原始模型应用OLS法,得到①式,计算随机误差项,以的值作为的样本数据估计参数,得到。然后再将作为已知数求出模型(3)中作为解释变量的变量组合的样本值。再用OLS法估计模型(3),得到的新估计值。再将它带进模型(2)方程式左端被解释变量与右端解释变量的样本值,进而用OLS法估计参数和。此过程及杜宾两步伐。估计结果为:t检验值为-3.873237t检验值为4.017078t检验值为135.6785=0.406270938887=0.999013F=9611.776DW=2.285912从以上统计数据来看,以上变量均很显著,F检验值也大于临界值说明方程线性关系显著。同时,DW=2.285912且du<DW<4-du所以不存在一阶正序列相关。八、最终方程与模拟结果通过以上估计可得最终方程为:⑦(-3.873237)(4.017078)(135.6785)=0.999013F=9611.776DW=2.285912然后计算的基本估计值和随机项的估计量的结果如下:年份税收收入实际值TX(亿美元)税收收入拟合值TXF(亿元)绝对误差TX-TXF相对误差(TX-TXF)/TX19945126.885186.81663378-59.9366337827-0.011690664455319956038.046069.96060408-31.9206040773-0.0052865837386419966909.827038.67457984-128.854579845-0.018648037118919978234.048088.59377205145.4462279480.01766401765719989262.89337.17041881-74.3704188125-0.00802893496702199910682.5810713.8367939-31.2567939076-0.00292595926336200012581.5112514.010678267.49932175320.00536496189672200115301.3815131.2620615170.117938462

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论