Python工程应用-数据分析基础与实践课件-第12章_第1页
Python工程应用-数据分析基础与实践课件-第12章_第2页
Python工程应用-数据分析基础与实践课件-第12章_第3页
Python工程应用-数据分析基础与实践课件-第12章_第4页
Python工程应用-数据分析基础与实践课件-第12章_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章概论西华大学机器学习第十二章财政收入影响因素分析及预测XXX学校XXX2022目录Contents案例引入模型介绍案例操作

本章知识图谱3案例引入一1案例引入5案例数据:

本案例将研究我国某重要地区的财政收入与经济的关系,以得到市财政收入的关键影响因素。本案例所用的财政收入分为地方一般预算收入和政府性基金收入。由于数据获取的有限性,使用的数据均来自于《某市统计年鉴》。案例目标:

梳理影响地方财政收入的关键特征,分析影响地方财政收入的关键特征的选择模型,以及对某市的财政收入进行预测。模型介绍二2.1模型介绍7

Adaptive-Lasso是近年来被广泛应用于参数估计和变量选择的方法之一,并且在确定的条件下,可以使用Adaptive-Lasso方法进行变量选择。使用Adaptive-Lasso方法来探究地方财政收入与经济的关系,本方案将选择参数估计与变量同时进行的一种正则化方法,其被定义为:

2.1模型介绍8由普通最小二乘法得出的系数为:

求解微分方程,得到预测模型如下:

2.1模型介绍9

提示:GM(1,1)模型就是灰色预测中的强力工具之一。该模型中,G表示Grey,M表示Model,括号中第一个1代表一阶微分方程,第二个1代表微分方程有一个变量。同理,灰色预测理论中GM(1,2)表示有两个变量的一阶微分方程灰色模型。2.1模型介绍10

利用模型进行预测之后,对建立的灰色预测模型进行精度检验,本案例使用后验差检验对模型精度进行检验,计算公式如下所示:均值:

标准差:

2.1模型介绍11残差的均值:

残差的标准差:

方差比:

2.1模型介绍12最小残差概率:

预测精度等级PC好>0.95<0.35合格>0.80<0.45勉强合格>0.70<0.50不合格<=0.70>=0.65预测精度等级对照表案例操作三3.1案例步骤14基于机器学习的财政收入预测模型的主要实现步骤如图3.1案例步骤15由此构建该案例的实现步骤如下:Step1:搜集某市财政收入以及各类别收入相关数据。Step2:利用Step1形成的已完成数据预处理的建模数据,建立Adaptive-Lasso变量选择模型。Step3:在Step2的基础上建立单变量的灰色预测模型和人工神经网络预测模型。Step4:利用Step3的预测值代入构建好的人工神经网络模型中,从而得到某市财政收入以及各类别收入的预测值。3.2案例实现1、数据收集和预处理

考虑一些与能源消耗关系密切并且有线性关系的因素,初步选取以下因素为自变量,分析它们之间的关系:社会从业人数(x1):就业人数的上升伴随着居民消费水平的提高,从而间接增加财政收入。在岗职工工资总额(x2):在岗职工工资总额反映的是社会分配情况,主要影响财政收入中的个人所得税、房产税和潜在的消费能力。社会消费品零售总额(x3):代表社会整体消费情况,是可支配收入在经济生活中的体现。当社会消费品零售总额增长时,表明社会消费意愿强烈。3.2案例实现1、数据收集和预处理城镇居民人均可支配收入(x4):居民收入越高,消费能力越强,同时意味着其工作积极性越高,创造出的财富越多,从而能带来财政收入的增长。城镇居民人均消费性支出(x5):居民在消费商品的过程中会产生各种税费,税费又是调节生产规模的手段之一。在商品经济发达的今天,居民消费得越多,对财政收入的贡献就越大。年末总人口(x6):在地方经济发展水平既定的条件下,地方人均财政收入与地方人口数呈反比例变化。全社会固定资产投资额(x7):建造和购置固定资产的经济活动,即固定资产再生产活动。3.2案例实现1、数据收集和预处理地区生产总值(x8):地方经济发展水平。第一产业产值(x9):第一产业对财政收入的影响小。税收(x10):政府财政收入的最重要的收入形式和来源。居民消费价格指数(x11):影响城乡居民的生活支出和国家的财政收入。第三产业与第二产业产值比(x12):产业结构。居民消费水平(x13):间接影响地方财政收入。3.2案例实现1、数据收集和预处理

通过上述的描述分析,可以得到数据集的最小值、最大值、均值和标准差。发现财政收入的均值和标准差数值较大,从而可以说明某市各个年份之间的财政收入存在较大的差异。

通过初步选取自变量,得到相关关系之后,还需要对数据进行描述性统计分析,从而对于所获取的数据有整体上的认识,3.2案例实现1、数据收集和预处理(1)相关性分析

相关系数可以用来描述定量和变量之间的关系,初步判断因变量与解释变量之间是否具有线性相关性,利用原始数据求解相关系数。根据分析结果可以知道,居民消费价格指数(x11)与财政收入的线性关系不显著,而且呈现负相关,其余变量都是与财政收入呈现高度的正相关。3.2案例实现2、变量选择

根据相关性分析可以知道,并不是所有的影响因素对财政收入的贡献度都是相同的,因此本文使用AdaptiveLasso算法对影响因素进行选择。

识别影响财政收入的关键影响因素是社会从业人数(x1)、在岗职工工资总额(x2)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)和全社会固定资产投资额(x7)。3.2案例实现3、GM(1,1)模型

建立GM(1,1)模型,编写GM(1,1)模型的灰色预测函数。

通过Adaptive-Lasso方法识别的影响财政收入的因素,建立灰色预测模型,本案例将通过建立灰色预测模型得到社会从业人数(x1)、在岗职工工资总额(x2)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7),预测结果:3.2案例实现4、神经网络预测模型绘出真实值和预测值的折线图如下:由图可知真实值与预测值的趋势大致相同。

思考题24

根据上述分析的案例,读者可以通过下面两个小练习,进一步巩固相关知识要点。1、使用灰色预测计算该地未来两年的增值税、营业税、企业所得税以及个人所得税。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论