数学建模案例分析_第1页
数学建模案例分析_第2页
数学建模案例分析_第3页
数学建模案例分析_第4页
数学建模案例分析_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Statistics,建模大赛案例分析,08:19,我国经济增长与经济结构、财政收入、居民收入关系之研究,Topic,08:19,我国经济增长与经济结构、财政收入居民收入关系之研究,08:19,案例研究思路,经济增长 预测模型,Party1: 问题提出和 研究现状,Part 2: 定性分析及匹配度分析,Part 5:结论,Part3: 经济增长模型的建立和检验,Part 4:,08:19,Part One,引言,08:19,问题的提出和研究现状,.如何对敏感数据的匹配性进行定量分析,科学解释数据之间的匹配关系,如何正确预测重要指标的发展趋势,08:19,Part Two,基本统计分析,08:1

2、9,一、定性分析,定性分析思路对命题中四个经济指标的发展现状做描述性分析。 统计方法统计图、统计表。,08:19,总体经济发展经济增长和经济结构变动分析,08:19,主要影响指标变动分析财政收入 、居民收入,08:19,区域经济发展分析东、中、西部,08:19,二、匹配度分析,匹配度分析研究GDP与其他经济指标发展的匹配关系。 统计方法匹配度的定量计算,方法和相关标准参考:,08:19,匹配度的计算步骤:,GDP与产业结构匹配度建模思想:利用距离测算我国实际数据与匹配条件下标准数据之间的差异性。,08:19,匹配度的计算步骤:,GDP与产业结构匹配度建模步骤:,参阅国际匹配标准,拟合与我国GD

3、P水平相匹配的产业结构标准值:,08:19,匹配度的计算步骤:,GDP与产业结构匹配度建模步骤:,参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:,08:19,匹配度的计算步骤:,GDP与产业结构匹配度建模步骤:,参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:,08:19,匹配度的计算步骤:,参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:,GDP与产业结构匹配度建模步骤:,08:19,匹配度的计算步骤:,计算标准值和实际值之间的欧式距离,并归一化为(0,1),GDP与产业结构匹配度建模步骤:,三维空间两点a(x1,y1,z1)与b(x2,y2,z2

4、)间的欧氏距离:,该距离的值域范围为0到,08:19,匹配度的计算步骤:,计算标准值和实际值之间的欧式距离,并归一化为(0,1),GDP与产业结构匹配度建模步骤:,08:19,匹配度的计算步骤:,GDP与居民收入、财政收入匹配度建模思想:设匹配度量化取值为(0,1),当相关指标占GDP的比例达到理想标准时,匹配度为0;但相关指标占GDP比例为0时,匹配度为1;并设匹配度随指标比例在(0,1)上非线性变动(二次函数曲线 )。,08:19,匹配度的计算步骤:,GDP与居民收入、财政收入匹配度建模步骤:以收入为例,查阅文献得到居民收入的理想值为占GDP总量59.5%,得到二点: (0,1) 、(0.

5、595,0)拟合曲线得方程组,2008年城镇居民收入占比为0.263183,带入得到匹配度为0.311034,08:19,三、灰色关联分析,目的研究GDP与其他经济指标间的关联紧密程度。 统计方法灰色关联系数,08:19,灰色关联系数的计算步骤,数据规范化剔除量纲影响,原始数据:,处理后数据:,08:19,灰色关联系数的计算步骤,计算各时刻关联系数,参考数列:,比较数列:,序列差:,08:19,灰色关联系数的计算步骤,计算各时刻关联系数,08:19,灰色关联系数的计算步骤,计算关联度,08:19,灰色关联系数的计算步骤,案例计算结果:,以GDP为参考序列:,城镇收入农村收入三产比重财政收入二产

6、比重,以财政收入为参考序列:,GDP城镇收入农村收入三产比重二产比重,08:19,灰色关联系数的计算步骤,案例计算结果:,以城镇收入为参考序列:,农村收入GDP三产比重二产比重财政收入,以农村收入为参考序列:,城镇收入三产比重GDP二产比重财政收入,08:19,Part Three,经济增长模型的建立和检验,08:19,一、模型构建目标及变量选择,目标研究各经济指标对经济增长的影响。 变量选择,被解释变量:GDP 解释变量:财政收入、农村居民人均纯收入、城镇居民人均可支配收入、经济结构,08:19,二、模型构建方法,模型一:GDP和收入偏最小二乘回归(Partial Least-Squares

7、 Regression)。 模型二:经济增长和产业结构模型多元回归,08:19,偏最小二乘(PLS)原理介绍,多元线性回归的困惑:,样本容量要求很高: 一般应大于30,或大于自变量个数的5-10倍,当出现严重的多重共线性问题时,08:19,偏最小二乘(PLS)原理介绍,常用解决方法:,逐步回归,主成份回归,岭回归,在克服多重共线对系统回归建模干扰的努力中,1983年,S.Wold和C.Abalno提出了偏最小二乘分析。,08:19,偏最小二乘(PLS)原理介绍,偏最小二乘的特点:,可用于多变量对多变量建模,能在多重共线情况下进行建模,允许样本量小于自变量个数情形下的建模,最终模型包含所有变量,

8、易于解释和辨识系统信息,08:19,偏最小二乘(PLS)原理介绍,建模原理:,偏最小二乘=主成份分析+典型相关+多元回归,08:19,偏最小二乘(PLS)原理介绍,知识链接主成份分析:,主成份分析:就是用少数的几个综合指标来代表原来的多项指标,而且几个综合指标之间是独立的。,第一主成份,第二主成份 . ,(各成分间独立,且按包含原指标信息量排队),08:19,偏最小二乘(PLS)原理介绍,知识链接典型相关分析:,典型相关分析:找到两组变量间联系,通过一组变量的线性组合与另一组变量线性组合的关联关系来体现。,第一对典型变量,第二对典型变量,第K对典型变量,08:19,偏最小二乘(PLS)原理介绍

9、,PLS建模原理:,自变量集:,因变量集:,建模步骤: 在自变量集中提取第一主成份 ,同时在因变量集中也提取第一主成份 ,要求 和 相关程度达到最大;然后建立因变量 与 的回归,并判断精度;,08:19,偏最小二乘(PLS)原理介绍,PLS建模原理:,自变量集:,因变量集:,继续提取第二对主成份,获得 和 ,建立因变量 和 的回归,判断精度,如不满足继续提取。,08:19,偏最小二乘(PLS)原理介绍,PLS建模原理:,自变量集:,因变量集:,若最终提取r个主成份 , 偏最小二乘将通过建立 与 的回归式,然后再表示为 与原自变量的回归方程式,即最终结果。,主成份 个数的选择方法交叉有效性检验,

10、08:19,偏最小二乘(PLS)原理介绍,交叉有效性检验 :留一交叉验证,越小越好,为所有样本拟合h-1各成分时的回归误差平方和,08:19,偏最小二乘(PLS)原理介绍,回归系数显著性检验t检验,jackknife方差估计:,为去掉第i各样本后回归所得系数估计值,08:19,偏最小二乘(PLS)的实现,R中的PLS包的加载,将PLS下载到指定目标, 运行R程序,并加载PLS包。 (注意:无需解压), library(pls)#载入程辑包:pls,08:19,偏最小二乘(PLS)的实现,PLS在R中实现代码,Step1:导入数据,并进行数据的标准化,#inde.txt 自变量 de.txt 解

11、释变量,数据事先存储于F盘 x-read.table(file=f:data1/inde.txt,header=TRUE) #读入自变量数据; y-read.table(file=f:data1/de.txt,header=TRUE) #读入因变量数据; normy-scale(y) #数据标准化 normx-scale(x) #数据标准化 normy #显示数据 normx #显示数据,08:19,进行pls回归,并进行交叉验证,选择成分数,偏最小二乘(PLS)的实现,PLS在R中实现代码,Step2:进行pls回归,并进行交叉验证,选择成分数,pls1-plsr(normynormx,va

12、lidation=LOO,jackknife=TRUE)#进行PLS估计 summary(pls1) #显示回归结果(包括PRESS,与解释变异度)其中,validation=“LOO”表示使用留一交叉验证计算PRESS,jackknife=TRUE表示使用jackknife方法计算回归系数方差,(为做回归系数显著性检验);没给定主成份个数,默认使用所有成分回归,以备选择。 validationplot(pls1)#函数 validationplot()显示不同成分数下留一交叉验证的预测误差平方根,08:19,偏最小二乘(PLS)的实现,PLS在R中实现代码,Step3:根据选择成分数,重新建

13、立模型,pls2-plsr(normynormx,ncomp=2,validation=“LOO”,jackknife=TRUE)#ncomp= 2设定主成份个数为2。 summary(pls2) #显示回归结果(包括PRESS,与解释变异度),08:19,偏最小二乘(PLS)的实现,PLS在R中实现代码,Step4:显示模型结果,coef(pls2) #得因变量关于各自变量的回归系数(各变量均为标准化后数据): jack.test(pls1) #即对coef(pls1)生成的系数进行假设检验 scores(pls1) #即求主成份得分 loadings(pls1) #即求主成份载荷 plot

14、(pls1)#预测效果图,为一对角直线最好 plot(normy)# 绘制真值点 lines(normy)#绘制真值线 lines(fy)#预测线,比较效果,08:19,偏最小二乘(PLS)的实现,PLS在R中实现代码,Step5:逆标准化(还原为原变量回归方程),(y-mean(y)/sd(y)=a1*(x1-mean(x1)/sd(x1)+a2*(x2-mean(x2)/sd(x2)+a3*(x3-mean(x3)/sd(x3),coef(pls2) #得因变量关于各自变量的回归系数(对应上式中a1、a2、a3): sd(y,1)*0.60537538/sd(x,1) #x1的回归系数(红

15、色数字为x1标准变量的回归系数) sd(y,1)*0.36148367/sd(x,2) #x2的回归系数(红色数字为x2标准变量的回归系数) sd(y,1)*0.03458435/sd(x,3) #x3的回归系数(红色数字为x3标准变量的回归系数) sd(y,1)*(0.60537538*-mean(x,1)/sd(x,1)+0.36148367*-mean(x,2)/sd(x,2)+-0.03458435*-mean(x,3)/sd(x,3)+mean(y,1) #原始变量y与x的回归方程截距,08:19,二、模型构建方法,模型一:GDP和收入偏最小二乘回归(Partial Least-Sq

16、uares Regression)。 模型二:经济增长和产业结构模型多元回归,08:19,二、模型构建方法,模型二:经济增长和产业结构模型多元回归,采用多元回归方法建立GDP对数与X4、X5、X6的关系如下:,08:19,三、区间估计,方法:首先对各收入指标(x1x2x3)做时间趋势预测,然后带入PLS结果预测GDP,08:19,Part Four,经济增长预测模型,08:19,一、支持向量回归介绍,如果集合 是(以 为精度)线性可逼近:,08:19,一、支持向量回归介绍,则 中任一点到 的几何距离为:,08:19,一、支持向量回归介绍,最优超平面(以 为精度)线性可逼近的最优逼近超平面为距离

17、集合 的最大上界的超平面,求解得到最优超平面:,08:19,一、支持向量回归介绍,考虑一定的误差,08:19,一、支持向量回归介绍,非线性支持向量回归模型,08:19,一、支持向量回归介绍,非线性支持向量回归模型,SVM 处理数据映射到高维空间建模在返回原空间的方法选择一个核函数 (),常用的核函数选择: 线性核(Linear Kernel) 多项式核(Polynomial Kernel) 径向基核函数(Radial Basis Function) Sigmoid核,08:19,一、支持向量回归介绍,支持向量回归优点: 专门针对小样本情况,其期望得到的是在现有信息下的最优解,而不仅仅是样本数趋

18、于无穷大时的最优解; 是一个凸二次优化问题,保证的得到全局最优解 通过核函数解决非线性建模问题,直接得到非线性解。,08:19,二、支持向量回归R语言实现,R实现:,常用的实现包: Kernlab包 e1071包 klaR包 svmpath包,08:19,二、支持向量回归R语言实现,08:19,R中的e1071包的加载,将e1071下载到指定目标, 运行R程序,并加载e1071包。 (注意:无需解压), library(e1071)#载入程辑包:e1071,08:19,二、支持向量回归R语言实现,08:19,#数据预处理后提前存储于F盘下四个文本文档中: try.txt 训练集数据 test.

19、txt 检测集数据,08:19,二、支持向量回归R语言实现,08:19,Step1:导入数据,try-read.table(file=“f:data2/try.txt”,header=TRUE) #读入训练集数据; test-read.table(file=“f:data2/test.txt”,header=TRUE) #读入 检测集数据; try-as.matrix(try) # 数据转换矩阵形式 test-as.matrix(test) # 数据转换矩阵形式,08:19,二、支持向量回归R语言实现,08:19,Step2:采用几种常见核函数建模并比较,svm1-svm(y.,try,ker

20、nel=linear) #使用线性核函数建模; svm2-svm(y.,try,kernel=sigmoid) #使用sigmoid核函数建模; svm3-svm(y.,try,kernel=radial)#使用高斯核函数建模; svm4-svm(y.,try,kernel=polynomial) #使用多项式核函数建模; fy1-predict(svm1,test) fy2-predict(svm2,test) fy3-predict(svm3,test) fy4-predict(svm4,test),08:19,二、支持向量回归R语言实现,08:19,Step2:采用几种常见核函数建模并比较,e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论