偏最小二乘回归分析u2014案例_第1页
偏最小二乘回归分析u2014案例_第2页
偏最小二乘回归分析u2014案例_第3页
偏最小二乘回归分析u2014案例_第4页
偏最小二乘回归分析u2014案例_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1奏倒救育披入对係济彰询同题的卩LS遂1数据资料及相关概念为研究教育投入与产业发展之间存在着具体怎样的相关i如下数据资料.表1辽寺省198牛2005年教育投入与经济产出数才年份Li-2Lsu.KYiY21984122156125644195129657396180.426&:19S55841749552232768959810245074.932&你66702058351741070401612338392.9357.1927119329394549709680861124532109.5417.(卩丽192931552615839637753155617141.9492.1991763327

2、08598834593257194395141.9545.J.990167733768580075591654201077168.6540.1991150033530571569660343229033180.8590.2124535208573509685996254712194.6741.11993130733615572612630759305120260.810391994127335923606148636786398399319.012591995142544072635387672482439517392.2139019961962510686113795761644961904

3、74.115371997231649591666386500252546883474.11743J.99S212647557724391555892562770531.518551999242649964658165644042642559520.820012AC0291049834587000722325760719503.42344ZOOj297160271623975679852855043544.424402Q02367472791709233622536991450590.22609%0035027989087884735952781108785615.82898Z004672611

4、58897922285117571387080798.43061200593421449848159054990691629956882.43953注释表中数据摘自辽宁统计年鉴2006.变量说明衡量教育投入水平的具体指标集乙一第一产业(包括林业、牧业、渔业等)产出值(单位:亿元);骂一第二产业(包括工业和建筑业)产出值(单位:亿元);乙一第三产业(包括流通类的交通运输业、邮电通讯业、商业饮仓储业及金融、保险业,地质普查业,房地产、公用事业,居民服务信息服务业和各类技术服务业,等等)产出值(单位:亿元).2多重相关性诊断计算自变量与因变量之间的相关系数.loadjytrjjcc%原始教据cr=c

5、orrcoef(jytrjjcc);%计算麦量之间的相关糸数计算结果整理如下:表2因变量与旨变量之间的相关糸数rLiLaIUKYiY2Li1.00000.98470.8737-0.48470.94470.86430.89061.00000.9117-0.49440.96950.90880.9250一三1.0000-0.61960.89440.89400.8776f-41.0000-0.4177-0.4436-0.3751K1.00000.96350.98331.00000.982721.0000Ys由表中可以看出:4自变量之间的相关系数最高达0.9847,表明自变量之间存在丿意,初等以下教育程

6、度劳动力数与其它自变量之间呈负相关夕厶因变量与自变量之间的相关系数最高达0.9871,表明自变量:间在存鎰宫的相亍性洼音.研疥牛、宫笙、比竺勤有理直EO=stand(jytrjjcc(:,1:5)汽标准化自变量数据FO=stand(jytrjjcc(:,6:8)标;隹化因变量数据MMLR=inv(EOT*EO)*(EO,*FO)汽估计多重多元线性回归二根据上述计算结果,可得下列多重多元线性回归方程:代1=-0.4171Eg-0.1685EQ2+0.1873%一0.0578E04+1.32F02=-0.241001-0.164702一0.0209E()3一0.007104+1.38=0.2237

7、E。0.3039Eg+0.1530+0.0270+1.36从这一组回归方程可以看出,三大产业产出值与研究生教育、高关,这与客观事实相违背,也与相关系数矩阵中得到的结论相悖.所以,在自变量之间、以及自变量与因变量之间存在复杂的相关二乘回归方法建立的模型不能准确的反映实际情况.3建立偏最小二乘回归模型(1)提取所有可能的主成分clearloadjytrjjccX=jytrjjcc(:,1:5);Y=jytrjjcc(:,6:8);E0=stand(X);F0=stand(Y);A=rank(E0);WAC,TzU,P,R=plspcr(E0,F0);%提取所有可能的主成分主成分解释能力分析3复测定

8、糸教的取值主成分累积1234复测定糸数0.87270.92090.97390.9870由表3可知,当抽取一个主成分时,回归方程的复测定系数已达系统信息的可解释变异达到总变异的85%即可认为回归方程的精度已此,根据模型从简的原则,我们只需选取一个主成分建模.第一主成分为=0.4694E0.4902Eg0.4719+0.2128*04(厶主成分的信息鮮猝能力Rdx,RdX,RdX匕Rdy,RdY,RdYt=plsrd(E0,F0几A)Rdx=Columns1through40.94210.00920.04440.00170.97440.01100.00830.00060.91080.00540.0

9、3060.05300.34900.64250.00460.00400.93350.04330.00800.0150Column50.00250.00570.00030.00000.0001through40.14230.01920.0149RdX=Columns10.8220Column50.0017RdXt=1.0000Rdy=Columns1through40.85730.02520.06700.86500.05970.04150.87280.05840.0493Column50.01040.01530.0130U囱diHTI?/W.Lp面A苗一士我仝问姑阳土小生:阳0.94210.974

10、40.91080.34900.93350.85730.86500.1t20.00920.01100.00540.64250.04330.02520.05970.(从表4中可以看出,主成分心除综合解释了原自变量系统82.20%自变量系统有非常好的代表性同时,综合解释了因变量系统86.50勺系统的贡献很大而第二个主成分$对原自(因)变量系统信息变异郎计算当增加第二个主成分乙时,模型的精度没有明显的改善因此,刀能力的角度以及模型从简的原则,只选一个主成分建模是适宜的.丄第一*主成分间的相关性cr=plsutcor(U,T)%绘制ui/tl图cr=1.00000.93420.93421.0000t10

11、.21640.21740.2184-0.0976-0.0980-0.09850.23890.23990.2410求原始变量回归方程的糸数COEFFzINTERCEP=plsiscoeff(X,Y,SCOEFF)COEFF=0.02420.00170.0006-0.00030.0001INTERCEP=-17.96770.10720.00740.0027-0.00150.0006-233.00590.09660.00670.0024-0.00140.0005-388.8328关于成分厶的回归方程为好)1Q斤石=_0.4586心9代2Qrn2-0.4607*,FgQ斤33=0.46271、;关于仇

12、的回归方程为0.215301+0.2248E02+0.216403_0.097604+0.23Fg怎0.2163+0.2258+0.21740.0980Eg+0.23Pg0.2172E“+0.226902+0.2184E03一0.098504+0.241原始因变量关于自变量的回归方程为y=-17.9677+0.0242厶+0.0017+0.0006L?一0.0003L。+(y2=233.0059+0.1072厶+0.0074厶?+0.0027厶30.0015L。+y3=-388.8328+0.0966厶+0.0067匕+0.0024L?-0.0014Z4+可见,所建的回归方程没有出现反符号现象

13、,受中等以上教育的投入与经济的产出都是呈正相关的,只有初等教育劳动力人数(包括1.0946变莹投影重要性VIP图变量投影重要性指标是用来测度第丿个自变量对因变量的解释能测的角度,如果某个自变量在解释因变量时起得作用很小,则可以考重新建模由于VIP4明显较小,故删除变量L4重新用偏最小二乘回归回归方程为尹=-270.7+0.0260厶+0.0018厶?+0.0006L?+0.00(儿=一1374.79+0.1158厶+0.0080厶?+0.0029厶+0.0y3=1416.1+0.1043厶+0.0072厶?+0.0026厶+0.00(与未删除变量L4前的回归方程对比,发现方程的回归系数变化很小

14、.果见表5.蔻5改进后模型应用效果比对分析RdxRdySSF包含L4的模型0.82200.86508.5034需要强调的是,删除L4的模型对分析教育投入与经济产出二者戈不是很大,但若考虑对辽宁经济产出进行短期预测,采用该模型的预4由模型得到的信息I从因变量与自变量之间的相关糸数和变量投影重要性指标值的教育投入对经济发展有着深刻、全面的促进作用对三大产业经济尸的就是教育的财政投入,然后依次是高等、中等、研究生、初等教睪教育投入对三大产业经济产出的边际作用结构上是相似的,财政投入的边际贡献最大.II.由I,国家的高校扩招政策对经济产生了积极的影响据辽匚统计,辽宁省高等教育35.3%的毛入学率表明,辽宁省已经率先进代表1中的数据表明,辽宁省高校招生人数的持续增长,特别是20(长,与辽宁省的经济增长是适应的,反过来说大众化的高等教育对经作用开始显现.m由I,初等教育程度劳动力人数对经济产出影响最小甚至是教育的普及和辽宁省较高的中等教育普及率,文盲和新增初等教育程渐减少,因此该项指标对经济产出的解释能力变小初等教育程度劳Z项指标的负相关性表明,中等以上教育程度劳动力人数增加的必然结劳动力人数的下降,而教育财政投入的增加是抑制初等教育程度劳动素,初等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论