付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SP SS-回归-多元线性回归模型案例解析!( 一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:Y = 00 十 十 E毫无疑问,多元线性回归方程应该为:V = Bq +02 +角工2 + -+上图中的x1,x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“ N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:记n俎样本分别是(兀y =>'2*aA1 X"1儿丿,0 二卩丿/鞋丿那么,多元线性回归方程矩阵形式为:'"&quo
2、t; + £1其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1服成正太分布,即指:随机误差必须是服成正太分别的随机变量。2:无偏性假设,即指:期望值为随机误差变量方差都相等3:同共方差性假设,即指,所有的4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。今天跟大家一起讨论一下,SPSS-多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:1 salesnesa
3、letyp&priceengiriEhorsepow ,wheelbaswidthlength1S.919'16 360021.500!1.8140101.267.3172.439 36419S7502B4003 2225108 170 3192 314.114182250-3.2225106.970.5192.08 58829 725042 0003-S'210114 671 4196620 3972225S033.9901.81501O2?663 2178.01378023i'S5'5033 9&028200108 776 1192 O
4、9;138039 000062 000第310113 074 Q198219 747-026.9902.5170107.363.41176.019_2312Se75033 400I2.8133107 363 517'6 O'17.5373& 13S0|3S.900; 2-8193111470.9188.091 56112-475021 9751!311751i0'9 072 7194.639.3£013.740025.300,3.3240109 072 7196227 86120 190'031.965j:3.32051138747206.8S
5、326Z13 360'027 635130205112273 5200 063.72&22525039.E95;壮275115.374.5207215 94327 100'O'I44-475146275112 275 0201 0e.53G25725039.G&5,4.6275108.075 S200.G11 IBSIS 225031 CIOi302C0107 470 3194呂14.785-146.225;!5 7355117.577.0201.2US. 519'9.250'013 2S02.2,115104.167 9ieo'
6、9135 12611 225016 6351;3 1170107 069 4190424.62&10.3110'0|1S.S9013.1175110I7.&72 S200.942 59311 525O'l19 390134180110 572 7197 9curt点击“分析”一一回归一一线性一一进入如下图所示的界面:块1的1ijj Veliicleb'peltyipeJPrice inthodsandslprice $ Engine siz&Ierginesa篷择变(E:! J一个对签Q* I 护 Pneo需thousands priceVVLS
7、权重®:蛆厂逛manuraclMod si mo'del I 炉新车售价(单位=. 茨拜肯二手车售价 £| Vehicle 射pg typ鬪 捞'Price in thousand. 炉 Engine size engi. 袴 Horsep'OW'erlhor. 夕'jVlieelba3 |whe, 拧车宽WFdlhl 務军衽lergtA 少车净垂curb.wgt 少 Fuel capacity 拐耗油量辺硏Inpgj Cooks Dfstance . 少 95铀 LCI forinsa. 撐 95«i4 UCliforIn
8、sa.LCI kr Insa.J ,牯贴£川重置迟)取消j mJ10将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等个自变量 拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可 以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示 的结果:(所有的自变量,都会强行进入)輸入/窿去的吏量h移去的娈量左法1油量迎册, 车稳 Price in tnoLJsands, Vehicle type, 车毘Engine size, Fuel capacity, Wheelbase, 军淨重, Horsepower输入a. 已
9、输入斯肓诸號的吏量b. 因变呈:Log-transformecJ sales如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“ 计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于,当概率值大于等于时将会被剔除)輸入去的喪量mmy輪入的喪量移去的娈昼方法1Price in ttiousands1歩进右隹则;F- to-enteriy 率 V .050 - F-to-remove 的槪率=.1000 -2WhE 创 basE1母进燧卿;F- to-e
10、nterB(y 率 V .050 - F-toremowe 的6?率= 100)4a.囲变董:Loig-transfcrmed sales“选择变量(E)"框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选, 可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列 表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:定义琏弃规则sales 値W: k.i.J .產壬一二thousands h不等于 小于 小于等于 丸于 大于等于点击“统计量”弹出如下所示的框,如下所示:回归系懐置倍国何'!'=协方羞矩隣k翹拟合度他)
11、L R右套出电O描述性厂肯盼相关和偏相关性已r共线性wcL Ddrbin*Watson(U) n个就诊断©在“回归系数”下面勾选“估计,在右侧勾选” 模型拟合度“和”共线性诊断“两个选项, 再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值)点击继续。提示:共线性检验,如果有两个或两个以上的自变量之间存在线性相关关系,就会产生多重共线性现象。这时候,用最小二乘法估计的模型参数就会不稳定,回归系数的估计值很容易引起误导或者导致错误的结论。所以,需要勾选“共线性诊断”来做判断通过容许度可以计算共线性的存在与否?容许度T
12、0L=1-RI平方或方差膨胀因子(VIF): VIF=1/1-RI平方,其中RI平方是用其他自变量预测第 I个变量的复相关系数, 显然,VIF为TOL的倒数,TOL的值越小,VIF的值越大,自变量 XI与其他自变量之间存在 共线性的可能性越大。提供三种处理方法:1:从有共线性问题的变量里删除不重要的变量2:增加样本量或重新抽取样本。3:采用其他方法拟合模型,如领回归法,逐步回归法,主成分分析法。再点击“绘制”选项,如下所示:卜一-D匚P匚NDNT 它 PRED "2RESID "DRESID 沁 PRED "SFIESID *SDRESID直育图®) 正
13、态槪率團迟上图中:DEP ENDENT因变量)ZP RED(标准化预测值) ZRESID(标准化残差)DRESID(易9除残差)ADJPRED修正后预测值)SRSID(学生化残差) SDRESID(学生化剔除残差)一般我们大部分以“自变量”作为 X轴,用“残差”作为 丫轴,但是,也不要忽略特殊 情况,这里我们以“ ZPRED(标准化预测值)作为"X"轴,分别用“ SDRESID(血生化剔除残 差)”和“ ZRESID(标准化残差)作为 丫轴,分别作为两组绘图变量。再点击”保存“按钮,进入如下界面:总寄预测値-I丨未标准化应标港化迟)调节Q)均値預测値的S.E.fP)-戎差丨
14、未特推代f凹, 5?1标范»卫 学生临r i »<y1学生化已制除r日距离门M迪希Mb诒距离(出 a Co世晅密旳杠杆値世05 %-预测区间M均値(啪M单値(1) 置信区闻©-議响缄计S 0坦曲日标准化DfS电怡© D归肝)i标准叱D1F贋门协有盖比率®系城统计!' '1创建承数烦计&>HM-oniD-露写:三斯數鳶丈详A 1灵阡也MWW包含协方差矩阵2)(cook距离,主要是指:把一个个 cook距离越大,表明该个案对回归按钮,再点击"确定按钮,得到如如上图所示:勾选“距离”下面的“cook距离”
15、选项案从计算回归系数的样本中剔除时所引起的残差大小, 系数的影响也越大) 在“预测区间”勾选“均值”和“单值”点击“继续” 下所示的分析结果:(此分析结果,采用的是“逐步法”得到的结果)模型RR方调整R方标准估计硼1.552'.304.300ri155342.655b.430.4221.013572模型汇总oa.预测变S:), Price inlhousandsb埠5ijgS:), Price inihousands, Wheelbasec国变量:Log-transformed salesAnova°平方和df均方Fgig.1厨m残差 总计81 720186,662268,3
16、83115015181 720124465.670.OOCP2囲m残差 总计115,311153.072268,383214915157.6561,02766.122.000a. 预测芟量:(常量L Price inihousands*b. 预测变量:潔量),Price in Ihousands. Wheelbase *c. 因变量:Log-lransfomned sales己讲除的克XCBeta IntSig.傭相关共线性统计iVIF最小容建Vehicle type25P3.854.000.301.9981.002.998Engine size.34204128.000.320.6111.6
17、36,611Horsepowgr.257"2.062.041.167.2933.417293Wheelbase356'5718JOO.424,9881.012.988车宽.2443.517.001.277.892仁421.892车氏.308"4790.000.365.9761,025.976车净重.346°4.600-000.3537221,385722Fuel capacity.266"3.B8rQUU.2旳.820i.2ia.U2U耗油量:迈册-.1 98"-2.584011-7077681.319758Vehicle 1ypeJ
18、29*1,928.056J 57.8351J97.827Engine size.145b1.576.117.128.4452.246.445Horse po werXI28b.229.819.019.2663-910.256车宽.CI25b-.275784-.023.4702 J 26.470车长D27b.237.813.020.2903.448.290车净重105b1.028.306.084.3652741.365Fuel capacityX)02b.024.981.002.4432.259.443耗油量辺府.014164.870.014.5591790.559a IM型中的損测娈量(常量h
19、 Price in thousandsb g型中描两j竇S i第量L Price in thousands. Wheelbase® c.曲夷量:Log-transformed sales模型非标准化系数标准系数tSig.共线性统计量B标准IS蓬试用版容SVIF1(第量)Price in thousands4.684-.051J 94.0065522.090-8.104000_0001.0031.0002(常量)Price in thousandsWheelbase1.822-.055.0611.161.006.011-.590.3561.583-9.4875.718116000_00
20、0.988.9881.0121.012a.因賓昼 Ug-transformed $ale$共线性诊斷合模型维数特征値条件索引方隆比例(隔Price in thousandsWheelbase111.8851.000.06062.1154,051 94.94212.847rooo.00.02-002.1504 351.01.973.00333412.99.00.99a.因变量:Loa-lransformed sales极小値极大fi均ffl标准僞瑩N義测値=245405642043.29052.868512155标准预测値-4,0452.693.002.994155预测値的掠准误羞.082,35
21、4130.057165调整的預测値- 440425.6721 43.28907.874840155殘差-4.9711132.327782.005131.998146155标准慕垂4.9052.297.005.985165student化残差-4.9502.307.006.994155己删除的残差-5.0631552.348876.0065801.017413155SludentfE已删除的残差5 3972.341.0021.016165Mahal。SiS.001174161.9643423165Cook的距画.000.151.006.0仃155居中杠杆値.000.115013.023155荡差
22、统计量N直方图El口标率化戟差碍"985因变蚤:Log-transformed sales回归slides化删徐的(PS5M-2-e2.eo74.97 O71.02Q69 725Qq35,517.51813.1DS;O,33<?6.13S45.7D53<嗎普"及69 749 9 O.O19 39 厲41谬诚Sd;耦蘇网孚龙愉声屈° 昭5 O佃期?診瞬2讲兰辺世 |».575&23d46 305 °4315 357,082.605巒 O O12.0S 3?5fl579922.19S 蹄I呷Od d 1624 25 345 O1
23、3,635 19.04519.540le.DS14.29iie.i45 Oi9.4eo16 9025 45 O-6-4回日林准化预计値SPSS-回归一多元线性回归结果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无 能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起 时“。接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次 补上,结果分析如下所示: 结果分析1:输入/密去的变量mmy輪入的喪量格去的变量方法1Price in ttiousands1歩进F- tsEritEr的梱 率 s .050
24、39; F-to-remove 的槪率=. moo亠2VVhE创basE1歩进燧卿;F- to-enterftih 率 <=.050 - F-toremove 的槽f率H 100)-a.医变董:LO'g-transforinecI sales由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出, 最先进入“线性回归模型”的是“price in thousa nds"建立了模型1,紧随其后的是“Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)
25、当大于等时,从“线性 模型中”剔除按型汇总Q襪型RR方调整R方标准估计的误 差1552"3043001.1 1 55342.055.4221.013573乩预测变配(a), Price inir»OLisands*tr预测克量:Price iniriousands, Wheelbasec,因Log-frarisfoFTTied sles撲型平芳和df母方FSig.1冋归总计01.720130 602255.3931150151817201.244165.070.0002回归总计115311153072255.393214915157.6561.027&E.122.0
26、00a预液变量:Price inlhousands*h.预演I娈量脩量y Price inlHousands. Wheelbase* c.Log-lrarsfomed sal&s结果分析:1:从“模型汇总”中可以看出,有两个模型, 型2的拟合优度明显比模型 1要好一些(模型1和模型2)从R2拟合优度来看,模(>)2:从“ An ova"表中,可以看出“模型 2 ”中的“回归平方和”为,“残差平方和”为,由 于总平方和=回归平方和+残差平方和,由于残差平方和 (即指随即误差,不可解释的误差) 由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和
27、 的一半,3:根据后面的“ F统计量”的概率值为,由于 ,随着“自变量”的引入,其显著性概率值 均远小于,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一己讲降的歪屋U棋型Beta In1Sig偏相关共线性统计量容差VIF最小容畫1Vehidetypie3.S54,000,301,9361X02.993ErigMe:s 血.曲4.12S.0003206-111.G3G.G11Horsepower2572.002.041.1 073S33.417.293Wheelbase.3565 71S.
28、000424see1.012336车宽.2443.517.0C12?70021.121.S92.3084 790.00030S9761.025.976年净重.3斗沪4 BOO00D3537221.335.722Fuel capacity.266'3.63?.000.2的.8201.219.820耕油量迈册-.193-2 534011-.207.7561.319.7582Vehicle type1 一 920.056.1578351J37.B27Engine size1.576.117.129.4452.246.445Horsepower.028220819.019.2563.91025
29、6年宽-.275.764-.023.4702.126.470车怪.D2汕.237.613.0203S03.446.230车淨重,1051 028.306.081.3652.741365Fuel capacity.00?*=.024.9G1003.443工253.443耗油量迈坍.014.154.070.0145591790.559a襪型中的预测夷量Price ir thousandsitji g型中的预测夷量Price iri thousands, c. 0夷星:匚cigtran$fQrmmd sales步进行分析。结果分析:1从“已排除的变量”表中,可以看出:“模型2 ”中各变量的T检的概率
30、值都大于“”所以,不能够引入“线性回归模型”必须剔除。非标建化茉数标准系数tSig共线性纟五计呈B标准羞诃用飯訓F1儒量)Price In thousands4 634*051.194.000-55224 090-e 104OOO.0001.0001.0002淳Price in thou sandsWheelbase-1.322-.0550611 .151Dae.011-.5S0.355-1.533-9,4375718.116XOO000.938.9301 0131 012礼Log-transformed sales从“系数a”表中可以看出:1多元线性回归方程应该为:销售量=价格+*轴距但是,
31、由于常数项的sig为( 所以常数项不具备显著性,所以,我们再看后面的“标准系 数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除所以:标准化的回归方程为:销售量=*价格+*轴距2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF都为,且都小于5,所以两个自变量之间没有出现共线性,容忍度和膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大共线性诊斷乞模型维数将粧値臬半索引方盖比例Pilce in thousandsWh&elbase111 .SB 51 000loeOG2.1154.051.34.94312.'3'471 000.0002.002.1501.3G1.01.97JI300333 412.39.00”99a. Log-transformed sales残差颈计量之櫃小値狠
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年吉林省舒兰市高二生物下册期末考试考试卷【综合卷】附答案
- 2026年湖北省老河口市高二生物下册期末考试模拟卷【达标题】附答案
- 2026年吉林省集安市高二生物下册期末考试测试卷附参考答案【考试直接用】
- 2026年江苏省张家港市高二生物下册期末考试检测卷及完整答案(易错题)
- 2026年湖南省涟源市高二生物下册期末考试模拟卷及答案
- 2026年山西省古交市高二生物下册期末考试考试卷完整答案
- 2025年湖北省赤壁市高二生物下册期末考试考试卷及答案【易错题】
- 2025年河南省永城市高二生物下册期末考试试卷(培优B卷)附答案
- 2026年福建省漳平市高二生物下册期末考试考试卷附参考答案【巩固】
- 2026年江苏省句容市高二生物下册期末考试检测卷含答案【巩固】
- 2024年国网湖北电力部分单位市场化招聘管理单位遴选500模拟题附带答案详解
- 升降车安全操作规程
- 金属非金属露天矿山及尾矿库重大事故隐患判定标准解读
- 应征公民政治考核表(含各种附表)
- DL-T5841-2021电气装置安装工程母线装置施工及验收规范
- (高清版)JTG D50-2017 公路沥青路面设计规范
- 人教版初中学业水平考试地理试题与答案(共五套)
- 光伏电能质量评估报告
- IATF16949包装方案评审表
- 多媒体技术应用课件PPT教学资料
- 露天矿山安全标准化记录表格
评论
0/150
提交评论