多元线性回归实例分析_第1页
多元线性回归实例分析_第2页
多元线性回归实例分析_第3页
多元线性回归实例分析_第4页
多元线性回归实例分析_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS--回归-多元线性回归模型案例解析!(一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:Y=为十吕X十E毫无疑问,多元线性回归方程应该为:上图中的x1,x2,xp分别代表“自变量”Xp截止,代表有?个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:记n组样本分别是(xz少…改=,令"耳iX12…七、伍1y=,Xh1X2\工22…X2p■■■,8=A的J与1…5)\'肝)|Y=i那么,多元线性回归方程矩阵形式为:其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。2:无偏性假设,即指:期望值为03:同共方差性假设,即指,所有的随机误差变量方差都相等4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。今天跟大家一起讨论一下,spss---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:16.91939.38414114858820.39718.7801.38019.7479.2311752791.56139.35027.85183.26763.72916.9436.63611.18614.786145.519136.12624.62942.59313.740201909.25028.67636.12512.47511.22610.31011.62622.25523.5563900013.36022.52527.10025.72518.225resale16.3G019.87518.22629一72642.00070.9194.626.30019G.231.96620G.813.260180.92150028.400176.0188.023.99033.96062.00026.99033.40038.90021.97576174.068.4201.0200.6194.8201.244.47639.66631.01046.225178.0192.0198.217G.0192.9192.0196.627.88639.89516.63618.89019.390200.0207.2107.0107.5110.5190.4200.9197.9106.9114.6102.6108.7113.0111.410901090113.8112.2112.2108.0点击“分析”一一回归一一线性一一进入如下图所示的界面:将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入)箱入/秋去的爽量"3模型输入的娈星移去的娈量方法1耗油量:迈时,车Priceinthousandsr.,Vehicletvpe,军觅Enginesize,Fuel,^apapity,\Wheelbase,Horsepower输X.3.己输入所有请求的菱量斯b.因变星:Log-transformedsales如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)

输入/秩去的爽量彳模型输入的查量移去的变量方法1Priceinthousand^步进《准则;F-to-enter的翻率<=.050*F-tc-remov/e的概率=「:①£Wheelbase步进r准则:r-to-enter的期率<=.050厂'F-to-remov/e的概率>Fa,因变量:Log-transformed:sales“选择变量(E)”框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选,可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:点击“统计量”弹出如下所示的框,如下所示:曲戏性回归,统计量ix巨1归系散5估计回巨1归系散5估计回□置信区间永平嘟切,□协方差逅辟&)瓣差.Durbin-WatsonfU)可,个案诊断(2)•篱群值(史@所有个案M摸型欺合度:地-jR方变化但)□描述性□部样相关和偏相关性凹共线性诊断L)3标准差槌芭J取消[帮助-.在“回归系数”下面勾选“估计,在右侧勾选”模型拟合度“和”共线性诊断“两个选项,再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值)点击继续。提示:共线性检验,如果有两个或两个以上的自变量之间存在线性相关关系,就会产生多重共线性现象。这时候,用最小二乘法估计的模型参数就会不稳定,回归系数的估计值很容易引起误导或者导致错误的结论。所以,需要勾选“共线性诊断”来做判断通过容许度可以计算共线性的存在与否?容许度TOL=1-RI平方或方差膨胀因子(VIF):VIF=1/1-RI平方,其中RI平方是用其他自变量预测第I个变量的复相关系数,显然,VIF为TOL的倒数,TOL的值越小,VIF的值越大,自变量XI与其他自变量之间存在共线性的可能性越大。提供三种处理方法:1:从有共线性问题的变量里删除不重要的变量2:增加样本量或重新抽取样本。3:采用其他方法拟合模型,如领回归法,逐步回归法,主成分分析法。再点击“绘制”选项,如下所示:

「标准化残差图直方图正态概率图巳}口广生所有部冬囹〔已幕助「标准化残差图直方图正态概率图巳}口广生所有部冬囹〔已上图中:DEPENDENT(因变量)ZPRED(标准化预测值)ZRESID(标准化残差)DRESID(剔除残差)ADJPRED(修正后预测值)SRSID(学生化残差)SDRESID(学生化剔除残差)一般我们大部分以“自变量”作为X轴,用“残差”作为Y轴,但是,也不要忽略特殊情况,这里我们以“ZPRED(标准化预测值)作为x〃轴,分别用“SDRESID(血生化剔除残差)”和“ZRESID(标准化残差)作为Y轴,分别作为两组绘图变量。再点击”保存“按钮,进入如下界面:

如上图所示:勾选“距离”下面的“cook距离”选项(cook距离,主要是指:把一个个案从计算回归系数的样本中剔除时所引起的残差大小,cook距离越大,表明该个案对回归系数的影响也越大)在“预测区间”勾选“均值”和“单值”点击“继续”按钮,再点击“确定按钮,得到如下所示的分析结果:(此分析结果,采用的是“逐步法”得到的结果)模型汇总口模型RR方调整R方标准恰计的误差1,552a.3041.1155342,655b.4-30.4221.013572预测变量:(常量),Priceinthousands.?¥页洞j变量:‘]常量£PNceinthousands;Wheelbase亍q.因变量:Log-transformedsalesAn&vac模型平方和!df均方FSig.1回归81.7201917'2065.670,ooad残差18S.6621501.244总计'265.3S3_1.51玉回归115.311257.65656.122,ooab残差153.0721491.027总计'265.3S31.51顼测匿量:(常量予;Priceinihotjeands&宇顽变量:t常量iPriceinlliousandsf,Wheelbase^-c-.因变星:Log-transformedsale's已徘豚的爽量弓模型BetaIn.哗Sig:..偏担美共线性统计星容差明F最小容差1Vehicletype:25133.854:ooo-.301.990■1.002.990Engin&.size,:342a4.12B.血..320.6111.636.611Horsepower,257a.041..167.2933.417.293Wheelbase.35635.710M.424.独L012.90S车宽.24433.517,tiJ01.277:092■1.121.892-车长,30Sa4.79J0.IilOO;..365如J6-1.025.976车净重.34634.&00M.353-.722■1.3057'^2Fueltapacity,266a3.687.血..28Sf-:0210■1.219.-.820耗油量:迈J升-,19Sa-2.58.4w<207.75JST.319".7531Vehicletype,1-29b1.920.056.157.&35■1:f97.827Engine-.size,145b1.576.117'一』282.246.445Horsepower,02Sb.229.019..019.25J63.91.0;.256年宽-,025b-s275.734-.023-:4702TN6.470车长,02>b.237•.剧3.-020项'3.44.9.290车净重,105b典叫..034.3657741.365Fuelcapacity,002b.024.931.002:4432:龄9.443耗油量:迈饼.014b.164初口.014:.5591.790.559模型中的预测变量:(信量LPriceinthousands*模型中的祯湎变量:{常量),Priceinthousands.Wheelbase*囱变量:Log-transformed^'ales系歉模型非标准化系数标准系数翎".共线性统计量B标准误差试用版容差VIF1:速量)4.634.1.94/24.090.000Priceinthousands-.051.006":-.552•胡.1M.0001.00Q1.0002-1.日遂1.151.11-6Priceinthousands-.055,(w-.590•旧48].000.9881.012Wheelbase.061.011.356■571S,.000.9881.0Ha.因变量:Log-transformedsales共妹性诊断寻模型推数特街直条T牛索引方差比例PriceinthousandsWheelbase111.8851.000.0E,0E2.115■4.05-1,94,94212.3471.000@0;.002:.150■4.351.01..9.7.013.003-33.412.99.00.99a.因变量:Log-transformedsales袈差领汁量日极小值均值标荏偏差N-;245405.64204:'3^9052.8685121^5'标准预测值-4.0452.693.002.9明155预测值的标准误差.0醐.354130.057155调整的预测值-.440425.6^214.:3以89皿.874840155-蜜差-4.9711U2.327782.005131..99S146155标准残差-4.9052.297.005.9551抽’Student化残差-4.9502.307..:.99f4155-已删除的残差-5.0631552:.34S876.0065801.01741.3155Student化已咧[除的残差-5沥2.341.0021.016155'Mahal距蔑.00117.4161.-96434231^5'如咔的距富.000:151.000:.ov155居中杠杆值.000.115.01'3.023散点图Log-transformedsales82.674.97Q71.0269.725°O85.517.51313.10831932039(^6.13515.3534.&峥.臾5罪乃*支牛洗猝眺16.53526.93520.2321.41°O°12.05髀朔甲82.674.97Q71.0269.725°O85.517.51313.10831932039(^6.13515.3534.&峥.臾5罪乃*支牛洗猝眺16.53526.93520.2321.41°O°12.05髀朔甲.693®JI.^579922.19519.46舞。葺^22.512131518.575°16.2425.345017.5。。10.B3519.04519840

16.08

14.299.9档毓串%◎靠此IW自45.5Q19播.6245.70569.749.9133424.4046.305%10.14525.45OToT2SPSS-回归一多元线性回归结果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:结果分析1:

输入/醵去的爽量彳模型输人的查量移去的变量方法1Priceinthousand^步进f准则;F-to-enter的翻率<=.050矿F-tc-remov/e的概率=2Wheelbase步迸《准则;F-to-enter的翻率<=.050厂F-to-remov/e的概率』1C0)-a,因变量:Log-transformedsales由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“priceinthousands"建立了模型1,紧随其后的是“Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除模型汇总。摸型RR方调整R方标准恰计的误差1,552a.304::^001.1155347,655b.4-30.4221.013572白.预测变星:(常量LPriceirithousarids.^:b.福棚变量常量Phceinthousands,-Wheelbase十q.国变爽:Log-transformedsales模型平方和df埠方FSig.1回归817'2018172065.B70,ooad残茬185.6621501.244总计'265.3S3_1.51Z回归115.311257.65656.1'22,ooab残差153.0721491.027总计'265.3S31.51顼测变星:(常量盖Priceinihoijsands®预剜变量:t信量Priceinthousands,Wheelbase"■£-.囱娈量:Log-transformedsale's结果分析:1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2拟合优度来看,模型2的拟合优度明显比模型1要好一些(0.422>0.300)2:从“Anova”表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和二回归平方和+残差平方和,由于残差平方和(即指随即误差,不

可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,3:根据后面的“F统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。巳徘隆的变量乞模型BetaInSig:...偏相关共线性统计星容差曳IF最小容差1Vehicletype1S54.000.301.9901.002.990Engine-.gize:342a4.1218.血..320.6111.636.611Horsepower.2673)。笠.U41..167.293.3.417.29.3Wheelbase.356^5.71-8:obo-.424.孙1:012.90S车宽,2443'3.517.&I1.277:0921.1-21.092车长,308a479J0...WO;..365部'1.025.976车净重,346a4.&00:obo-.353.722■1.3S57^2Fuelcapacity,266a■3:6S7.血一一血•.8我1.219.-.020耗油量:迈J升-.19驴-2.58.4RT1<207.758.7582Vehicletype.1狎1.925.056.157.&35■1:197.027Engine-.gize,145bi:.576.117'一一1:拓2.246.445Horsepower,028b'.229.819..019.256.3.91.0;.256车宽-,025b--.275.7&4-.023':4701.126.470车长,02>b.237•面3一一口由3.44.9.290车净重,105b,^U&;..084.365\2.741.365Fuelcapacity,002b.024.931.002:44-32处9.443耗油量:迈饼,014b■.164由布..014:,5591.790.559模型中的预测变量:(常量Priceinthousands“粮型中的预福变量:(常量"PNreinthousands.Wheelbase*医]变量:Log-transformed^ales结果分析:1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。

系歉模型非标准化系数标准系数专^ig:.共线性统计量B标准误差试用版容差VIF1:嫦量)4.684.1.94/24.090.000Priceinthousands-.051.006":-.552■/8.:104.0001.00Q1.0002(常量)1.151.116Priceinthousands-.055-.590•遇,4折.000.90S1.0UWheelbase.061.011.356■5.7T8_.000•一顷i.ona.因变量:Log-transformedsales从“系数a”表中可以看出:1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距但是,由于常数项的sig为(0.116>0.1)所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大共线性诊断m模型维数特宙直条f牛索引方差比例PriceinthousandsWheelbase111.8851.000.06.062.115■4.05-1,94,94212.8471.000j均.002:.1504.351.01..97.013.003-33.412.99,0C.99a.因变量:Log-transformedsales或差筑汁量日极小值彼大值均值标茴偏差N预洌值-;245405.64204.:哉9CI52.8685121^5'标准预测值-4.0452.693.002.934伯5预测值的标准误差.唳.354130.057155调整的预测值-.440425.6^214-凸以8如了.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论