版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 多元回归分析v在许多经济问题中,一元线性回归只不过是回归分析中的一种特例,它通常是对影响某种经济现象的许多因素进行了简化考虑的结果。v若某公司管理人员要预测来年该公司的销售额y时,研究认为影响销售额的因素不只是广告宣传费x1,还有个人可支配收入x2,价格x3,研究与发展费用x4,各种投资x5,销售费用x6.v因此我们需要进一步讨论多元回归问题。v第一节 多元线性回归v第二节 可化为多元线性回归的问题v第三节 曲线回归v第四节 逐步回归v第五节 岭回归v推荐阅读第一节 多元线性回归v Yi= b0+b1x1i+b2x2i+bpxpi+i Y1=b0+b1x11+b2x21+bpxp1+
2、1 Y2=b0+b1x12+b2x22+bpxp2+ 2 Yn=b0+b1x1n+b2x2n+bpxpn+ n v令 y1 1 x11 x21 xp1vY= y2 x= 1 x12 x22 xp2 yn 1 x1n x2n xpn b0 1 b1 2vB= e= bp nv则 Y=XB+ev一、多元线性回归模型的基本假定v解释变量x1,x2,xp是确定性变量,不是随机变量,而且解释变量之间互不相关v随机误差项具有零均值和同方差 E( i)=0 var( i)=E( i -E( i)2=E( i)2=2v随机误差项在不同样本点之间是相互独立的,不存在序列相关 cov( i, j)=0 ij i,
3、j=1,2,n cov( i, j)=E( i -E( i)( j -E( j) =E( i j) =E( i )E( j) =0 v v随机误差项与解释变量之间不相关 cov(xi, i)=0v随机误差项服从零均值,同方差的正态分布 iN(0,2)v二、建立回归方程v设v令 即pip2i21i10pip2i21i10ixbxbxbbxbxbxbb Yiiiiyyy02bQQi020202110111011100pipipiipipipiipipiixxbxbbybQxxbxbbybQxbxbbybQ0202021piiiiixx0001piiiiixx0002211112211121pnnp
4、pnnnxxxxxx000111212111211npnppnxxxxxx0exeXXBXYXeXBYYXXXBYXXBX1v三、多元线性回归模型的建模方法v1.打开文件或新建文件v2.Analyze regression liner 3.建模方法 (1)enter:强迫进入法 (2)stepwise:逐步选择法 (3)remove:强迫消除法 (4)backward:向后剔除法 (5)forward:向前引入法v 回归统计量 (1)estimates:显示回归系数及相关的指标 (2)confidence intervals:显示未标准化回归系数的置信区间 (3)covariance matr
5、ix: 未标准化回归系数的方差协方差矩阵 (4)model fit:模型检验v 回归统计量 (5)R squared change (6)descriptive:显示变量的均值、标准差等 (7)Part and partial correlations: (8)collinearity diagnostics:共线性诊断 (9)Durbon_waston:D.w.检验统计量举例(一)v根据我国某地区乡镇企业总产值、从业劳动者人数和固定资产原值的历年资料,求回归方程。(总产值- y,从业劳动者人数-x1,固定资产原值-x2)v(数据见spssex/例子1))555. 5()232. 7()326
6、. 8(2207. 11544. 0546.1353xxyC Co oe ef ff fi ic ci ie en nt ts sa a-1353.546162.576-8.326.001.544.075.5777.232.0021.207.217.4435.555.005(Constant)X1X2Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Ya. 举例(二)v卫生陶瓷是我国住宅建筑、饭店、宾馆、医疗卫生、体育、办公设施等建筑必不可少的卫生设备。
7、合理地发展卫生陶瓷生产是国民经济的需要。卫生陶瓷产量y与城镇住宅建筑面积x1,医疗卫生机构建筑面积x2,办公室建筑面积x3有关。试根据历史资料建立回归方程。v(数据见spssex/例子2) Y=0.488+0.576x1+4.769x2-2.145x3 (4.245) (2.404) (-2.111)CoefficientsCoefficientsa a.4882.218.220.829.576.136.8034.245.0014.7691.983.4702.404.029-2.1451.016-.416-2.111.051(Constant)x1x2x3Model1BStd. ErrorUn
8、standardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: ya. 举例(三)v在研究国家财政收入时,我们把财政收入按收入形式分为各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y为因变量。自变量如下:x1工业总产值,x2农业总产值,x3建筑业总产值,x4人口数,x5社会商品零售总额,x6受灾面积v(数据见spssex/例子3) Y=-13534.1+0.209x1-0.06x2+0.7
9、63x3+0.141x4-0.855x5+0.227x6 (3.292) (-0.416) (2.341) (2.703) (-2.932) (2.595)C Co oe ef ff fi ic ci ie en nt ts sa a-13534.15138.920-2.634.039.209.0631.8043.292.017-.060.144-.149-.416.692.763.326.9132.341.058.141.0521.0622.703.035-.855.292-2.644-2.932.026.227.088.1822.595.041(Constant)x1x2x3x4x5x6M
10、odel1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: ya. v五、回归方程的效果的检验v方程显著性检验v参数显著性检验v拟合优度检验(复相关系数、偏相关系数)v对假设理论的检验v链接v例2中,方差分析表为: ESSRSSTSSyyyyyyxebxebebxbxbbeyeyeyyeyyyyyyyyyyyyyyyyyyyyiiiiipiipiiipipiiiiiiiiiiiiiiiiiiiiiii22211011022202yyyyyA AN NO OV VA
11、Ab b803.8163267.93920.939.000a204.7341612.7961008.55019RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), x3, x1, x2a. Dependent Variable: yb. v1.方程显著性检验(F检验)vF检验是以方差分析为基础,对回归总体线性关系是否显著的一种假设检验,是解释模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著的方法v利用F统计量进行总体线性显著性检验的步骤如下: (1)提出关于P个总体参数
12、的假设 H0:b0=b1=b2=bp=0 (2)构造统计量 (3)检验 给定显著性水平,查F分布表 若FF,拒绝H0,表明回归总体有显著性关系. 若Ft /2,说明拒绝原假设若tregression-linearvPlot子对话框中选Histogram或p-p图v返回残差序列的随机性分析:v可以绘制残差序列和对应的预测值序列的散点图。如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机地分布在经过零的一条直线上下。v在线性回归Plots对话框中的源变量表中,选择SRESID(学生氏残差)做Y轴,选ZPRED(标准化预测值)做X轴v返回残差序列的独立性分析:v分析残差序列是否存
13、在后期值与前期值相关的现象。vD.W检验v返回样本奇异值的诊断:v样本奇异值是样本数据中那些远离均值的样本数据点。它们会对回归方程的拟合产生较大偏差影响。v一般认为,如果某样本点对应的标准化残差的值超出了-3+3的范围,就可以判定该样本数据为奇异值。vAnalyze-regression-statistics-case diagnosticsv返回异方差诊断:v线性回归模型要求残差序列服从等方差的正态分布v一般通过绘制SRESID与因变量预测值的散点图或计算SRESID和因变量预测值间的相关系数。v如果残差序列和预测值的平方根成正比例变化,可以对因变量作开方处理;如果残差序列与预测值成比例变化
14、,可以对因变量取对数;如果残差序列与预测值的平方成比例的变化,可以对因变量求倒数。v还可以用WLS法消除异方差。v返回v七、预测和控制v所谓预测就是给定解释变量x样本外的某一特征值x0=(1,x10,x20,xp0),对因变量的值y0以及E(y0)进行估计。v1、y0的点预测:v2、y0的(1-)的预测区间:000bxby,020200yyStyStyv例例5 继例1,预测从业劳动者为3000万人,固定资产原值为400亿元时该地区的总产值,并给出=0.05时的预测区间.v返回v例6 中国民航客运量的回归模型.为了研究我国民航客运量的变化趋势及成因,我们以民航客运量作为因变量y,以国民收入、消费
15、额、铁路客运量、民航航线里程、来华旅游入境人数为影响民航客运量的主要因素。Y-民航客运量(万人),x1-国民收入(亿元),x2-消费额(亿元),x3-铁路客运量(万人),x4-民航航线里程(万公里),x5-来华旅游入境人数第二节 可化为多元线性回归的问题在自然科学中,y关于x 的数量关系多数都不是简单的线性关系,而是各种各样的非线性关系,于是我们常会遇到非线性回归模型,在非线性回归模型中,一种类型是可以通过变量变换化为线性模型,然后按线性模型加以解决;另一种类型的非线性模型是用任何变量变换办法都不能或不方便直接化为线性模型求得参数的估计值。v多项式函数vY=0+ 1x + 2x2+ + pxp
16、v设i=xiv则多项式化为: Y= 0+ 1 1 + 2 2 + + p pv多元幂函数 y=x1 1 x2 2 xp p lny=ln + 1ln x1+ pln xp 令z= lny, 0= ln ,i= ln xi z= 0 + 1 1 + 2 2+ + p pv指数函数 y=ae ixi y=a+ 1x1 + 2x2+ + pxp z= y, 0= a,则 z= 0 + 1x1 + 2x2+ + pxpv多元对数函数 y=a+ 1x1 + 2x2+ pxp 设i= xi, 则 y=a+ 1 1 + 2 2 + p p v指数函数与幂函数的积 y=aexp ixi xibi y=a+ 1
17、x1 + 2x2+ + pxp +b1x1 +b2x2+ +bpxp 令z= y, 0= a,i= xi z= 0 + 1x1 + 2x2+ + pxp +b1 1 +b2 2+ +bp pv例7 某企业在15年中每年的年产量x和总成本y,试建立y对x,x2和x3的多项式回归方程.(数据见spssex/例子7)v如果自变量相邻数值之间大小间隔相等,而且相邻样本点对应的因变量y的二次差分大致相同,则该总体可配合二次多项式函数v如果是三次差分大致相同,则可配合三次多项式函数v例8 根据某地1985-1993年间农产品收购额,建立回归方程.(数据见spssex/例子8)0246810 x200.00
18、300.00400.00500.00yMODEL: MOD_2.Independent: x Dependent Mth Rsq d.f. F Sigf b0 b1 b2 y QUA 1.000 6 202698 .000 178.095 5.2238 3.8810v返回v例9 某制造厂表面处理车间试验将铬后污水同电解污泥混合,使之生成无毒溶液,效果很好.但实际排出污水的浓度不完全相同,而且一定浓度的定量铬后污水只有同定量的电解污泥混合后,才能反应完全.现通过试验,找出铬后污水用量与电解污泥用量之比对于铬后污水浓度之间的关系.(spssex/例子9)第三节 曲线回归vAnalyze-regre
19、ssion-curve estimationvLinear: y=b0+b1xvQuadratic: y= b0+b1x+b2x2vCompound: y=b0b1xvGrowth: y=e(b0+b1x)vLogarithmic: y= b0+b1lnxvCubic: y= b0+b1x+b2x2+b3x3vS: y=e(b0+b1/x)vExponential: y=b0eb1xvInverse: y=b0+b1/xvPower: y=b0 xb1vLogistic: y=1/(1/u+b0b1x)v返回第四节 逐步回归v在多元线性回归中,最难的是如何选择自变量的问题,如果自变量选的太少,
20、则自变量对Y的决定系数太小,导致过大的偏差,如果把与Y有关的自变量都选入是不可能的,一般来讲,选的自变量愈多,ESS愈大,然而多个自变量中有相当一部分对Y影响不显著,反而会因自由度的减少而增大了误差。另外,多个自变量间的相关会给回归方程的实际解释上造成麻烦,即多重共线性的影响。因此我们提出最优方程的概念,要求进入回归方程的自变量都是显著的,未进入回归方程的自变量都是不显著的。v一、“最优”回归方程的选择v1.回归方程中包含尽量多的信息v2.回归方程中包含尽量少的变量v方法:v逐步剔除的回归分析方法v逐步引入的回归分析方法v“有进有出”的回归分析方法(逐步回归分析方法)逐步剔除法(backwar
21、d)v1、用全部变量建立一个回归方程v2、对每个变量进行检验,剔除偏回归平方和最小的变量。v3、对剩余变量再作回归,再检验v直至方程中没有可剔除的变量为止。逐步引入法(forward)v1、将所有自变量分别与因变量建立一元线性回归方程,比较各自的回归平方和,将回归平方和最大的变量引入回归方程。v2、再分别将剩余变量与因变量y、及已引入的变量建立二元线性回归方程,再比较回归平方和,选择回归平方和最大的变量引入方程。v直至方程检验不显著为止。v“逐步剔除”法与“逐步引入”法都有明显的不足之处: (1) “逐步剔除”法计算量大,且一旦某个自变量被剔除,没有机会重新进入方程. (2)“逐步引入”法一旦
22、引入某个变量,就不再改变.逐步回归法(stepwise)v1、将所有自变量分别与y建立一元线性回归方程,将偏回归平方和最大及通过显著性检验的变量引入方程。v2、将剩余变量再分别与y、及已引入方程的变量建立二元回归方程,并检验方程,剔除不显著变量。vv二、偏回归平方和v设s回是p个自变量x1,x2,xp所引起的回归平方和,si回是p-1个变量 x1,x2, x i-1,x i+1,xp所引起的回归平方和,那么它们的差 Qi=s回-s i回,Qi称为自变量xi的偏回归平方和), 1(2dfFdfRSSQFabQiiiiiv在回归计算的某一步需要引进的变量应该是所有未进入回归方程的变量中最显著的一个,也就是偏回归平方和最大的一个。)2, 1 (1) 1() 1(1lnFlnRSSQFllk引v三、逐步回归分析方法的应用v如果要在回归方程中剔除不显著的变量,则首先应从已引入的变量中剔除对因变量贡献最小的,也就是偏回归平方和最小的一个变量。v设模型中已引入L个自变量, xi的偏回归平方和为Qi(L),再假设偏回归平方和最小的变量为xk,作检验为: ) 1, 1 (1)(lnFlnRSSQFllk剔 举例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年上饶幼儿师范高等专科学校单招综合素质考试必刷测试卷及答案解析(名师系列)
- 2026年上海立信会计金融学院单招职业适应性测试题库及答案解析(夺冠系列)
- 2026年宁夏中 卫 市单招职业倾向性考试必刷测试卷带答案解析
- 关于XX公司2025年度行政工作的报告
- 2020-2025年教师资格之中学教育知识与能力题库检测试卷A卷附答案
- 2026年航空货运合同范本
- 2026年健康食品订购合同
- 中学物理课程实训教程 课件全套1-12 中学物理教学设计概述 - -第十二章 立足学生核心素养践行学生自主创新实验的研究
- 毕业论文正文行距
- 绘本成人毕业论文
- 2025年师德师风考试题库及答案
- 口腔临床诊疗指南
- 排污许可证审核及环境应急管理服务方案投标文件(技术方案)
- 新版GSP冷藏冷冻药品管理培训培训课件
- 2025年高中生创新能力大赛试题
- 管理会计苹果公司案例
- DBJ50-T-200-2024 建筑桩基础技术标准
- 手动葫芦吊装施工方案1
- 剑龙教学课件
- 餐饮门店管理培训课件
- 精馏塔课件完整版本
评论
0/150
提交评论