第二十一章 多重回归与相关.doc_第1页
第二十一章 多重回归与相关.doc_第2页
第二十一章 多重回归与相关.doc_第3页
第二十一章 多重回归与相关.doc_第4页
第二十一章 多重回归与相关.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十一章 多重回归与相关第二十一章 多重回归与相关(Multiple regression and correlation)一基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度、饮食习惯、吸烟状况、家族史等因素的影响。多重回归与多重相关是研究一个因变量和多个自变量之间线性关系的统计学分析方法。1多个自变量与一个因变量的数量关系多重回归2多个自变量与多个因变量的数量关系多元回归3多个变量与一个变量的相关关系 多重相关4多个变量与多个变量的相关关系典则相关5扣除其它变量影响后一变量与另一变量的相关关系部分相关本章仅讨论多重线性回归、多重线性相关和部分线性相关。二多重线性回归模型与参数估计:(一) 多重线性回归模型:设观察了n个对象,每个对象观察了因变量Y和p个自变量,模型表达式: EMBED Equation.3 样本回归方程: EMBED Equation.3 0(a)为截距,1,2,p(b1,b2,bp)为偏(部分)回归系数,i(bi)表示除Xi外的其他自变量固定时,Xi改变一个单位后Y的平均变化。标准回归系数:偏回归系数因各自变量值的单位不同不能直接比较其大小,对变量值作标准化变换,得到的回归系数为标准回归系数,可直接比较其大小,反映各自变量对因变量的贡献大小。(二) 参数估计的方法: 最小二乘原则 EMBED Equation.3 最小。对方程中的每个待估参数求导并设导数为零,得到一组线性方程组。由于是线性方程组,可以直接求解。具体的计算复杂,手工计算几乎不可能,一般需要计算机软件完成。例:重庆医科大学附属第二医院的资料,住院人数与门诊人数、病床利用率和病床周转次数的回归关系分析。参数估计如下:变量回归系数标准误tPIntercept-4916.063131.09-1.570.136门诊人数X1 57.16 17.923.190.006病床利用率X2 29.40 39.150.750.464病床周转次数X3 285.84 86.473.310.005三多重回归的假设检验:1. 回归方程的方差分析:检验假设:H0: EMBED Equation.3 H1: EMBED Equation.3 不全为0。 EMBED Equation.3 (2)计算统计量F值: EMBED Equation.3 SST=36528242SSr=SST-SSe=36528242-9303815=27214427 EMBED Equation.3 (3)确定概率和判断结果:自由度分别为3和16,p0.01,拒绝零假设,回归贡献有统计学意义。2. 回归系数的假设检验:(1)检验假设:H0: EMBED Equation.3 H1: EMBED Equation.3 EMBED Equation.3 (2)计算统计量: EMBED Equation.3 (3)确定概率和判断结果:自由度为20-3-1=16,pF引入)开始,自变量由少到多逐个引入,使方程外有统计学意义的变量全部引入为止。 优点:计算量小。缺点:一次只能引入一个变量。2后退法(Backward): 开始全部引入,然后逐个剔除(偏回归平方和最小,FF剔除),使方程内无统计学意义的变量全部剔除为止。3逐步法(Stepwise):开始一个或全部变量引入,然后上述两种方法交替使用,引入变量后立即考虑是否要剔除,剔除变量后立即考虑是否要引入,直到方程内的变量全部有统计学意义,方程外的变量全部无统计学意义为止。较好的方法。五多重回归分析的主要用途:筛选有关变量(主要用途)。获得有实际意义的回归方程。六多重回归分析的一般步骤:单因子模型分析。逐步筛选变量,建立多因素模型。综合单因子和多因素模型的结果,当两者矛盾时,结合专业知识分析原因(因素之间是否存在拮抗或协同作用)。七多重相关和部分相关: 应用条件:同简单线性相关一样,仅当X1,X2, Y为多元正态分布的随机变量时才能考虑相关分析。1. 复相关系数(多重相关系数):多重相关的实质就是Y的实际观察值与由p个自变量预测的 EMBED Equation.3 值的相关。前面计算的确定系数是Y与 EMBED Equation.3 相关系数的平方,那么复相关系数就是确定系数的平方根。 EMBED Equation.3 2. 偏相关系数(部分相关系数):部分相关系数反映校正其它变量后某一变量与另一变量的相关关系,校正的意思可以理解为假定其它变量都取值为均数。(图22.1)计算公式: EMBED Equation.3 3. 偏相关系数的假设检验:用t检验。总体中扣除q个变量影响的偏相关系数为(-q),样本中相应的偏相关系数为r(-q)。检验假设:H0: (-q)0, H1: (-q)0可采用统计量: EMBED Equation.3 (n-q-2 偏相关系数的假设检验等同于偏回归系数的t检验。复相关系数的假设检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论