多重线性回归分析1.ppt_第1页
多重线性回归分析1.ppt_第2页
多重线性回归分析1.ppt_第3页
多重线性回归分析1.ppt_第4页
多重线性回归分析1.ppt_第5页
免费预览已结束,剩余67页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、14336011,1,例11-1为了研究大气污染物一氧化氮(NO)的浓度是否受汽车流量、气候状况等因素的影响,选择了24个工业水平相似的城市的交通点,统计了单位时间的科举汽车数(千台),并在低空同一高度测量了该期间的平均气温(),14:11,也就是说,您必须将包含一个引数的简单线性回归方程式扩展到包含多个引数的多重线性回归方程式。14:11,5,根据研究的目的和收集的数据,如何定量说明单位时间内科举汽车数(千台)、气温(%)、空气湿度(%)、风速(m/s)牙齿空气中一氧化氮(这些因素对一氧化氮浓度的影响)?对一氧化氮浓度影响最大的因素是什么?哪些因素影响最小?利用这些影响因素预测空气中的一氧化

2、氮浓度,如何预测呢?效果怎么样?14336011,6,多线性回归分析,14336011,7,多线性回归分析,基本概念多线性回归模型多线性回归应用结果报告案例分析电脑实验摘要,14336011,8,了解目标要求,多线性回归概念,部分回归系数和标准化部分回归系数确定部分回归系数计算方法熟悉多线性回归模型的前提条件。熟悉部分回归系数和多线性回归模型的假设检验,自变量的过滤原则和方法。掌握复杂相关系数和晶体系数的概念。掌握SPSS计算结果的说明。理解统计内容报告及中文和英语表达。14:11,9,1,基本概念,多线性回归:重要且经典的多元分析方法是简单线性回归方法的扩展。使用回归方程定量描述变量Y和多个

3、收购之间的线性相关性。多线性回归只涉及一个因果变量,因此被称为一元线性回归模型。如果模型包含多个因素变量,则称为多线性回归或多线性模型(multivariate linear model)。14:11,10,收购过滤和最佳模型:交互:如果一个参数和一个参数的线性关系随另一个参数的值而变化,我们说牙齿两个收购之间存在交互或交互。交互效果也称为“修改效果”(effect modification)。14:11,11,2,多线性回归模型,回归方程回归系数的估计回归方程的假设检验回归系数的假设检验变量筛选,14:11,12,bj,BJ为收购Xj的部分回归系数标准化部分回归系数bj较大的参数对反应变量Y

4、有很大影响。14:11,14,2.2回归参数估计:前提条件:行。最小平方(least square method)。基本原则是使用观察或收集的收购和参数的数据集,建立与参数相关的收购线性函数模型,使牙齿模型的理论值和观察值之间的误差平方和尽可能小。,14:11,15,根据最小二乘法原理,使用统计软件、样例数据与收购交通流(X1)、气温(X2)、奇袭(X3)和风速(X4)空气中的一氧化氮(y)匹配,即牙齿回归方程作为整体描述的回归方程的效果是什么?也就是说,四个牙齿的自变量能解释反应变量变异的比例是多少?所有四个参数都影响反应变量吗?也就是说,与每个部分回归系数对应的整个部分回归系数为零?14:

5、11,17,2.3回归方程的假设测试总体上牙齿回归方程有意义吗?应用方差分析,14:11,18,表中的P值小于0.001,根据0.05的检查级别,可以拒绝H0,并且可以认为设置的回归方程有意义。由四个牙齿参数组成的回归方程,说明空气中一氧化氮浓度的变化是有意义的。14:11,19,2.4确定系数的计算回归方程的效果是什么?与简单线性回归一样,在方差分析表的计算结果中,可以计算出决定系数,反映回归方程的效果好坏。14:11,20,说明交通流、气温、奇袭、风速等四个茄子因素可以说明一氧化氮浓度约80的变化,可以认为回归效果很好。14:11,21,确定系数平方根的复相关系数复相关系数表示随机变量和随

6、机变量集之间线性相关的程度,其值介于0-1之间。复合相关系数也可以表示为结果变量的实际观测值和线性估计的简单相关系数,14336011,22。决定系数的缺点:如果立即向回归方程添加对反应变量贡献很少或贡献不大的参数,那么决定系数的数字也会随着收购数的增加而增加。调整后的决定系数:在回归方程中添加对反应变量贡献很小或贡献不大的参数时,调整后的决定系数可能会变小,而不会增加。14:11,23,对于牙齿,14336011,24,打开曹征确定系数的平方根,调整后的多点相关系数,rad,11通常测试为整个部分回归系数0检查的假设为H0:i=0H1:I0=0.05,14336011,26,检查统计信息,S

7、bi是I的第一部分回归系数的标准错误,14336011,27,2.6变量过滤,14336011,28误差平方和(SSE)减小和确定系数(R2)增大,14336011,29,2。误差均方(MSE)减小和曹征确定系数(Ra2)增大,14:11,30,3。统计:牙齿统计由Mallows提出。牙齿标准的整体意义是Cp小,接近模型的参数数。14:11,31,收购过滤的一般方法,前进方法;逆作法;分阶段方法(stepwise regression);最佳子集方法选择所有可能的收购子集(optimum subsets regression)。14:11,32,大多数统计软件可以通过“部分回归平方和”(par

8、tial sum of squares for regression)具体阈值的检查来判断。14:11,33,例如,判断引数是否可以引入到目前方程式中,如下所示:H0: P引数好,H1: P引数好,=0.05检查统计资料,14336011,34,前进法引数一个或多个引数。可以将部分回归平方和最大化,将拒绝F检查H0选为第一个收购(引入边界F,引入F最大F)。然后将其馀变量的部分回归平方和设置为最大值,选择F检查拒绝H0作为第二个参数。这样,在不能再拒绝H0之前,将继续引入新参数。前进方法仅考虑模型外部的变量是否可以引入模型中。14:11,35,后退法参数从方程中删除一个或多个。首先,对所有候选

9、变量执行总回归,一次消除一个部分回归平方和最小值,以使F检查无法再消除之前无法拒绝H0(消除边界F,消除F最小F)。“后退”方法仅考虑模型中不符合要求且需要删除的变量。14:11,36,逐次法应考虑结合牙齿两种茄子方法,在今后引进的每个步骤后,从已经引入方程的变量中消除不足。预定义了两个边界f的引入和f的去除(f的引入f的去除),在等式外候选变量的部分回归平方和最大f值大于f的引入时引入该变量。当进入回归方程式的变数的部分回归平方和最小值F值小于或等于F移除时,移除该变数。这样引进和去除交替进行,直到方程外没有引入变量,方程内也没有变量可以删除为止。调整F导入和F剔除会影响变量筛选结果。要引入

10、很多相关变量,可以减少f的引入。如果要少引入相关变量,可以增加f删除。14:11,37,对于具有最佳子集方法P参数的线性回归问题,所有可能的收购子集回归方程为2p-1。根据变量选择标准比较每个子集符合程度,选择一个或多个最佳回归,称为“最佳子集回归”。您还可以预先指定子集中出现的最小(或最大)收购数,然后在所有可能的收购子集范围内实施“最佳”子集选择。牙齿收购选择方法仅适用于收购数量不多的情况。14:11,38,为相同数据选择的上述四种茄子方法的参数不一定相同,也可能是“最佳子集”。如果参数很多,用统计方法选择变量只是粗糙的体,不能作为定论,也不能代替与问题相关的专门知识。回归之前,必须用专业

11、知识梳理收购,明确直接因素和间接因素、主要因素和辅助因素,以及变量之间的相互联系,眉毛胡须抓一把渡边杏。通过模型的过滤和专门知识的解释,可以找到满足统计要求的同时能用专门知识更好地解释的模型。这是实际工作人员想要的“最佳模型”。14:11,39,14336011,40,3,多线性回归应用节目,生物医学中多线性回归应用节目先决条件和残差分析多重共线性虚拟变量设置交互效果,14:11,41,生物医学中多线性回归应用节目3360定量过滤反应变量设置危险因素。通过容易测量的变量估计难以测量的变量。解释变量以预测反应变量。用反应变量控制分析变量。14:11,42,前提和残差分析,14336011,43,

12、残差分析发现数据不满足线性、正则、方差均匀性等假设的情况下,常用的处理方法是在不满足线性条件的情况下考虑修改模型或采用曲线拟合。如果正则性、方差均匀性等假设不成立,则通常考虑数据的变量转换。这些变换可用于收购、反应变量或两者。如果关于方差均匀性的假设不成立,则可以使用其他方法估计部分回归系数。例如,可以使用加权最小二乘法估计部分回归系数。具体原理参考其他专着。14:11,44,如果多重共线性:参数都是随机变量,则它们之间是高度相关,则收购之间是多重共线性。协方差风险:使回归系数估计变得非常不稳定,回归参数估计的标准误差大,非常重要的参数在统计上没有意义,不能进入方程。严重的时候,样本回归系数也

13、很大,但可以是正数和负数,其专业意义无法解释,出现悖论。(威廉莎士比亚,哈姆雷特,现译),14:11,45,金凤(1991)牙齿的例子。胎儿受精年龄(Y,周)和胎儿外形测量指标:体长(X1,cm),头部周长(X2,cm),体重(X3,G)数据22例。求y的回归方程是14336011,46,多重共线性处理。删除变量:从关联性强的变量中删除测量误差大的变量、缺少数据多的变量、专业意义不重要或其他方面不满意的变量。主成分回归方法(见第21章)。山脊回来。14:11,47,虚拟变量的设置:参数可以是连续变量(例如年龄、血压等)或2分类变量(例如性别),对于顺序变量(例如肿瘤的分期、治疗效果等级等)和无

14、序的多分类变量,必须首先转换为多种,14:11,48,例11.3血型是无序的多分类变量,“值”是4个A,B,AB,O,可以用3个2分类变量来说明。14:11,49,交互效应:估计多个线性回归中两个参数的交互作用最直接的方法是引入一个新参数,它是可能存在交互作用的两个参数的乘积。两个收购之间的交互称为第一次交互(first-order interaction),三个收购之间的交互称为第二次交互(second-order interaction)。14:11,50,根据结果报告,多线性回归模型的分析结果应包括以下内容:确定用于多线性回归分析目的分析的收购和反应变量。确保数据满足多线性回归先决条件。拟合线性模型的方法,过滤参数的方法收购之间是否有共线性,分析是否考虑收购之间的相互作用,数据是否有异常值最终确定的模型,反映模型拟合效果的统计量最后,经常使用表格来总结分析结果。14:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论