多重线性回归与多元逐步回归 统计学_第1页
多重线性回归与多元逐步回归 统计学_第2页
多重线性回归与多元逐步回归 统计学_第3页
多重线性回归与多元逐步回归 统计学_第4页
多重线性回归与多元逐步回归 统计学_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元线性回归、流行病学与健康统计系、多元线性回归分析中自变量的选择、多元线性回归的应用和注意事项、重复和线性回归分析是研究一个变量与其他变量之间线性关系的统计分析方法。在回归分析中,最简单的情况是模型只包含两个具有“依赖关系”的变量,一个变量(反应变量)随另一个变量(自变量)变化,并呈线性变化趋势,称为简单线性回归。给定x的值,y的值取平均值(y|x)附近,它对应于不同的x值。y的平均值位于直线-回归线上。y|x和x之间的关系可以用线性方程来描述。简单的线性回归方程,人口样本“Y帽子”代表估计值,当x给定时,人口平均值Y的估计值。线性回归方程的求解:最小二乘法原理,回归系数及其计算,寻找一条直

2、线使残差平方和最小,利用微积分知识,很容易得到线性回归分析的前提条件,即这条直线必须通过两点之和,线性反应变量Y和自变量X是线性变化的、独立的,且任意两个观测值相互独立。一个人的价值不受其他人的影响。当给定X时,Y为正态分布。当给定X时,Y的值服从正态分布的等方差,这意味着它对应于不同的X值,并且Y值的总体变化是相同的。将条件线图应用于线性回归有统计学意义吗?建立样本线性回归方程只完成了统计分析中两个变量之间关系的统计描述。这种关系在统计上有意义吗?检验回归模型是否有效:方差分析检验总体回归系数是否为零:t检验,案例1:一位研究人员研究了大气污染物一氧化氮(ppm)浓度与车辆流量(千辆)、空气

3、温度(千分之几)、空气湿度(百分之几)、风速(百万分之几)等因素之间的关系。结果如表1所示:单位时间内通过车辆的数量(千辆)如何定量描述这些因素对一氧化氮浓度的影响?哪个因素对一氧化氮浓度影响最大?哪个因素影响最小?如果用这些因素来预测空气中一氧化氮的浓度,该如何预测呢?它有多有效?第1节,多元线性回归,一个因变量为33,360,超过33,360个自变量的y,X1,X2,X3,Xp,方程:概述,多元线性回归(简称:)有超过:个因变量,超过:个自变量的Y1,Y2,X1,X2,X3,方程:多元线性回归方程,它是简单线性回归方程的一个扩展,它意味着当所有自变量都为0时的反应。是变量Xi的偏回归系数,

4、这意味着当方程中的其他自变量保持不变时,对于自变量Xi的每次增加(或减少),反应变量y平均变化一个单位。样本回归方程、反应变量y的总体平均值、估计值。b0、是一个常量项,也称为截距,是总体参数,bi是自变量Xi的偏回归系数,它是总体参数的估计值。如果根据交通流量()和风速()建立一个预测一氧化氮浓度(y)的线性回归方程,该模型可以写成:这意味着当风速在恒定交通流量的条件下增加一个单位(1m/s)时,估计空气中一氧化氮浓度将平均变化一个单位(ppm)。表13-1多元线性回归分析的数据格式、前提条件(直线)、多元线性回归分析步骤、回归方程的寻找-最小二乘原理假设检验-检验回归方程是否具有统计显著性

5、和模型是否有意义,然后分别检验各个偏回归系数。(3)变量选择用尽可能少的自变量更好地解释Y。基本原理:找到一组合适的偏回归系数(),建立多元线性回归方程,求出反应变量的观测值和回归方程的估计值,估计回归系数,找到回归方程。最小二乘法用于估计偏回归系数,残差平方和最小。SPSS实现方法:分析-回归-线性-y,选择相依x1,x2,X3.在建立样本回归方程后,我们必须首先检验回归方程是否有意义。也就是说,在、中,是否至少有一个自变量与y的总体均值呈线性关系?回归方程的作用是什么?也就是说,这四个独立变量能解释反应变量的变化的百分比是多少?所有四个独立变量都对反应变量有影响吗?也就是说,对应于每个偏回

6、归系数()的总体偏回归系数()是否等于0?考虑:回归:的目的当H0建立时,剩余误差:只能通过Y的平均值来估计。当自由度=H1建立时,给定值可以用于估计剩余误差:并且自由度=剩余误差减小。通过统计推断,这个回归方程在统计上有意义吗?这是回归模型的贡献,方差分析的基本思想,总变差:反应变量的观测值与平均平方的偏差被视为,它反映了观测值的可变性,而不使用自变量的信息,即一氧化氮浓度的变化,而不考虑交通流量、气温、空气湿度和风速等因素。根据回归方程,预测值和实际观测值之间的差值称为残差,残差的均方差之和为,它反映了回归无法解释的那部分变化,其自由度为,p为自变量的个数。回归平方和和的差值反映了回归模型的贡献,即交通流量、气温、空气湿度和风速对一氧化氮浓度的影响,其自由度表示为。表13-2方差分析表,表13-3方差分析表,用于检验回归方程的总体显著性,其中值小于0.001,可根据0.05的检验标准予以拒绝,建立的回归方程被认为是有意义的。用这四个自变量构建的回归方程来解释空气中一氧化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论