版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元线性回归分析与实验郑 德 强公 共 卫 生 学 院 2017年 6月 11. 多元统计分析指标量化法2. 多元线性回归分析方法与实验3. 多重线性回归实验练习目 录2掌握多元线性回归分析基本思想、分析方法;掌握多元线性回归分析的应用条件;学会使用SPSS软件进行多元线性回归分析;正确解释输出结果。学 习 目 的一个因变量与多个自变量间的关系儿童身高与年龄、性别的关系肺活量与年龄、性别、身高、体重以及胸围的呼吸差等因素的关系多元线性回归如构成线性依存关系在作各种多元统计分析时,除定量资料的指标不需要量化外,分类(包括名义性)变量需进行量化,其方法是:(1)二分类 如“性别(SEX)”这个变量
2、,我们不能将其取值“男(或M)”、“女(或F)”直接代入回归方程中去计算,因为它的具体表现不是数据而是文字和符号,而需要用“0”、“1”分别代替两种性别,此时,就说变量SEX是一个二值变量。 1.多元统计分析指标的量化法(2)无序多分类如:若设W代表血型变量,则W的状态就有4种情况,即W=A型、W=B型、W=AB型、W=O型。此时需引入3个哑变量。现假设以O型为基准,则3个哑变量X1、X2、X3可按如下方式来定义: A型X1=1、X2=0、X3=0; B型X1=0、X2=1、X3=0; AB型X1=0、X2=0、X3=1; O型X1=0、X2=0、X3=0。 一般情况下,若某定性变量有m个水平
3、,就需要引入m-1个二值的哑变量。 1.多元统计分析指标的量化法1.多元统计分析指标的量化法(3)有序多分类按照有序的顺序,从低到高(或从小到大)依次赋值:0,1,2,。 如:家庭月收入情况(元):50,50-,500-,2000,10000分为5个等级,可依次赋值为:0,1,2,3,4。 多元线性回归是研究多个自变量与一个因变量之间数量关系并用线性方程表示出来的一种统计方法。 2.多元线性回归分析与实验 设研究问题中含有p个指标变量 X1, X2, , Xp及Y, n个观察对象,其数据结构见表1。 表1 多元线性回归分析数据结构 编号 X1 X2 . XP Y 1 x11 x21 x1p y
4、1 2 x12 x22 x2p y2 3 x13 x23 x3p y3 n x1n x2n xnp yp多元线性回归数据结构通过实验测得含有p个自变量X1, X2, X3, , Xp及一个因变量Y的n个观察对象值, 利用最小二乘法原理, 建立多元线性回归模型: 其中b0为截距, b1 ,b2 , , bp称为回归系数. bi表示当将其它p-1个变量的作用加以固定后, Xi改变1个单位时Y将改变bi个单位。多元线性回归模型(1) 建立回归模型: (2) 预测预报 若已知X1, X2 , , Xp数值大小时, 通过模型可以预测Y 的值以及估计Y的变化范围;(3) 因素分析 找出对因变量Y 有影响的
5、因素。 多元线性回归分析方法多元线性回归分析方法 独立。n个个体之间互相独立; 正态。给定X1, X2, , Xp的数值后, 相应的Y值服从正态分布; 等方差。当X1, X2, , Xp的数值变动时,相应的Y有相同的方差。 多元线性回归分析适应条件多元线性回归适应条件(1) 采用最小二乘法原理确定方程中系数bi i=0, 1, 2, 3, , p; (2)采用F检验对回归方程整体进行假设检验;(3)采用t检验对方程中的每个系数bi进行假设检验;(4)结合专业给出合理的解释。 多元线性回归具体任务多元线性回归分析适应条件例1 测得10名女中学生体重x1(kg)、胸围x2(cm)、胸围呼吸差x3(
6、cm)及肺活量y(ml)的测量值列于下表。试建立体重、胸围、胸围呼吸差与肺活量的关系。一般多元线性回归分析实验N X1 X2 X3 Y 1 35 69 0.7 16002 40 74 2.5 26003 40 64 2.0 2100 4 42 74 3.0 26505 37 72 1.1 2400 6 45 68 1.5 22007 43 78 4.3 2750 8 37 66 2.0 16009 44 70 3.2 2750 10 42 65 3.0 2500操作过程:Analyze-Regression-Linear-Y选入Dependent-X1、X2、X3选入Independent-o
7、k复相关系数调整后的R2决定系数反映模型的拟合优度情况估计的标准误因此,所求的多元线性回归方程为:在多元线性回归分析中是将全部自变量与Y 建立回归方程,当考虑的自变量很多时,常常存在许多对因变量影响无统计学意义的变量,它们的存在一方面增加了模型的复杂性, 另一方面影响模型的效果。因此多元线性回归分析时,要进行变量选择,将与回归方程无关的变量从模型中剔除。从而优化回归模型。多元线性回归变量选择 向前法(forward selection) 开始回归方程中没有变量,自变量由少到多一个一个引入回归方程。按自变量对因变量的贡献(P值的大小)由大到小依次挑选,变量入选的条件是其P值大于规定进入方程P界值
8、Entry, 缺省值为0.05。筛选变量方法 向前法优点: 计算量小; 容易找到单独效果好的变量。 缺点: 只选进不选出; 一次只能引入一个自变量, 若两个变量在一起时效果好, 单独一个却效果不好, 这样的变量便无机会被选中。 开始变量都在方程中,然后按自变量因变量的贡献(P值的大小)由小到大依次剔除,变量剔除的条件是其P值小于规定的剔除标准Removal, 缺省值 为0.1。 后退法优点: 1次能引入多个自变量,若两个变量在一起时效果好容易被选中。 缺点:只选出不选进。 筛选变量方法 后退法(backward selection) 将前进和后退两种方法结合起来,既考虑引入变量又考虑剔除变量。
9、 有两个界值, Entry , Removal筛选变量方法 调试法: Entry , Removal常取0.5,0.1,0.05。一般实际用时,应多次选取调整。 逐步回归法(stepwise selection)操作过程:Analyze-Regression-Linear-Y选入Dependent-X1、X2、X3选入Independent-Stepwise-options-okSPSS实现逐步回归步骤(1)拟合的回归方程在总体上有统计学意义(2)决定系数R2 亦称复相关系数 R2 =1-SS残/SS总= SS模/SS总, 它表示在因变量y的总变异中可由回归方程所解释部分的比例。 0R21,
10、越接近于1, 说明回归方程效果越好。(3)回归系数在专业上有意义线性回归模型评价 决定系数是随方程中的变量个数增加而增加的,为了克服这一缺点,对它进行校正 Adj R2 =1-MS残/MS总,0AdjR21, 越接近于1, 说明回归方程效果越好。 例2 某医科大学教授收集了某医院在1994年1月2002年7月期间收治的脑卒中患者462例的病历,选取了以下8个变量:年龄x1、性别x2、住院天数(LOS, Length of stay)x3、病变类型(梗塞或出血)x4、病变部位(左侧或右侧)x5、入院时的ADL值(ADL入院 )x6、发病到入院康复治疗的间隔时间x7、出院时的ADL值(ADL出院)
11、Y。应用多元线性回归分析,探讨出院时的ADL值y与7个自变量x1-x7间的联系性。 日常生活活动(activities of daily living,ADL)是人在独立生活中反复进行的、最必要的基本活动。脑卒中后患者的ADL能力会受到不同程度的影响,给家庭和社会带来了巨大的负担。操作过程:Analyze-Regression-Linear- ADL值y选入Dependent-x1-x7选入Independent-options-ok专业结论: 出院时的ADL值主要由年龄x1、住院天数x3、入院时的ADL值x6、发病到入院康复治疗的间隔时间x7决定,结合具体资料可知:年龄较小、住院天数多、入院
12、时功能状态好、尽早进行康复训练或治疗的患者,预期的结局越好。练习1. 数据在例题2文件中,有29名儿童血液中血红蛋白(Y)与钙、镁、铁、锰和铜的含量的数据,用多重回归方法筛选对血红蛋白(Y)有影响的微量因素。要求:(1)写出回归方程(2)对回归系数进行假设检验(3)输出决定系数、调整决定系数。(4)输出X与Y的相关系数, X与Y的均数及标准差。(5)比较对血红蛋白有影响的因素的作用大小。3.多元线性回归实验练习操作步骤1. 选择分析变量: AnalyzeRegressionLinear,选择Y进入Dependent框作为因变量,选择变量X1X5进入 Independent (s) 框作为自变量。2. 选择筛选自变量的方法: 在method:框中可选择Backward。3. 单击StatisticsDescriptivesContinue。4. OK。回归方程系数估计结果复相关系数R=0.919, 决定系数R2=0.845, 调整决定系数R2adj=0.833表示在因变量y的总变异中可由回归方程所解释部分的比例越接近于1, 说明回归方程效果越好。回归方程假设检验练习2 . 27名糖尿病人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外研八下英语Unit 6 Developing ideas《合作探究二》课件
- 人教 八年级 语文 下册 第2单元《6.恐龙无处不有》课件
- 2025 网络基础中网络职业技能培训的网络教学模式创新课件
- 2025 高中信息技术数据结构在电商用户购买偏好变化跟踪课件
- 2026年客栈租房合同(1篇)
- 2026年消防系统维修合同(1篇)
- 2026年旅游代开发合同(1篇)
- 2026年及未来5年市场数据中国金融仓储物流中心建设行业发展监测及投资战略咨询报告
- 现代社会调查方法解析
- 2025 高中信息技术数据与计算之算法的萤火虫算法课件
- 中国艺术研究院社会招聘试题
- 2026年教育局思想政治工作科工作计划
- 2025年安徽卫生健康职业学院单招职业适应性测试试题及答案解析
- 医保村卫生室管理制度
- 陕西从优 秀村干部中考录乡镇公务员考试真题
- 2025年军事设施建设与管理规范
- 儿科学营养性vitD缺乏
- “党的二十届四中全会精神”专题题库及答案
- 厂房基础注浆加固施工方案
- 人工智能技术应用规范
- 无锡银税协议书
评论
0/150
提交评论