版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十六章常用多变量统计方法简介
多变量统计方法是研究多个随机变量之间相互关系及规律性的统计学分支。医学现象往往涉及多个变量,且变量间又存在一定的联系。如果用单变量统计方法分别进行统计分析,就忽略了各变量之间存在的相互关系,丧失许多样本信息,分析结果难以客观全面地反映实际情况。此时,往往需要采用多变量统计方法进行分析。
多变量统计方法不仅能够研究多个变量之间的相互关系以及揭示这些变量之间的变化规律,而且能够使复杂的指标简单化,并对研究对象进行分类或简化。随着计算机技术的普及,各种统计软件的不断推出,多变量统计方法已广泛应用到医学研究的各个领域。常用的多变量统计方法有:多重线性回归分析多重logistic回归分析Cox比例风险回归分析多变量方差分析Poisson回归分析对数线性模型分析聚类分析判别分析典型相关分析路径分析主成分分析、探索性因子分析、证实性因子分析结构方程模型分析,等等。一.多重线性回归表16.129名儿童血液中的微量元素含量与血红蛋白含量一.多重线性回归多重线性回归(multiplelinearanalysis)是一元线性回归或简单回归分析的推广。它研究的是一组自变量(x1,x2,…,xp)如何影响一个因变量(y)。这里自变量(independentvariable)指的是一组独立的变量,因变量(dependentvariable)指的是受其他变量影响的变量。一.多重线性回归在例16.1中,自变量为微量元素钙(x1)、镁(x2)、铁(x3)和铜(x4),因变量为血红蛋白含量(y)。由于多重线性回归分析(包括一元线性回归分析)仅涉及到一个因变量,所以有时也称其为单变量线性回归分析(univariatelinearregressionanalysis)多重线性回归分析在医学研究中的用途相当广泛,是一种很重要的回归分析方法,也是其他多变量统计分析方法的基础。三、多重线性回归分析的用途、应用条件及注意事项(一)多重线性回归分析的用途多重线性回归分析的主要用途有:1.分析一个因变量与多个自变量间线性关系。2.用已知的自变量预测因变量。3.筛选疾病的危险因素和保护因素。4.用于建立专家辅助诊断系统或进行统计控制。(二)多重线性回归分析的注意事项多重线性回归分析应用中应注意以下问题:1.因变量必须是连续型定量变量,且服从正态分布;自变量可以是连续型定量变量或分类变量。2.样本含量一般要求为自变量个数的5~20倍。二.Logistic回归多重线性回归模型要求因变量是连续型的正态分布变量,且自变量与因变量呈线性关系。当因变量是分类变量,且自变量与因变量不呈线性关系时,就不能满足多重线性回归模型的适用条件。此时,处理该类资料常用logistic回归模型。Logistic回归分析属于非线性回归,它是研究因变量为二项分类或多项分类结果与某些影响因素之间关系的一种多重回归分析方法。二.Logistic回归在疾病的病因学研究中,经常需要分析疾病的发生与各危险因素之间的定量关系。比如,研究食管癌的发生与吸烟、饮酒、不良饮食习惯等危险因素的关系。如果采用多重线性回归分析,由于因变量为二分类变量(通常取值0或1),不满足正态分布和方差齐等应用条件,若强行使用线性回归分析,其预测值可能会大于1或小于0而无法解释。
例16.2为探讨
阿片受体基因(OPRM1)中rs1381376和rs550014两个SNP位点与“首吸飘感”之间的关系,某研究调查了336名汉族海洛因依赖者,将海洛因依赖者分为有或无“首吸飘感”两组,同时收集每个个体的性别、年龄(岁)、首吸年龄(岁)等变量,数据见表16.6。表16.6336名海洛因依赖者资料logistic回归模型的分类
logistic回归可分为二分类logistic回归和多分类logistic回归。1.二分类logistic回归又分为条件logistic回归分析和非条件logistic回归分析非条件logistic回归分析可用于成组设计的病例-对照研究或队列研究资料。条件logistic回归分析用于配对或配比设计的病例-对照研究资料。
2.因变量为多项分类资料时,可用多项分类logistic回归模型进行分析。
三、logistic回归分析的用途及应用条件
1.建立用多个危险因素估计某事件(或疾病)在一定时期内发生概率的logistic回归方程,如用于探索某疾病发生的危险因素并分析其作用大小。二、logistic回归分析的用途2.预测疾病或事件发生的概率。比如在例16.2中,若某观察者的性别为女性,年龄为31岁,首吸年龄为29岁,rs1381376位点发生突变,rs550014位点未发生突变,则根据表16.9中的参数估计结果,建立式(16.18)所示的logistic回归模型,将该观察者的各变量取值代入模型,可得其发生首吸飘感的概率为0.402。3.对样本进行判别归类。二、logistic回归分析的用途因变量为二项分类或多项分类资料;
自变量可以是任意类型的资料,如定量资料、二分类资料、无序多分类资料或有序分类资料等。二、logistic回归分析的应用条件第十五章“生存分析”介绍了针对生存时间资料的几种方法,一般仅用于单因素分析。但在医学研究中,观察对象生存时间往往受到多个因素的影响。例如,研究某肿瘤患者生存时间与治疗措施的关系,患者的生存时间不仅与治疗措施有关,还受病人的年龄、性别、病情、心理、环境、社会等因素的影响,如果要显示治疗措施的效果,除了治疗措施不同以外,其他影响因素应尽可能相同或相近,这时采用多变量分析方法能够分析包括治疗措施在内的可能因素对生存时间的影响。
三Cox比例风险回归三Cox比例风险回归因为生存时间资料的分布往往不服从正态分布(大多为正偏态分布),有时甚至不知道它的分布类型,这样就不能采用多重线性回归方法分析。本节介绍的Cox比例风险回归模型(Coxproportionalhazardmodel)可以分析多个因素对生存时间的影响,而且允许有截尾数据存在,是生存分析中最重要的多因素分析方法。(一)、Cox回归模型的用途1.建立以多个危险因素估计生存或死亡的风险模型,并由模型估计各危险因素的相对危险度(RR)。2.用已建立的模型,估计患者随时间变化的生存率。3.用已建立的模型,估计患病后的危险指数(或预后指数)。Cox回归模型的应用条件有:1.自变量可以为定量资料也可为分类资料。2.自变量取值不随时间变化。3.样本含量要足够大,且截尾数据不能过多,死亡数不能过少,因素各水平的例数也不能过少。(二)、Cox回归模型的应用条件四.多变量方差分析
多变量方差分析或称多元方差分析(multivariateanalysisofvariance,MANOVA)是单变量方差分析的推广。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年建筑工程质量考试题及答案
- 河道排水沟施工技术方案
- 2025年专升本新疆维吾尔自治区政治考试试题及答案
- 2026年银行从业资格考试初级模拟单套试卷
- 储能电站建筑施工及电气安装方案
- 2025年县乡教师选调考试《教育学》考前冲刺测试卷包及答案详解(网校专用)
- 2026年司法考试民法单套试卷
- 2025年新版导游词考试题及答案
- 台州市2026幼儿园教师招聘考试-学前教育专业知识题库(含答案)
- 驻马店市2026成人高考专升本英语预测试题(含答案)
- 卤素钙钛矿金属-有机框架复合材料光催化性能的多维度探究与前景展望
- 2025年江西省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解(5套)
- 2025年中国银行秋招试题及答案
- 2025年11月济南轨道交通集团运营有限公司社会招聘笔试参考题库附带答案详解(10套)
- 义警规章管理制度
- 2025年广东省深圳市福田区中考三模英语试题(含答案)
- CJ/T 409-2012玻璃钢化粪池技术要求
- DB31/T 668.4-2012节能技术改造及合同能源管理项目节能量审核与计算方法第4部分:锅炉系统
- (二模)黄山市及宣城市2025届高三毕业班质量检测 英语试卷(含答案)
- 小托福阅读:题型解析与应对策略
- 第五版PFMEA模板(自动计算AP值)
评论
0/150
提交评论