十一多元方差分析与重复测量方差分析课件_第1页
十一多元方差分析与重复测量方差分析课件_第2页
十一多元方差分析与重复测量方差分析课件_第3页
十一多元方差分析与重复测量方差分析课件_第4页
十一多元方差分析与重复测量方差分析课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学医学院流行病与卫生统计学教研室 沈毅 多变量方差分析与重复测量方差分析多变量方差分析与重复测量方差分析 浙江大学医学院流行病与卫生统计学教研室 沈毅 在医学研究中,尤其在临床试验中,每个观察对象记录的观察 结果通常有多个反应变量(responsible variable)。例如,血压记 录有收缩压、舒张压、脉压等;血脂记录有胆固醇脂、甘油三酯 、磷脂、未脂化脂肪酸等;心功能、肺功能、微循环的检测记录 项目则可多达十几个乃至几十个,这种有多个反应变量的数据称 为多变量数据(multivariate data)。在数据处理时,如果只有一 个反应变量但有多个解释变量,有时也称为多变量数据。 要注意多变量数据与多因素试验的区别:多因素试验指的是有多 个干预因素(分组因素)的试验,尽管析因设计方差分析和正交 设计方差分析可以分析多个试验因素的作用,但试验结果只有一 个反应变量,仍然是单变量方差分析。 描述和表达时采用了适合多变量的向量和矩阵的表示方法。 浙江大学医学院流行病与卫生统计学教研室 沈毅 解释变量解释变量 (处理因素)(处理因素) 反应变量反应变量 Y Y 解释变量解释变量 (处理因素)(处理因素) Y Y1 1 Y Y2 2 Y Y3 3 反反 应应 变变 量量 只有一个反应变量的模型只有一个反应变量的模型 具有多个反应变量的模型具有多个反应变量的模型 浙江大学医学院流行病与卫生统计学教研室 沈毅 治疗组治疗组 对照组对照组 反应变量(效应)反应变量(效应) T T3 3 T T 4 4 T T 8 8 T T3 3 T T 4 4 T T 8 8 处理因素处理因素 如何比较二组的如何比较二组的T T细胞免疫功能?细胞免疫功能? 1 1、如果、如果T T 3 3 、T T 4 4 和和T T 8 8 各指标间不相关(独立?)且满足正态分布各指标间不相关(独立?)且满足正态分布 和方差齐性,则考虑用和方差齐性,则考虑用t t检验。问题是检验。问题是t t检验可能出现多种结果(检验可能出现多种结果( 本例可能有本例可能有8 8种结果)有时不一定能解释或很难解释。其次多重种结果)有时不一定能解释或很难解释。其次多重t t 检验会增加检验会增加I I型错误的概率。型错误的概率。 2 2、将、将T T 3 3 、T T 4 4 和和T T 8 8 三个指标看成一个整体,用多变量统计的方法三个指标看成一个整体,用多变量统计的方法 来分析比较。来分析比较。 浙江大学医学院流行病与卫生统计学教研室 沈毅 多元方差分析 例1 将某班的学生按班级随机分成两组,一组施以素质教育, 另一组仍用传统的应试教育,考察某次摸底考试的两种教育模 型对学生成绩(如语文、数学 、外语、体育等)的影响。 v 很容易想到的分析方法是对两组学生各科成绩进行 t 检验 ,分别计算各门课程的 t 值、p值,回答素质教育是否降低学生 的单科成绩,如语文、数学成绩等,但很可能出现的结果是: 某一(几)门课程成绩检验结果p0.05。 浙江大学医学院流行病与卫生统计学教研室 沈毅 多个反应变量用单变量分析方法有以下几个缺点: 1. 检验效率低 2. 犯一类错误的概率增大 3. 一元分析结果不一致时,难以下一个综合结论 4. 忽略了变量间相关关系 对这一类资料进行分析有两种思路: 1. 因子分析:先对因变量中蕴含的信息进行浓缩,然 后再对提取出的公因子进行后续的分析。 2. 多元方差分析 多元方差分析 浙江大学医学院流行病与卫生统计学教研室 沈毅 与一个反应变量的方差分析相似,都是将反应变量的变异 分解成为两部分:一部分为两组间变异(组别因素的效应) ,一部分为组内变异(随机误差)。然后对这两部分变异进 行进行比较,看是否组间变异大于组内变异。 不同的是,后者都是对组间均方与组内均方进行比较,而 前者是对组间方差协方差矩阵与组内方差协方差矩阵进行比 较。 多元方差分析的基本思想 浙江大学医学院流行病与卫生统计学教研室 沈毅 各因变量服从多元正态分布:只要一个反就变量不服 从正态分布,则这几个反应变量的联合分布肯定不服 从多元正态分布。 各观察对象之间相互独立。 各组观察对象反应变量的方差协方差矩阵相等。 反应变量间的确存在一定的关系,这可以从专业或研 究目的角度予以判断。 多元方差分析对资料的要求 浙江大学医学院流行病与卫生统计学教研室 沈毅 将等号两边平方,整理后得下式: 具有多个反应变量时,将单个均数和方差改用均数向量和协方差矩阵 此式即为多变量Hotelling T2检验 浙江大学医学院流行病与卫生统计学教研室 沈毅 通过菜单:GLM过程 通过编程:MANOVA过程 区别:对分类变量进行参数估计时应用的矩阵不同 GLM过程采用的类似产生哑变量的形式,以某一水平为参 照水平,其他水平与参照水平进行比较,即Indicator对比 (Indicator Contrast)或Simple 对比(Simple Contrast)。 MANOVA过程各水平与各水平的平均值进行比较,即Deviation 对比(Deviation Contrast)。 SPSS中的实现方式 浙江大学医学院流行病与卫生统计学教研室 沈毅 例1某妇幼保健院将孕妇随机分两组,一组接受孕期保健教育,另一组作为对照。 观察同一日出生的13名顺产婴儿的体重和身高,问孕期保健教育对婴儿生长发育有 无促进作用? 分析实例 婴儿 编号 保健教育组婴儿 编号 对照组 身长(cm)体重(kg)身长(cm)体重(kg) 13.355013.2050 24.105023.0046 33.505333.0045 43.645043.3547 53.605252.6050 64.005563.3452 73.0052 表1 13名婴儿出生时的身高与体重 浙江大学医学院流行病与卫生统计学教研室 沈毅 单变量分析:独立样本t检验 浙江大学医学院流行病与卫生统计学教研室 沈毅 两组平均体重不同(t=4.112,p=0.002) ,两组平均身高无统计学差异 (t=1.998,p=0.071)如何评价? 浙江大学医学院流行病与卫生统计学教研室 沈毅 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 方差齐性检验 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 分析结果 (1) 组间变量 v 组间变量(Between-Subjects Factors)为教育方式,各自变量取值水平 对应的频数分别为6、7及各组的均数和标准差 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 v 对教育方式的统计学检验结果为p0.006,说明两种教育 方式对婴儿生长发育差别有统计学意义。 分析结果 (2) 多元方差分析结果 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 分析结果 (3) 一元方差分析结果 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 v 多元方差分析对于资料的正态性影响较稳健,而对于各组方差协方差阵 是否齐性较为敏感,上表为对于各组间协方差阵是否为齐性的Box检验, Box检验统计量=0.771,经过变换计算后F=0.206,p=0.892,说明两组婴儿 间的总体协方差相等。 分析结果 (4) Box检验 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 v 这是按照自变量的取值水平组合,考察每个反应变 量在不同的水平组合间的方差是否齐性的Levenes检验 ,结果表明2个变量的方差均齐。 分析结果 (5) Levenes检验 Multivariate 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 多变量分析与单变量分析 多变量分析是对m个反应变量进行一次假设检验(Hotelling T2检验或MANOVA),对组间差别作出推断。在大多数情 况下,多变量假设检验结论与对m个反应变量进行m次单变 量假设检验(t检验或ANOVA)的结论是一致的,即多变量 假设检验拒绝H0,m次单变量假设检验至少有一次拒绝H0, SPSS、SAS等统计软件也是先给出多变量假设检验结果, 再给出单变量假设检验结果,作为多变量分析的补充。 浙江大学医学院流行病与卫生统计学教研室 沈毅 但理论上单变量假设检验不能代替多变量假设检验,主要理由: m次单 变量假设检验增加假阳性错误的概率,设每次单变量假设检验的检验水准 定为a,做完m次检验I类错误的概率增加为am1-(1-a)m。 单变量假设检验只说明某一变量在数轴分布上的组间差别,不能反映多 个变量在平面或空间上的差别,两者的意义不同,各自说明各自的问题, 不能相互代替。如表1的两组数据,分别对两组新生儿出生时的体重与身 长做单变量t检验:体重t=4.112,p=0.002,拒绝H0,身长t=1.998, p=0.071,,不能拒绝H0。但双变量的Hotelling T2检验:T2=9.87,F=4 .58 ,P=0.03,拒绝H0:1= 2,两组在平面分布上差别如下图所示。 浙江大学医学院流行病与卫生统计学教研室 沈毅 身高与体重在数轴上的分布 在体重的分布上,保健 组大多数婴儿的体重都 大于平均体重,对照组 婴儿的体重都在平均体 重以下,在身高的分布 上二组婴儿的身高比较 均匀分散的均数的两侧。 浙江大学医学院流行病与卫生统计学教研室 沈毅 二组婴儿的身高与体重在空间分布上的差异 保健教育组 对照组 浙江大学医学院流行病与卫生统计学教研室 沈毅 重复测量的方差分析 v 重复测量的资料:在日常研究中常需对一个观察单位重复 进行多次测量,这样所获得的资料称之为重复测量资料。 v对于观察单位的定义不同,重复进行观察的方式不同,重 复测量的资料也有着形形色色的表现。 浙江大学医学院流行病与卫生统计学教研室 沈毅 一般来说,研究设计中考虑以下问题时应采用重复测量设计: 研究主要目的之一是考察某在不同时间的变化情况。 研究 个体间变异很大,应用普通研究设计的方差分析时, 方差分析表中的误差项值将很大,即计算F值时的分母很 大,对反应变量有作用的因素常难以识别。 有的研究中研究对象很难征募到足够多的数量,此时可考虑 对所征募到的对象在不同条件下的反应进行测量。 重复测量的方差分析 浙江大学医学院流行病与卫生统计学教研室 沈毅 基本原理 v 基本思想:仍然应用方差分析的基本思想,将反应变量的变 异分解成以下四个部分:研究对象内的变异(即测量时间点或 测量条件下的效应) 、研究对象间的变异(即处理因素效应) 、上述两者的交互作用、随机误差变异。 v 因素:受试者内因素-用于区分重复测量次数的变量 受试者间因素-在重复测量时保持恒定的因素 v 分析目的:一是分析受试者间因素的作用;二是考察随着测 量次数的增加,测量指标是如何发生变化的,以及分组因素的 作用是否会随时间发生,即是否和时间存在交互作用。 浙江大学医学院流行病与卫生统计学教研室 沈毅 应用条件 反应变量之间存在相关关系。 反应变量的均数向量服从多元正态分布。 对于自变量的各取值水平组合而言,反应变量的方差 协方差阵相等。 浙江大学医学院流行病与卫生统计学教研室 沈毅 实例分析 例2 为了研究饮食、活动锻炼种类与人脉搏的关系,某医生将18个人随 机分配到饮食结构不同的两组,且每组成员又被随机分配至三种体育锻 炼活动组。数据见repeated.sav 浙江大学医学院流行病与卫生统计学教研室 沈毅 Repeated Measures 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 v 定义组内变量名pluse,并输入水平数:3,得 pluse(3) Repeated Measures 过程 重复测量的变量名 次数 浙江大学医学院流行病与卫生统计学教研室 沈毅 Repeated Measures 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 Repeated Measures 过程分析结果 (1) 组内、组间因素 组内因素:重复 测量各时点变量 组间因素:活动锻 炼、饮食不同种类 浙江大学医学院流行病与卫生统计学教研室 沈毅 v 受试者内因素、受试者内因素与两个自变量的一级、二级交互作用的多元方差 分析统计学检验结果。Pillais Trace 最稳健,当4个统计量结论不一致时,推荐以 它为最终结论。检验结果说明受试者三个时期的脉博不同,且不同锻炼情况、不同 饮食的脉搏变动情况相似。 分析结果 (2) 多元方差分析 Repeated Measures 过程 浙江大学医学院流行病与卫生统计学教研室 沈毅 v三个时间点对ex

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论