多元方差分析与重复测量方差分析_第1页
多元方差分析与重复测量方差分析_第2页
多元方差分析与重复测量方差分析_第3页
多元方差分析与重复测量方差分析_第4页
多元方差分析与重复测量方差分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,多元方差分析与重复测量方差分析,多元方差分析,例1将某班的学生按班级随机分成两组,一组施以素质教育,另一组仍用传统的应试教育,考察某次摸底考试的两种教育模型对学生成绩(如语文、数学、外语、体育等)的影响。很容易想到的分析方法是对两组学生各科成绩进行t检验,分别计算各门课程的t值、p值,回答素质教育是否降低学生的单科成绩,如语文、数学成绩等,但很可能出现的结果是:某一(几)门课程成绩检验结果p0.05。,这种分析方法有以下几个缺点:1.检验效率低2.犯一类错误的概率增大3.一元分析结果不一致时,难以下一个综合结论4.忽略了变量间相关关系对这一类资料进行分析有两种思路:1.因子分析:先对因变量中蕴含的信息进行浓缩,然后再对提取出的公因子进行后续的分析。2.多元方差分析,多元方差分析,与一个反应变量的方差分析相似,都是将反应变量的变异分解成为两部分:一部分为两组间变异(组别因素的效应),一部分为组内变异(随机误差)。然后对这两部分变异进行比较,看是否组间变异大于组内变异。不同的是,后者都是对组间均方与组内均方进行比较,而前者是对组间方差协方差矩阵与组内方差协方差矩阵进行比较。,多元方差分析的基本思想,各因变量服从多元正态分布:只要一个反应变量不服从正态分布,则这几个反应变量的联合分布肯定不服从多元正态分布。各观察对象之间相互独立。各组观察对象反应变量的方差协方差矩阵相等。反应变量间的确存在一定的关系,这可以从专业或研究目的角度予以判断。,多元方差分析对资料的要求,通过菜单:GLM过程通过编程:MANOVA过程区别:对分类变量进行参数估计时应用的矩阵不同GLM过程采用的类似产生哑变量的形式,以某一水平为参照水平,其他水平与参照水平进行比较,即Indicator对比(IndicatorContrast)或Simple对比(SimpleContrast)。MANOVA过程各水平与各水平的平均值进行比较,即Deviation对比(DeviationContrast)。,SPSS中的实现方式,例1为了考查素质教育是否会导致学生成绩降低,某校对初中二年级两个班各20名学生分析施以素质教育和传统(应试)教育模式教学,在一次模拟考试中收集了两个班级学生的语文、数学、英语的考试成绩,试做统计分析(数据见manova.sav)。,分析实例,Multivariate过程,Multivariate过程,方差齐性检验,Multivariate过程,分析结果,(1)组间变量,组间变量(Between-SubjectsFactors)为教育方式,各自变量取值水平对应的频数分别为50、50,Multivariate过程,对教育方式的统计学检验结果为p0.334,说明两种教育方式学生考试成绩差别没有统计学意义,也就是说实施素质教育的学生没有因为提高个人素质而荒废学业。,分析结果,(2)多元方差分析结果,Multivariate过程,分析结果,(3)一元方差分析结果,Multivariate过程,多元方差分析对于资料的正态性影响较稳健,而对于各组方差协方差阵是否齐性较为敏感,上表为对于各组间协方差阵是否为齐性的Box检验,Box检验统计量=1.731,经过变换计算后F=0.986,p=0.433,说明两组学生间的总体方差协方差相等。,分析结果,(4)Box检验,Multivariate过程,这是按照自变量的取值水平组合,考察每个反应变量在不同的水平组合间的方差是否齐性的Levenes检验方差齐性检验结果,结果表明3个变量的方差均齐。,分析结果,(5)Levenes检验,Multivariate过程,协方差分析,回归分析和方差分析结合的一种统计方法。协方差分析与方差分析的区别方差分析所有的自变量(效应因子)都是离散型分类变量,该分类变量是用来比较在自变量的各个不同水平上因变量均值的差异。,协方差分析与回归分析的区别回归分析所有自变量都是连续型数值变量,它是用来估计自变量改变一个单位时因变量的改变量。,将线性回归分析中对自变量的数据要求放宽,方差分析和线性回归分析就可以应用在同一个总体中广义线性模型分析。目的:使得统计领域里这两个最重要的分析方法的准确性和实用性得到进一步提高,方差分析中误差引起的这部分变异可能是由随机抽样时产生的随机误差,也可能是模型以外的其它效应因子或混杂因子引起的误差。因此,建立一个方差分析模型时,不仅要将重要的效应因子包含在模型中,而且要将重要的混杂因子包含在模中。目的:为了校正因变量,即消除了混杂因子对因变量的影响后再进行方差分析。,如何消除一个混杂因子对因变量的影响?,、选取各种条件基本相同的样本进行比较。例如,人的肺活量大小与人的身高、体重、性别和年龄等因素有一定关系。如果比较不同人群的肺活量差异时,需要选择身高等因素相近的人群进行比较。、从统计学技巧上平衡数据,使得方差分析能在基本条件一致的情况下进行。,协变量(covariable)在协方差分析中,用来校正因变量的数值型变量。协方差分析(analysisofcovariance)含有协变量的方差分析。,协方差分析因变量Y应当满足以下假设条件:、在效应因子的每一水平上,因变量y服从正态分布,且方差相等;、在效应因子的每一水平上,因变量y和协变量x呈线性关系,且斜率相同。,协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。,广义线性模型分析(GeneralLinearModelAnalysis),用来分析连续型因变量与任意类型自变量之间各种关系的一种统计分析方法它既包含了方差分析,又包含了线性回归分析,还包含了将二者结合起来的各种广义线性模型分析,如协方差分析,广义线性回归分析,多项式回归分析等,广义线性模型分析(GeneralLinearModelAnalysis)输出结果涉及到四种类型的离均差平方和(SS,sumofsquare)是应用四种不同公式所得到的第一类型SS(TypeISS)第二类型SS(TypeIISS)第三类型SS(TypeIIISS)第四类型SS(TypeIVSS),TypeISS与模型中自变量的进入顺序有关,即模型中每一个自变量对因变量的影响效应仅仅校正了在它之前进入模型的自变量(不包括交叉变量)TypeIISS与模型中自变量的进入顺序无关,即模型中每一个自变量对因变量的影响效应都校正了模型中其它自变量(不包括交叉变量),TypeIIISS和TypeIVSS与模型中自变量的进入顺序无关,即模型中每一个自变量(包括交叉变量)对因变量的影响效应都校正了模型中其它自变量(不包括交叉变量)这两种类型SS的区别只有当数据不平衡,且有空组的设计时才显示出来,一般来讲,TypeISSTypeIISS适用于平衡设计,无交互效应的模型,TypeIIISSTypeIVSS适用于非平衡设计,包含交互效应的模型在很多情况下,TypeISSTypeIISSTypeIIISSTypeIVSS,基本思想将变量(难以控制的因素)X的影响看作自变量,或称协变量,建立应变量Y随自变量X变化的回归方程。利用回归关系把Y变量中不易控制的影响扣除后,再进行修正均数间差别的假设检验。修正均数间的多重比较用q检验(SNK法)。,例:为了研究两种药物对癫疯病菌的治疗效果,将名病人随机分成组。使用抗生素(A组)使用抗生素(D组)使用安慰剂(F组)治疗前和治疗后分别对病人身体的癫疯病菌数量进行了检测,病菌的数量是由每一个病人身体上六个部位病菌感染的程度而定的X:治疗前病人身体的癫疯病菌数量y:治疗后病人身体的癫疯病菌数量Drug:用药种类,两种药物治疗癫疯病菌效果观察抗生素组抗生素组安慰剂组治疗前治疗后治疗前治疗后治疗前治疗后11660161380621310527311114881951911181821236484161210131914125618912161185171301591220,回归斜率相等的假设可以用治疗前与药物是否存在交互作用来表示。对于该问题,首先可以作分组散点图,观察三组直线趋势是否近似,然后看交互作用有无统计学意义,当交互作用无统计学意义时,则进行协方差分析,得出统计结论见协方差分析示例,重复测量的方差分析,重复测量的资料:在日常研究中常需对一个观察单位重复进行多次测量,这样所获得的资料称之为重复测量资料。对于观察单位的定义不同,重复进行观察的方式不同,重复测量的资料也有着形形色色的表现。,一般来说,研究设计中考虑以下问题时应采用重复测量设计:研究主要目的之一是考察某在不同时间的变化情况。研究个体间变异很大,应用普通研究设计的方差分析时,方差分析表中的误差项值将很大,即计算F值时的分母很大,对反应变量有作用的因素常难以识别。有的研究中研究对象很难征募到足够多的数量,此时可考虑对所征募到的对象在不同条件下的反应进行测量。,重复测量的方差分析,重复测量的定义,系指给予一种或多种处理后,对同一受试对象在不同的时间点上,或者在一个以上的场合,对主要变量进行测量;同一个主要变量具有多个观察值,这些观察值来自各个时间点,因此他们之间是不独立的相关的。,重复测量定义(续),如何理解“同一试验对象”?如果在试验过程中持续破坏试验对象,它们就不是重复测量。例如在骨折治疗的研究中,对于造成骨折模型的实验动物,在治疗后的不同时间点上进行局部解剖,观察伤口(骨折部位)的愈合情况。由于经过局部解剖,即使实验动物未死,也因为破坏骨折模型,而不能视为“同一试验对象”。,重复测量定义(续),重复测量设计在医学、生物学研究中较为常见。例如:病人在治疗后(或手术后)一天、二天、一周、二周、.,各个时点上的某指标的变化特点:各个时点上的主要变量观察结果呈现相关,所以按个别的时间点逐个进行统计分析是不恰当的。,重复测量数据与随机区组设计的区别,重复测量数据结果按时间顺序排列;随机区组设计的处理为随机排列。重复测量数据的各时间点的测量值存在不同程度的相关;随机区组设计各处理组的数据之间独立。,基本原理,基本思想:仍然应用方差分析的基本思想,将反应变量的变异分解成以下四个部分:研究对象内的变异(即测量时间点或测量条件下的效应)、研究对象间的变异(即处理因素效应)、上述两者的交互作用、随机误差变异。因素:受试者内因素-用于区分重复测量次数的变量受试者间因素-在重复测量时保持恒定的因素分析目的:一是分析受试者间因素的作用;二是考察随着测量次数的增加,测量指标是如何发生变化的,以及分组因素的作用是否会随时间发生,即是否和时间存在交互作用。,应用条件,反应变量之间存在相关关系。反应变量的均数向量服从多元正态分布。对于自变量的各取值水平组合而言,反应变量的方差协方差阵相等。,实例分析,例2为了研究饮食、活动锻炼种类与人脉搏的关系,某医生将18个人随机分配到饮食结构不同的两组,且每组成员又被随机分配至三种体育锻炼活动组。数据见repeated.sav,对象内因子的主效应运动的强度影响脉搏的速率(即平均脉搏率在不同的实验水平上是否改变)对象间因子的主效应饮食结构是否影响脉搏率(素食和肉食者的平均脉搏率是否相等)锻炼类型是否影响脉搏率(爬楼梯、打网球、重力训练),对象间因子的交互效应锻炼类型对脉搏速率的影响是否依赖于饮食结构(或者饮食结构对脉搏速率的影响是否依赖于锻炼类型),对象内与对象间因子的交互作用饮食(间因子)对脉搏速率的影响是否依赖于运动强度?锻炼类型(间因子)对脉搏速率的影响是否依赖于运动强度(内因子)?饮食(间因子)对脉搏速率的影响是否依赖于运动强度(内因子)和锻炼类型(间因子)?,RepeatedMeasures过程,定义组内变量名pluse,并输入水平数:3,得pluse(3),RepeatedMeasures过程,输入重复测量次数,重复测量变量,RepeatedMeasures过程,RepeatedMeasures过程,分析结果,(1)组内、组间因素,组内因素:重复测量各时点变量,组间因素:活动锻炼、饮食不同种类,受试者内因素、受试者内因素与两个自变量的一级、二级交互作用的多元方差分析统计学检验结果。PillaisTrace最稳健,当4个统计量结论不一致时,推荐以它为最终结论。检验结果说明受试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论