SPSS多因素方差分析2讲课文档_第1页
SPSS多因素方差分析2讲课文档_第2页
SPSS多因素方差分析2讲课文档_第3页
SPSS多因素方差分析2讲课文档_第4页
SPSS多因素方差分析2讲课文档_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS多因素方差分析文档ppt第1页,共48页。析因设计的特点必须是:两个以上(处理)因素(factor)(分类变量)。两个以上水平(level)。两个以上重复(repeat)。每次试验涉及全部因素,即因素同时施加观察指标(观测值)为计量资料(独立、正态、等方差)。第2页,共48页。析因设计的有关术语单独效应(simpleeffects):其它因素的水平固定为某一值时,某一因素不同水平间的效应差异。主效应(maineffects):某因素各单独效应的平均效应。交互作用(Interaction):某一因素效应随着另一因素变化而变化的情况。(如一级交互作用AB、二级交互作用ABC…)。第3页,共48页。析因设计的优缺点用相对较小样本量,获取更多的信息。可用来分析全部主效应,单独效应以及因素间各级的交互作用。优点缺点

所需试验的次数很多,如2因素,各3水平5次重复需要试验为45次。第4页,共48页。

例1:某研究人员采用某法测定人血清C3(mg/L)值,问①不同保存温度下该法对C3的测定值有无差异?不同保存时间下该法对C3的测定值有无差异?②保存时间与温度对测定值无交互作用?保存温度20℃保存时间保存温度平均b2-b120℃(b1)37℃(b2)1天

(a1)132013201317213201330133013101310133013001300

131613183天

(a2)1340142013768013401420135014301330141013201400

13361416平均13261367134641a2-a1209859第5页,共48页。步骤①选择Analyze→GeneralLinearModel→Univariate,激活Univariate对话框。②在Univariate对话框中,把变量“c3值”放入DependentVariable,变量“保存时间”和“保存温度”放入FixedFactor(s)栏。单击Plots…按钮,激活ProfilePlots对话框。③在ProfilePlots对话框中,把Factors栏中的变量“保存时间”放入HorizontalAxis栏,变量“保存温度”放入SeparateLines栏,再单击Add按钮,会使变量“a*b”自动进入Plots栏,单击Continue按钮返回。④在Univariate对话框中,单击Options…按钮。在Options对话框中,把Factor(s)andFactorInterations栏中的变量“保存时间”、“保存温度”、和“保存时间*保存温度”放入DisplayMeansfor栏;并在Display多选项中,选择Descriptivestatistics,Estimatesofeffectsize,Homogeneitytests。单击Model…,选择默认项,即Fullfactorial项(全析因模型),单击Continue按钮返回。⑤在Univariate对话框,单击OK按钮得到Univariate过程的运行结果。6第6页,共48页。结果7第7页,共48页。均数分布图8第8页,共48页。

例2,用5×2×2析因设计研究5种类型的军装在两种环境、两种活动状态下的散热效果,将100名受试者随机等分20组,观察指标是受试者的主观热感觉(从“冷”到“热”按等级评分),结果见下表。试进行方差分析。9第9页,共48页。战士主观感觉冷热等级评分10第10页,共48页。完全随机的三因素析因设计方差分析表

第11页,共48页。结果12第12页,共48页。二、协方差分析完全随机设计的协方差分析完全随机区组设计的协方差分析13第13页,共48页。

一般地,均数间的比较可用t检验或方差分析。要求比较组除了处理因素不同外,其它对结果有影响的因素要齐同或均衡。

当影响结果的某个因素没有得到控制时,即对两组来说不齐同,这两个均数就不能直接比较,需进行校正,得到的修正均数,再比较。14第14页,共48页。

基本概念

协变量(covariate):对反应变量有影响的非处理因素。必须是数值变量。例如,在研究降压药物的疗效时,病人的初始血压水平对服药后血压下降值是有影响的。如果不考虑病人初始血压水平的差异,直接比较不同处理组病人的平均血压下降值,是不恰当的。这里,处理因素?协变量因素是?15第15页,共48页。观察协变量X对反应变量Y的影响是否存在线性关系。可建立应变量Y随协变量X变化的线性回归关系,利用这种回归关系,固定X值,得到Y的修正均数,然后再比较修正均数间差异。其实质就是从Y的总平方和中扣除协变量X对Y的回归平方和,对残差平方和作进一步分解后再进行方差分析,以更好地评价各种处理的效应。

基本思想:是将线性回归分析与方差分析结合起来的一种统计分析方法。

16第16页,共48页。实例分析:为研究A、B、C三种饲料对猪的催肥效果。用每种饲料喂养8头猪一段时间,测得每头猪的初始重量(X)和增重(Y)数据如下表。试分析三种饲料对猪的催肥效果是否相同?表三种饲料喂养猪的初始重量与增重(单位:kg)X:初始重量;Y:增重17第17页,共48页。如果不考虑初始重量对增重的影响,那么本例就是一个典型的完全随机设计类型的方差分析。

三组的初始重量(X)均数不同,经采用两两比较,P值均小于0.05。在没有扣除X对Y的影响的情况下,提示猪的初始重量与饲料的效应混杂。采用协方差分析,将三组的初始体重化为相等,以扣除其影响,再比较三种饲料的增重是否相同,即检验三组修正均数间的差别有无统计学意义。

18第18页,共48页。数据输入格式及步骤19第19页,共48页。结果X(初始重量)的组间差异有统计学意义。F=88.813,P<0.01;Group(饲料间)的差异(在扣除了初始体重后)有统计学意义,F=31.071,P<0.01.20第20页,共48页。在扣除了初始体重后得到的修正均数21第21页,共48页。三、两阶段交叉设计方差分析设计特点同一批受试对象,随机等分为两组,一组先接受A处理,后再接受B处理;另外一批受试对象先接受B处理而后再接受A处理。如此可使A处理和B处理有同等的机会处于两个实验阶段。这种设计可分析三种变异,即两种处理间的差异,两个阶段之间的差异受试对象之间的差异。22第22页,共48页。例:为比较血液透析过程中,低分子肝素钙(A)与速避凝(B)对凝血酶原时间(TT)的影响,选择20例接受血液透析的病人为研究对象,采取二阶段交叉设计,实验数据如表下表,试分析之。23第23页,共48页。24第24页,共48页。结果25第25页,共48页。多变量的统计分析方法兰州大学流行病与卫生统计研究所申希平E-mail:shenxp@2007.1226第26页,共48页。Logistic回归分析27第27页,共48页。用途通过一组自变量(X1…Xn),采用Logistic回归,可以预测一个因(分类)变量每一个分类所发生的概率。它是研究二(多)分类观察结果与一些影响因素之间关系的一种多变量分析方法。自变量可以是分类变量,也可以是连续变量,或者兼而有之。28第28页,共48页。在流行病学研究中,经常需要分析疾病与各危险因素之间的定量关系,如食道癌的发生与吸烟、饮酒、不良饮食习惯等危险因素的关系,为了正确说明这种关系,需要排除一些混杂因素的影响。由于因变量Y是二(多)分类的,不满足线性回归的条件,故应该用Logistic回归!29第29页,共48页。二项分类Logistic回归条件1:m配对Logistic回归30第30页,共48页。例:前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施剖腹术探查,并在显微镜下检查淋巴组织。为了不手术而又能弄清淋巴结的转移情况,Brown(1980)在术前检查了53例前列腺癌患者,分别记录了年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量。

后三个变量均按0、1赋值,其值1表示阳性或较严重情况,0表示阴性或较轻情况。还有手术探查结果变量NODES,1表示有淋巴结转移,0表示无淋巴结转移。31第31页,共48页。分析目的:1.影响前列腺癌细胞淋巴结转移的因素;

2.建立淋巴结转移的预报模型。

32第32页,共48页。1.数据格式:见Logistic1.sav

因变量(结果变量):NODES为二分类变量。1为‘有淋巴结转移’,0为‘无淋巴结转移’。

自变量(危险因素):自变量可以是定量、二分类和等级的。

本例年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量。33第33页,共48页。2.SPSS的分析过程:

Analyze→Regression→BinaryLogistic

进入二分类Logistic回归分析对话窗。

Dependent窗:只能选入一个变量,将NODES选入。Covariates窗:将AGE、ACID、X_RAY、GRADE、STAGE选入。

34第34页,共48页。Method:默认Enter。也可用变量筛选方法的选择。Categorical对话框:用于分类变量的资料,选入X_RAY、GRADE、STAGE。Save对话框:存入新变量。Options对话框:选StatisticsandPlots:

Hosmer-Lemeshowgoodness-of-fitCIforexp95%35第35页,共48页。3.主要结果:★全回归模型:

①模型的检验:

OmnibusTestsofModelCoefficients36第36页,共48页。②模型的拟和优度检验:

37第37页,共48页。③参数估计及检验:

38第38页,共48页。XRAY,GRADE,STAGE,AGE,ACID对影响淋巴结转移的相对危险度分别为7.732、2.141、4.778、0.933、1.025。对XRAY和STAGE,P<0.05,XRAY和STAGE的95%的可信区间未包含1,有统计学意义。对GRADE,AGE,ACID,P>0.05。得到Logistic预测概率模型为:39第39页,共48页。

★逐步回归模型:40第40页,共48页。得到线性预测方程为:41第41页,共48页。例2在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该院所有的AMI患者的抢救病史共200例。

Y=0抢救成功,Y=1示抢救未能成功;X1=1抢救前已休克,X1=0抢救前未休克;X2=1抢救前心衰,X2=0抢救前未心衰;X3=1到抢救时已超过12小时,X3=0未超时。

42第42页,共48页。本例将该医院所有AMI患者看作是AMI总体中的一个随机样本,同时收集研究对象抢救病史和抢救结果资料,因此属横断面调查。

研究目的:分析影响抢救死亡率的因素;建立预测抢救成功的模型。43第43页,共48页。AMI患者的抢救危险因素资料

44第44页,共48页。

=1.11是变量X1的Logistic回归系数,exp(1.11)=3.033是其它变量取值固定时,休克与没休克相比死亡的优势比(OR),在死亡率较低时,该值近似说明有休克与无休克相比死亡风险增加的倍数。本例,3个因素的回归系数均为正值,说明休克、心衰和未能及时抢救都是增加死亡优势的危险因素。45第45页,共48页。条件logistic回归条件logistic回归(conditionallogisticregression)是针对配对资料分析的一种方法。在流行病学的病例-对照研究中,为了控制一些重要的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论