SPSS列联表分析ppt课件_第1页
SPSS列联表分析ppt课件_第2页
SPSS列联表分析ppt课件_第3页
SPSS列联表分析ppt课件_第4页
SPSS列联表分析ppt课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,列联表分析,.,列联表是指对一组观察对象,分别观察其两种分类变量的表现,归纳成双向交叉排列的统计表,这类统计表用的描述行变量和列变量之间的关系称列联表,或交叉表。,一、四格表资料的2检验二、配对四格表资料的2检验三、四格表资料的Fisher确切概率法四、RC列表资料的2检验五、多个样本率间的多重比较,率的比较一致性检验拟合度检验,1.四格表卡方检验,目的:推断两个样本率(构成比)是否有差别(两样本率来自总体率相同的总体)要求:两样本的两分类个体数排列成四格表资料H0:两样本的率相同;H1:两样本的率不同,TRC=nRnC/n,TRC:第R行、第C列格子的理论频数;nR:第R行的合计数;nc:第C行的合计数;n:总计数,假设两组发病率相同,均等于合计的发病率21.95(90/410),组服药组的理论发病人数T11=230*(90/410)=50.49,对照组的理论发病人数T21=180*(90/410)=39.51,同理可以算出两组未发病的理论频数分别为179.51,140.49带入上述公式2=(40-50.49)2/50.49+(190-179.51)2/179.51+(50-39.51)2/39.51+(130-140.49)2/140.49=6.36,=(2-1)*(2-1)=1,查表得,0.25P0.01,2检验实际上是将两样本率的比较转换成实际频数与理论频数的比较,2值的大小反应了各格子的实际频数与理论频数T的接近程度。若检验假设H0成立,实际频数与理论频数相差就不应该很大,因此得到的2值可能就比较小,P,可认为两样本率来自同一总体的可能性比较大。反之,若实际频数与理论频数相差很大,则得到的2也相应的很大,P,可认为两样本率来自同一总体的可能性比较小。,例1.1:案例解析:某种中药治疗胃溃疡的复发率与常规西药比较是否相同?,操作流程:数据:加权个案-频率变量:权重-确定分析-统计描述-交叉表行:分组列:疗效统计量:卡方-确定单元格:计数-观察值、期望值百分比:行-继续确定,数据录入,个案加权,四格表与各组率,卡方检验结果,四核表卡方的选用条件:1、总例数40,且所有理论频数5,看Pearson卡方结果;2、总例数40,有1个理论频数1且5,2检验需进行连续性校正,这时以连续性校正结果为准;(连续性校正卡方只在四格表中才计算)3、总例数40,至少2个理论频数1且5,看Fisher精确检验结果;4、总例数40或者出现理论频数1,看Fisher精确检验结果;5、总例数40,且所有理论频数5,似然比2检验与Pearson卡方一致,结论:两种药物治疗胃溃疡的复发率并不相同,中药组复发率为23.2%,高于西药组(5.9%),差异有统计学意义(2=6.305,P=0.0120.05)。,例1.3:案例解析(Fisher精确检验)用两种药物治疗某种疾病的结果如下,问两药的疗效有误差别?,Fisher精确检验比较稳健,国外有统计学专家认为样本数1000就应该用Fisher精确检验,也有些人认为所有的卡方检验都可以使用Fisher精确检验。,2.配对四格表卡方检验,例2:有两种方法可用于诊断某种癌症,A方法简单易行,成本低,患者更容易接受,B方法结果可靠,但操作繁琐,患者配合困难。某研究选择了53例待诊断的门诊患者,每个患者分别用A和B两种方法进行诊断,判断两种方法诊断癌症有无差别,A方法是否可以代替B方法。问题1:两种方法诊断癌症有无差别?问题2:A方法是否可以代替B方法(两者的一致性如何)?,前面介绍过列联表,它的行变量和列变量代表的是一个事物的两个不同属性,以我们举过的A药和B药治疗急性心肌梗死患者疗效比较为例,例子中行变量“药物”和列变量“转归”是患者的两个不同特征。本例为配对设计的列联表,它的行变量和列变量代表的是一个事物的同一属性,只是对这个属性的判断方法不同而已。如上表所示,行和列均指的是患者是否患有癌症,所不同的是一个是A方法,另一个是B方法。这种列联表最大的特点是行和列数目永远都是一样的,且属性相同。此时,再用成组计数资料的2检验就不合适了。这里我们就要用到Kappa一致性检验和配对2检验(McNemar检验)。,.,操作流程:数据:加权个案-频率变量:人数确定分析-统计描述-交叉表行:A药列:B药(值:1为阳性,2为阴性)统计量:McNemar、Kappa继续单元格:计数-观察值、期望值百分比:行、列继续确定,Kappa值判断标准:Kappa0.75,两种方法诊断结果一致性较好;0.4Kappa0.75,两种方法诊断结果一致性一般;Kappa0.4,两种方法诊断结果一致性较差。表2给出了McNemer检验的结果,P=0.0220.05,提示两种方法诊断情况并不一致;表3中Kappa=0.506,P0.001,提示两种方法诊断结果存在一致性,但是Kappa在0.40.75范围内,一致性一般。结论:A方法和B方法诊断结果一致性一般(Kappa=0.506,P0.001);B诊断阳性率为67.9%,明显高于A诊断(50.9%),且差别具有统计学意义(P=0.022)。,有时可能出现Kappa值与McNemer检验结果不一致的情况,如Kappa0.75,说明两者的一致性较好,但是McNemer检验结果p0.05,说明两者的检验结果有差别。出现这样的矛盾石油两种方法对信息的利用不一致导致的。Kappa检验会利用列联表中的所有信息,McNemer检验只会利用对角线上不一致单元格的信息,即只关心两者不一致的信息,因此在出现矛盾时,主要参考Kappa检验的结果。在甲乙两种方法的配对检验中,若其中甲法为金标准,研究乙法与甲法的一致性情况,并研究乙法能否取代甲法时,就会出现假阳性和假阴性的概念。假阳性:又称误诊率或第I类错误,指实际无病,但被认为有病的百分比。假阴性:又称漏诊率或第II类错误,指实际有病,但被认为无病的百分比。结合本例,如以B法为金标准,36个病人中,A法将11人诊断为无病,假阴性率为11/36=30.6%;17个非病人中,A法将2人诊断为有病,假阳性率为2/17=11.8%,说明A法假阴性率较高,容易造成漏诊。,3.双向无序列的列联表分析,双向无序列联表是指行变量和列变量均为无序分类变量,统计方法和一般四核表卡方检验一致,是对四格表2检验的拓展,由两个分组增加到多个分组,需要注意的是,这里我们不光想知道多个分组间有无差异,如果差异存在统计学意义,那么具体到组间两两比较是否均存在差异。多个独立样本列联表2检验的结果选择:1、所有理论频数5,看Pearson卡方检验的结果;2、超过1/5的理论频数5或至少1个理论频数1,看Fisher精确检验结果(也可以考虑增加样本量或者依据专业判断适当合并行或列,再进行2检验)。但不同于四格表2检验,SPSS对于R*C列联表2检验不会自动输出Fisher确切概率检验结果,如果样本例数较少,建议在“精确”设置中勾选“精确”。,例3:以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异。,本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson卡方结果,即2=22.841,P0.001,提示三种食物中真菌检出率不同。此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,这里就需要用到“卡方分割”,通俗讲就是把R*C列联表拆分成若干个四个表分别进行2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对2检验的P值进行校正。常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准=0.05/比较次数=0.05/3=0.0167,即当两两比较P0.05)。,例4.2(分组变量为有序资料)某研究利用某项调查,想研究一下年龄与血脂异常之间的关系,是否血脂异常的患病率随着年龄增加而增加?,经独立样本卡方检验只能说明不同年龄组之间血脂异常患病率有统计学差异。趋势性卡方检验主要用来检验结局变量是否随着分组变量(X)呈现一定的线性或者倾向性的改变,比如这里的“血脂异常的患病率随着年龄增加而增加”。趋势性卡方检验最常用的方法是Cochran-Armitagetrendtest,但SPSS并没有提供这种方法(SAS软件中有),而是另一种方法Linear-by-LinearAssociation,两个结果相近。结论:经趋势性卡方检验,血脂异常的患病率随着年龄增加而增加(P0.001)。,5.双向有序且属性不同的列联表分析,当列联表分组变量、结局变量均为有序变量,但属性不同时,称为双向有序列联表,一般根据研究目的主要进行一下两种检验,一种采用独立样本秩和检验,分析组间的差异性,另一种采用相关性检验,研究分组变量和结局变量之间的关系。,例5.1现有一份170例某病患者的治疗效果资料,按年龄和疗效两种属性交叉分类,结果如下,请进行分析。(卫生统计学第六版),研究方向1:组间疗效有误差别(转换为多样本的秩和检验)操作流程:分析-非参数检验-独立样本目标:自动比较不同组间分布字段:检验字段:疗效组:年龄设置:自定义检验比较不同组间分布Kruskal-Wallis单因素ANOVA(K样本)运行(分组变量在变量设置中需设置为有序变量),研究方向2:疗效和年龄之间是否相关(Gamma法与Spearman秩相关)操作步骤:分析-描述统计-交叉表行:年龄列:疗效统计量:卡方,相关性,Gamma(G),(1)G=-0.355,P=0.0010.05,年龄与疗效互相关联,即随着年龄增达,疗效越差,关联系数为-0.355。(2)Spearman秩相关系数rs=-0.255,P=0.0010.05,年龄与疗效成负相关。本例用Gamma法的相关系数为0.355大于Spearman秩相关的系数0.255,Gamma法优于Spearman秩相关法。,对于等级资料相关分析,在做Spearman秩相关时,需要对原始数据进行编秩次,因为是等级资料,所以会产生大量秩次相等的平均秩次,进而低估了变量之间的关联系数。Gamma:主要用于两个有序变量之间的对称相关性分析,行变量等级高的列变量等级也高称为正相关,如果行变量等级高而列变量等级低,则称为负相关。它的范围从-1到1,绝对值越接近1表示两个变量之间的存在关系越紧密,接近0表示关系较弱或者没有关系。,本例也可以进行趋势性卡方检验,P=0.002,也说明年龄与疗效存在相关性,但不能给出具体的相关系数。,6.双向有序且属性相同的列联表分析,例6:对150名冠心病患者用两种方法检查室壁收缩运动情况,检测情况如下.研究问题:两种方法一致性如何?,Kappa检验又称一致性检验,研究两种方法检验的一致性,希望所有的频数都出现在主对角线上,这样一致性最好。Kappa0.75,两种方法诊断结果一致性较好;0.4Kappa0.75,两种方法诊断结果一致性一般;Kappa0.4,两种方法诊断结果一致性较差。MaNemar检验即配对卡方检验,研究两者在哪些地方不一致,计算时只利用不在对角线上数据,因此检验效能上不如Kappa。本例Kappa值=0.676,说明两者的一致性一般,P0.001,与0比较差异具有统计学意义,,同时可以计算出Kappa值95%的可信区间为(0.578,0.774)。,(1)McNemar检验:仅用于22列联表。本检验与Pearson卡方检验具有同一性,使用条件必须满足Pearson卡方检验的条件。如果条件不能满足,需要进行Yate校正。(2)Bowker检验:是McNemar检验的扩展,用于分类数目大于2的配

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论