




已阅读5页,还剩66页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
RC列联表资料的统计分析,主要内容,RC列联表资料的认识与分析方法选择 四种不同类型RC列联表资料的统计分析与SAS实现 RC列联表资料统计分析中的错误辨析与释疑,一、 RC列联表资料的认识与分析方法选择,定量变量:年龄、红细胞 二值变量:性别(男、女) 多值名义变量:药物类型(A、B、C)、血型(A、B、AB、O) 多值有序变量:疗效(痊愈、显效、好转、无效)、临床诊断(级、级、级)、CT诊断(级、级、级),一、 RC列联表资料的认识与分析方法选择,双向无序的RC表,在二维列联表中,两个定性变量都是名义变量,并且这两个名义变量分别有R个与C个可能的取值,由此排列成的RC表称之为双向无序的RC表,双向无序的RC表,双向无序RC表的统计方法,检验 Fisher精确概率法:有1/5以上的格子的理论频数小于5,结果变量为有序变量的单向有序RC表,在二维列联表中,仅结果变量的取值为有序的,而原因变量是无序的,由此排列成的RC表称之为结果变量为有序变量的单向有序RC表,结果变量为有序变量的单向有序RC表,结果变量为有序变量的单向有序RC表的统计方法,秩和检验 Ridit分析 有序变量的Logistic回归分析,双向有序且属性不同的RC表,当RC表中的两个定性变量,即原因变量与结果变量都是有序变量,并且它们的性质不同,这样的列联表称为双向有序且属性不同的RC表,双向有序且属性不同的RC表,双向有序且属性不同RC表的统计方法,对于双向有序且属性不同的RC表资料应根据具体的分析目来确定分析方法: 第一个分析目的,只关心各组结果变量取值之间的差别是否具有统计学意义,此时,原因变量的有序性就变得无关紧要了,可将此时的“双向有序RC列联表资料”视为“结果变量为有序变量的单向有序RC列联表资料”,可以选用的统计分析方法有秩和检验、Ridit分析和有序变量的logistic回归分析,双向有序且属性不同RC表的统计方法,第二个分析目的,希望考察原因变量与结果变量之间是否存在相关关系,此时,需要选用处理定性资料的相关分析方法,通常采用Spearman秩相关分析方法,双向有序且属性不同RC表的统计方法,第三个分析目的,若两个有序变量之间存在的相关关系有统计学意义,研究者希望进一步了解这两个有序变量之间的变化关系是呈直线关系还是呈某种曲线关系,此时宜选用线性趋势检验,双向有序且属性不同RC表的统计方法,第四个分析目的,希望考察各行上的频数分布是否相同,此时,将此资料视为双向无序的RC列联表资料,可根据资料具备的前提条件,选用一般 检验或Fisher精确检验。若P0.05,不能认为两有序变量之间有相关关系,而只能认为各行上的频数分布不同,双向有序且属性相同的RC表,当行变量与列变量的性质相同且取值的水平数及含义也相同时,称这样的RC表为双向有序且属性相同的RC列联表,双向有序且属性相同的RC表,双向有序且属性相同RC表的统计方法,双向有序且属性相同的RC表是一个“方形”列联表,它实际上是配对设计22列联表资料的“扩大”。其主要目的是希望回答行变量与列变量的检测结果是否一致的问题,常用的统计分析方法叫做一致性检验或称为Kappa检验,c2检验的计算公式,二、双向无序RC表的统计分析,实例分析 表10 不同专业学生的气质类型分布,二、双向无序RC表的统计分析,第一步,建立检验假设。 H0: 3个专业学生的气质类型构成(频数分布)相同 H1: 3个专业学生的气质类型构成(频数分布)不全相同 a=0.05。,二、双向无序RC表的统计分析,第二步,计算检验统计量。,二、双向无序RC表的统计分析,24,第三步,确定P值,给出结论。 查c2界值表可知, c20.05,6 =12.59,而本例中检验统计量的值3.430.05。所以,3个专业学生的气质类型构成没有统计学差异,二、双向无序RC表的统计分析,原因变量为多值有序变量,结果变量为多值名义变量的RC表,将其视为双向无序RC表进行分析,二、双向无序RC表的统计分析,原因变量为二值变量,结果变量为多值名义变量的2C表,二、双向无序RC表的统计分析,原因变量为多值名义变量,结果变量为二值变量的R2表,二、双向无序RC表的统计分析,原因变量为多值有序变量R2表除了可以应用线性趋势检验外,其他分析方法与双向无序的RC表相同,二、双向无序RC表的统计分析,三、单向有序RC表的统计分析,秩和检验 原因变量为二值变量:Wilcoxon秩和检验 原因变量为多值名义变量:Kruskal-Wallis H检验,三、单向有序RC表的统计分析,实例分析 表15 3种药物治疗某病患者疗效的观察结果,第一步,建立检验假设。 H0: 3种药物的疗效总体分布位置相同 H1: 3种药物的疗效总体分布位置不全相同 a=0.05。,三、单向有序RC表的统计分析,第二步,对原始数据编秩, 遇数据相等者取平均秩,三、单向有序RC表的统计分析,第三步,计算检验统计量。,三、单向有序RC表的统计分析,第四步,确定P值,给出结论。 查c2界值表可知, c20.02,2 =9.21,而本例中检验统计量的值61.099.21,故P0.01。所以,3种药物疗效之间的差别有统计学意义,三、单向有序RC表的统计分析,四、双向有序且属性不同RC表的统计分析,Spearman秩相关 Spearman 秩相关是一种非参数的度量相关性的分析方法,它对数据进行秩变换,然后计算直线相关系数,四、双向有序且属性不同RC表的统计分析,实例分析 表16 某地地方性甲状腺肿病分年龄组的疗效,四、双向有序且属性不同RC表的统计分析,线性趋势检验 基于c2分割方法的线性趋势检验:先计算RC表的c2值,然后将总c2值分解为线性回归分量和偏离线性回归的分量 其分析步骤为:给有序变量的各等级打分;按类似于定量资料的线性回归分析方法计算回归斜率及其方差,进而求出由线性回归所引起的分量和偏离线性回归的分量,四、双向有序且属性不同RC表的统计分析,线性回归分量,四、双向有序且属性不同RC表的统计分析,偏离线性回归分量,四、双向有序且属性不同RC表的统计分析,若两分量均有统计学意义,说明两有序变量之间存在相关关系,但关系不是简单的直线关系 若线性回归分量有统计学意义,而偏离线性回归分量无统计学意义,说明两有序变量之间不仅存在相关关系,而且是线性关系,四、双向有序且属性不同RC表的统计分析,实例分析 表17 眼晶状体浑浊度与年龄的关系,四、双向有序且属性不同RC表的统计分析,实例分析:四种分析方法的结果比较 表18 不同临床分级患者的疗效情况,采用c2检验进行分析,采用c2检验进行分析,采用秩和检验进行分析,采用Spearman秩相关进行分析,采用线性趋势检验进行分析,五、双向有序且属性相同RC表的统计分析,一致性检验(Kappa检验)的计算公式,五、双向有序且属性相同RC表的统计分析,加权Kappa检验:充分利用非对角线上的信息 简单Kappa检验与加权Kappa检验的选择依据: 其一,如果满足对称性假设,可参考简单Kappa系数及其假设检验部分,不满足对称性假设参考加权Kappa系数及其假设检验部分更为合适; 其二,看结果判定时人为因素的作用大小来决定。若人为因素作用很小,选简单Kappa检验;否则,应选加权Kappa检验,五、双向有序且属性相同RC表的统计分析,实例分析 表19 100例患者的临床诊断与CT诊断结果,五、双向有序且属性相同RC表的统计分析,第一步,建立检验假设。 H0:K=0,两种诊断方法的一致性是由偶然误差所致; H1:K0,两种诊断方法的一致性确实存在。 =0.05。,五、双向有序且属性相同RC表的统计分析,第二步,计算必要的中间结果。 n=100 Pa=(60+12+9)/100=0.81 T11=6667/100 T22=1919/100 T33=1514/100 Pe=(T11+T22+T33)/100=0.4993,五、双向有序且属性相同RC表的统计分析,第二步,计算必要的中间结果。 K=(Pa-Pe)/(1-Pe)=0.6205,五、双向有序且属性相同RC表的统计分析,第三步,计算检验统计量。,五、双向有序且属性相同RC表的统计分析,第四步,确定P值,给出结论。 因u=8.28u0.01=2.58,所以P0.01,拒绝H0,接受H1。说明Kappa系数与0之间的差别具有统计学意义。结合Kappa系数的取值来看,临床诊断与CT诊断的结果之间具有一定的一致性。,六、RC列联表分析方法小结与错误辨析,正确处理定性资料的关键: 定性资料的最常用的表达形式为列联表,能够迅速准确地给列联表资料进行分类 掌握每一类列联表资料可能的几种统计分析方法、异同点以及能够实现的分析目的,列联表类型,四格表(22表) 横断面研究设计、病例对照研究设计、队列研究设计、配对设计 双向无序的RC表 结果变量为有序变量的单向有序RC表 双向有序且属性不同的RC表 双向有序且属性相同的RC表 2C列联表及R2列联表,高维列联表 结果变量为二值变量、结果变量为多值有序变量、结果变量为多值名义变量 具有重复测量的定性资料,列联表类型,从设计类型角度对定性资料进行划分,单组设计 配对设计:配对四格表、双向有序且属性相同的RC表 成组设计:四格表、2C列联表,从设计类型角度对定性资料进行划分,单因素多水平设计:双向无序的RC表、结果变量为有序变量的单向有序RC表、双向有序且属性不同的RC表、 R2列联表 多因素设计:高维列联表,定性资料统计方法选择,RC表资料统计分析中的常见错误,误用t 检验或方差分析处理定性资料 忽视一般2检验的前提条件 误用一般2检验处理结果变量为有序变量的RC列联表 误用一般2检验得出相关性结论,误用方差分析处理定性资料,将100例氯氮平所致流涎的精神分裂症患者随机分为空白对照组(A组)、联合普鲁本辛治疗组(B组)和联合舒必利治疗组(C组)。统计分析方法采用单因素方差分析和Student-Newman-Keuls(q检验)进行多重比较,结论为普鲁本辛、舒必利治疗组临床疗效优于空白对照组(P0.01)。数据见表20。,忽视一般2检验的前提条件,误用一般2检验处理结果变量为有序变量的RC列联表,误用一般2检验得出相关性结论,评价脑钠肽( BNP )和不稳定型心绞痛和(或)非ST段抬高心肌梗死患者冠状动脉病变程度的关系。所有患者按脑钠肽水平分为4个百分位数组,BNPP25(78.0ng/L)组、P26P50(78.1-26.5ng/L)组、P51P75(265.1-368.0ng/L)组和BNPP75(368.0ng/L)组 对各组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论