




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
798 无序分类资料的统计推断2检验8 无序分类资料的统计推断 2检验2检验(chi-square test)是一种用途较广的假设检验方法,这里仅介绍它在分类变量资料中的应用,检验两个或两个以上的样本率或构成比之间的差异是否有统计意义。8.1 四格表资料的2检验四格表即2 2列联表,其自由度df1,又分为一般与配对两种情形,本节介绍一般四格表的2检验,主要是用来推断两个总体率或构成比之间有无差别。一般四格表,在总频数n40且所有理论频数5时,用Pearson 2统计量;在总频数n40且有理论频数5但1时,用校正2统计量;在总频数n40或有理论频数1时,用Fisher精确概率法检验。计数资料的数据格式有两种,一种是频数表格式,如表8-1;一种是原始记录格式,如前面第4章统计描述中的表4-3,这两种格式在SPSS操作时有所不同。例8-1 欲研究内科治疗对某病急性期和慢性期的治疗效果有无不同,某医生收集了182例采用内科疗法的该病患者的资料,数据见表8-1。请分析不同病期的总体有效率有无差别?表8-1 两种类型疾病的治疗效果组别有效无效合计有效率(%)急性期693710665.1慢性期3046 7639.5合计998318254.4解 这是一般四格表,即急性期和慢性期的总体有效率相同。建立3列4行的数据文件,如图8-1,其中行变量r表示组别(值标签:1=“急性期”、2=“慢性期”),列变量c表示疗效(值标签:1=“有效”、2=“无效”),freq表示频数。1指定频数变量 选择菜单Data Weight cases,弹出Weight cases对话框,见图8-2;选中Weight cases by;在左边框中选中频数freq,并将其送入Frequency框中;单击OK。 图8-1 例8.1数据文件 图8-2 Weight cases对话框2进行2检验 选择菜单Analyze Descriptive Statistics Crosstabs(交叉表),弹出Crosstabs 主对话框;将组别r送入行变量Row(s)框,将疗效c送入列变量Column(s)框,如图8-3。单击Statistics(统计量)按钮,弹出Statistics对话框,选中左上角的Chi-square(2检验),如图8-4;单击Continue,返回如图8-3所示主对话框。单击Cells(单元格)按钮,弹出Cell Display对话框,再选中Expected(理论频数)和Row(行百分比),如图8-5;单击Continue,返回主对话框;单击OK,完成2检验,主要输出结果如图8-6、7所示。 图8-3 Crosstabs 主对话框 图8-4 Crosstabs:Statistics对话框图8-6是本例频数分布表的输出结果,每个方格中的3个数据分别表示实际频数、理论频数和实际频数在该行合计中所占的百分比(即该组的样本有效率或无效率),例如急性期和有效所对应的方格中的3个数据分别表示急性期组有效的实际频数69、理论频数57.7和急性期组的有效率65.1%。 图8-5 Crosstabs:Cell Display对话框 图8-6 例8-1频数分布表图8-7是本例2检验的输出结果,该表的下方提示本例有0个单元格的理论频数小于5,最小理论频数34.66,这些可以帮助我们选择2统计量和概率值。表中第一行Pearson Chi-Square是Pearson 2的计算结果,第二行Continuity Correction是校正2的计算结果,第四行Fishers Exact Test是Fisher精确概率法检验的计算结果。本例总频数n=18240,且所有理论频数5,故选用第一行的Pearson 2的计算结果,211.713,P=0.001,拒绝原假设H0,急性期和慢性期的总体有效率差异有统计学意义,再由图8-6可知,急性期样本有效率65.1%大于慢性期的39.5%,可以认为内科治疗对急性期的治疗效果优于慢性期的治疗效果。图8-7 例8-1检验结果 如果本例的数据格式不是表8-1所示的频数表格式,而是原始记录格式,SPSS数据文件将是2列182行,只有组别r和疗效c两列,没有频数freq列,182行中有69行1、1,37行1、2,30行2、1,46行2、2。在操作中,没有“(1)指定频数变量”这一步,其它操作和计算结果完全相同。例8-2 表8-2中的资料是240例心肌梗塞患者接受甲、乙两种不同治疗方法后24小时内的死亡情况,问两种疗法病死率是否有差别?表8-2 24小时内死亡情况疗法生存例数死亡例数合计病死率(%)甲187111985.6乙3664214.3合计223172407.1解 统计分析步骤同例8-1。由输出结果知,本例最小理论值为2.985,故用第二行Continuity Correction(校正2检验)的计算结果,22.796,P=0.0950.05,以水准不能拒绝原假设,差异没有统计学意义,即据此资料尚不能认为两疗法的病死率有差别。例8-3 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别?表8-3 两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组4182218.2非预防组561145.5合计9243327.3解 统计分析步骤同例8-1。本例n=3340,故用第四行Fishers Exact Test的计算结果,双侧P=0.1210.05,不能拒绝原假设,差异没有统计学意义,尚不能认为两组新生儿的HBV感染率有差别。8.2 配对四格表的2检验与一致性检验计数资料的配对设计常用于两种检验方法、诊断方法等的比较,如同一批病人以两种方法作检查或诊断,同一批样品用两种方法作检测等,其特点是对样本中各观察单位分别用两种方法处理。配对设计的计数资料的数据形式往往表示为配对四格表。表8-4 不同方法细菌检验结果甲法乙法合计1728180126880合计18476260例8-4 用甲、乙两法进行细菌检验,为比较两法的检验效果,将每份样品分成两份,分别用两种方法进行检验,得到260个样品的检验结果如表8-4,试问两种检验方法的检验结果有无差别?解 这是配对四格表。数据文件建立同例题8-1。1指定频数变量 操作同例8-1。2进行配对2检验 选择菜单Analyze Descriptive Statistics Crosstabs,在弹出的Crosstabs 主对话框中,将甲法r送入行变量Row(s)框,将乙法c送入列变量Column(s)框。单击Statistics(统计量)按钮,弹出Statistics对话框,选中McNemar(配对计数资料的2检验),选中Kappa(Kappa一致性检验);单击Continue,返回Crosstabs主对话框;单击OK,完成配对四格表2检验,主要输出结果如图8-8、9所示。图8-8 McNemar检验结果图8-8给出的是McNemar法检验配对计数资料检验的结果,McNemar检验的假设是H0:甲乙两法的检测结果相同。本例P=0.5030.05,不能拒绝H0,可以认为甲乙两法的检测结果相同。图8-9给出的是Kappa一致性检验结果。Kappa一致性检验的H0是:Kappa=0,即甲乙两种方法检测结果不一致。本例Kappa0.817,P=0.000,拒绝H0,甲乙两种方法检测结果存在一致性。根据经验,一般认为,Kappa0.75时表明两者一致性较好,0.75Kappa0.4时表明两者一致性一般,Kappa0.4时表明两者一致性较差。图8-9 Kappa一致性检验结果注意,McNemar检验只考虑了两法结果不一致的两种情况(b和c,本例的8和12),而没有考虑样本含量n和两法结果一致的两种情况(a和d,本例的172和68),所以,n很大而且a和d的数值很大(即两法的一致率较高),b和c的数值相对较小时,McNemar检验就失去了实用价值,此时如果使用McNemar检验,反而会得出两法有差异的结论来。而Kappa检验是利用列联表中的全部信息的。例如,表8-5中有两个配对四格表,McNemar检验结果完全相同,P均为0.0130.05,均得到两法检测结果不相同的结论,这个结论对右边的表格就不合适;对两个表用Kappa检验,左边表的Kappa=0.357,两法一致性较差;右边表的Kappa = 0.986,两法一致性很好。表8-5 配对四格表比较计算甲法乙法甲法乙法11121011 12 217 210178.3 行列表资料的2检验当列联表的行数或列数大于2时,通常称为行列表,也称R C表。行列表分双向无序、单向有序、双向有序且属性不同、双向有序且属性相同等四种类型,本章只介绍双向无序行列的2检验,采用Pearson 2公式计算统计量,常用于多个样本率(或构成比)的比较。一般认为,行列表资料中各格的理论频数不应 1,且1理论频数 5的格子数不应超过格子总数的1/5。若出现上述情况,可用下面四种方法解决增大样本含量,使理论频数变大;删去理论频数太小的行或列;把理论频数太小的行或列与性质相近的邻行或列合并;使用Fisher 确切概率方法计算。例8-5 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表8-6。问三种疗法的总体有效率有无差别?表8-6 三种疗法有效率的比较疗法有效无效合计有效率(%)物理疗法组199720696.6药物治疗组1641818290.1外用膏药组1182614481.9合计4815153290.4解 这是32表,即三种疗法的总体有效率全相同。建立3列6行的数据文件,如图8-10,变量的含义同例8-1。指定频数变量、Statistics(统计量)对话框操作、Cells(单元格)对话框操作都和例8-1相同,只是在Crosstabs主对话框操作中加一步:单击Crosstabs主对话框左下角的Exact按钮,在弹出的Exact Tests对话框中,选中Exact;单击Continue,返回Crosstabs主对话框。这步操作的目的是让SPSS计算出本题的Fisher 确切概率法的结果,因为默认情况下是不计算Fisher 确切概率的。图8-11是输出结果,本例最小理论频数13.80,所有理论频数均5,故用第一行Pearson 2的计算结果,221.038,P=0.000,拒绝H0,三种疗法的总体有效率不全相同。如果有理论频数 1,或1理论频数 5的格子数超过格子总数的1/5,则应该读取第三行Fishers Exact Test的计算结果。 图8-10 例8-5数据文件 图8-11 例8-5检验结果本例结论是拒绝H0,三种疗法的总体有效率不全相同,但不能说明任两个总体率之间都有差异,若想推断哪两个总体率有差异,还要进行两两比较,即对每两个疗法的差异作统计检验,然后做出结论。由于重复多次的假设检验会增大犯第一类错误的概率,因此必须重新规定检验水准,检验水准可以用公式来计算,其中k为参加检验的组数。本例k=3, 检验水准为,将三组进行两两四格表的2检验,结果是:物理疗法和药物治疗:26.756,P=0.0090.0167;物理疗法和外用膏药:221.323,P=0.0000.0167;药物治疗和外用膏药:24.591,P=0.0320.0167,所以可以认为物理疗法与药物治疗、外用膏药的有效率均有差别,而不能认为药物治疗和外用膏药的有效率有差别。8.4 分层资料的2检验在统计设计中常需进行分层设计,例如,在进行临床试验时,同一个试验需要由多个中心来完成。这样,在统计分析时也要进行分层分析以校正层的影响。例8-6 欲研究某项手术改进后,其术后并发症的发生与原来相比有无变化。在甲、乙两医院同时展开研究,试验组采用改进的手术方法,对照组采用原手术方法。术后并发症的发生情况如表8-7所示。分析两种手术方法的术后并发症有无差别。表8-7 两家医院不同手术方法术后并发症的发生情况医院方法术后并发症发生未发生合计甲改进138153291原方法301545乙改进9099189原方法201131解 本资料研究的是手术方法和术后并发症的关系,但医院在这里可能成为混杂因子,也对术后并发症有影响。因此分析时需按医院分层,研究排除层因素的干扰后,行变量和列变量是否有联系。建立4列8行的数据文件,如图8-12,其中分层变量h表示医院(值标签:1=“甲”、2=“乙”),行变量r表示手术方法(值标签:1=“改进”、2=“原方法”),列变量c表示并发症(值标签:1=“发生”、2=“未发生”),freq表示频数。1指定频数变量 同例8-1。2进行分层2检验 选择菜单Analyze Descriptive Statistics Crosstabs,弹出Crosstabs 主对话框;将手术r送入行变量Row(s)框,将并发症c送入列变量Column(s)框,将医院h送入分层变量“layer 1 of 1”框。单击Statistics按钮,在弹出的对话框中,选中Cochrans and Mantel-Haenszel statistics(CMH 2检验),单击Continue,返回Crosstabs主对话框;单击Cells按钮,在弹出的对话框,选中Row,单击Continue,返回Crosstabs主对话框;单击OK,完成分层资料的2检验,主要输出结果如图8-13至图8-16所示。 图8-12 例8-6数据文件 图8-13 例8-6频数分布表图8-13是频数分布表,每层的并发症未发生率都是改进手术方法高于原手术方法,因此,使用分层2检验的效果很好。图8-14是不同医院OR值一致性检验,概率P=0.844,表明不同医院间的OR值相同。图8-14 OR值的一致性检验 图8-15 分层2检验结果图8-15给出了分层2检验的结果,即去除了分层因素的影响后,对行变量和列变量关联的检验结果,共给出了CMH2检验和MH2检验两种结果,前者是后者的改进,本例8.780,P=0.003,表明去除医院混杂作用后,术后并发症是否发生与手术方法有关。图8-16是MH公共OR值估计,调整医院混杂作用后的公共OR值为0.470,表明去除医院混杂效应后,改进手术方法产生术后并发症的危险度大约为原手术方法的0.470倍。图8-16 MH公共OR值估计本章小结本章内容介绍了四种无序分类资料的2检验,在实际应用中,我们应根据资料所满足的前提条件和分析目的等,选用相应的2检验方法。四格表资料的2检验,用于研究两个总体率或构成比是否相等。在总频数n40和各理论频数T5时,用Pearson 2检验;当n40但有1T5时,要用校正的2检验;当或有T1时,用Fisher精确检验。行列表资料的2检验,用于多个样本率或构成比的比较。当行列表中有超过20格子的理论频数T5或有理论频数T1时,应采用Fisher确切概率法直接计算概率。配对2检验和一致性检验,用于对配对四格表资料进行相关与一致性检验。分层2检验,用于分析排除层因素的干扰后,行变量和列变量是否有联系。习题8习题8-1 某医院内科治疗一般类型胃溃疡病患者82例,治愈64人;治疗特殊类型胃溃疡病患者98例,治愈30人。问该医院内科对两种类型胃溃疡病人治愈率有无不同?习题8-2 某医师用复合氨基酸胶囊治疗肝硬化病人,观察其对改善实验室指标的效果,数据见表8-8。试对两组的改善及恢复正常率进行比较。表8-8 改善实验室指标的效果表8-9 肿瘤转移病人全消率分析分组改善未改善合计用药分组全消人数未全消人数合 计试验组23225试验组8210对照组11617对照组21012合计34842合计101222习题8-3 肿瘤转移病人全量放疗后用两种药物配合治疗,观察肿瘤消除的情况,结果见表8-9。问两种药物治疗后肿瘤全消率有无差别?习题8-4 为比较两种方法(中和法与血凝法)检测关节痛病人之抗“O”结果,观测105例关节痛患者,结果见表8-10。问:两种检验方法有无相关?其检验结果有无差别?表8-10 中和法与血凝法检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 放射性矿石磁选分离工艺考核试卷及答案
- 海洋水文气象观测员晋升考核试卷及答案
- D供应商分类标准及注册评价等测试卷附答案
- 银行招聘文秘试题及答案
- 银行行长考核试题及答案
- 中职专业试题及答案
- 电力专业试题及答案
- 茶学专业试题及答案
- 中药鉴定专业试题及答案
- 专业美术知识试题及答案
- 四级专项模拟考试题库及答案
- 川教版(2024)七年级上册信息科技全册教案
- 2025-2026学年新疆师范大学附属实验高中高三数学第一学期期末统考试题
- 深圳中考英语听说考试模仿朗读技巧点拨
- 电子商务法律法规及合规性要求
- 2025年人教版小学五年级数学下册期末考试卷(附参考答案和解析)
- 2025年第九届“学宪法、讲宪法”知识竞赛题库及答案(中小学组)
- 部编人教版小学语文六年级上册【课内外阅读理解专项训练(完整)】含答案
- 2025年高考陕晋宁青卷地理试题解读及答案讲评(课件)
- 3.1生活在新型民主国家 教案 -2025-2026学年统编版道德与法治九年级上册
- 内镜中心课件
评论
0/150
提交评论