




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章 X2 检验 X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的 显著性,也可检验两类事物之间是否存在一定的关系。 一、两个率的比较 (一)X2 检验的基本公式 下页末行的例 3.1 是两组心肌梗塞病人病死率的比较,见 表 3.5,其中对照组未用抗凝药。两组病人的病死率不同,抗凝药组为 25.33%,对照组为 40.8%。造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体 病死率确实有所不同。为了区别这两种情况,应当进行 X2 检验。其基本步骤如下: 1首先将资料写成四格表形式,如表 3.6。 将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实 际频数,符号为 A,即实际观察得来的数字。 2.建立检验假设 为了进行检验,首先作检验假设:两种疗法的两总体病死率相等, 为 35%(即 70/200) ,记为 H0:1=2。即不论用或不用抗凝药,病死率都是 35%,所以 亦可以换一种说法:病死率与疗法无关。 上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。当 H0 被拒绝时,就意 味着接受其对立假设即备择假设 H1。此例备择假设为两总体病死率不相等,记为 H1:12 因为我们观察的是随机现象,所以无论是接受或拒绝 H0 都冒有一定风险,即存在着 错判的可能性。一般要求,当错误地被拒绝的概率 不超过一定的数值,如 5%(或 0.05) , 此值称为检验水准,记为 =0.05。 3计算理论频数 根据“检验假设”推算出来的频数称理论频数,符号为 T。计算方法 如下:假设两总体病死率相同,都是 35.0%,那么抗凝血组治疗 75 人,其死亡的理论频数 应为 7535.0%=26.25 人,而生存的理论频数为 75-26.25=48.75 人。用同样方法可求出对照 组的死亡与生存的理论频数,前者为 43.75 人。后者为 81.25 人。 然后,把这些理论频数 填入相应的实际频数格内,见表 3.6 括号内数字。 计算理论频数也可用下式(3.4) TRC=nRnC/N (3.4) 式中,TRC 为 R 行与 C 列相交格子的理论频数,nR 为与计算的理论频数同行的合计 数,nC 为与该理论频数同列的合计数,N 为总例数。 例如;表 3.6 第一行与第一列相交格子的理论频数(T1)为 T1 7570/200=26.25 用两种方法计算,结果是相同的。 4计算 2 值,计算 2 值的基本公式为: X2=(A-T)2/t (3.5) 式中,A 为实际频数,T 为理论频数,为求和符号。 将表 3.6 里的实际频数与理论频数代入式(3.5)即求得 2 值。此例 2=4.929。 从式 3.5 中可看出,实际频数与理论频数之差(A-T)愈小,所得的 2 值就愈小,理 论频数是根据检验假设推算出来的,若与实际频数相差不大,说明假设与实际情况符合, 于是就接受 H0,认为两病死率无显著差别;反之,若(A-T)大,则 2 值亦大,说明假 设与实际不符,就拒绝假设,认为两病死率有差别。但 2 值大还是小,要有一个比较的标 准,要查 2 值表(附表 1) ,查 2 值表前先要定自由度。 5求自由度 自由度是数学上的一个名词。在统计中,几个数据不受任何条件(如统 计量,即样本特征数)的限制,几个数据就可以任意指定,称为有几个自由度。若受到 P 个条件限制,就只有 n-p 个自由度了。例如在四格表中有四个实际频数,如没有任何条件 限制,则 4 个数字都可任意取值,有 4 个自由度,当 a b,,c d,a c,b d 都固定后,在 a、b、c、d 四个实际频数中,只能有一个频数可任意指定了,因此,四格表的自由度为 1。其计算公式为: =(R-1) (C-1) (3.6) 式中, 为自由度,R 为横行数,C 为纵列数。 四格表有 2 行和 2 列(注意:总计与合计栏不算在内) 。因此 =(2-1)(2-1)=1。 6求 P 值,作结论 根据自由度查 2 值表(附表 1) 。此表的左侧 为自由度,表内 数字 2 值,表的上端 P 是从同一总体中抽得此样本 2 值的概率。三者关系是:在同一自 由度下,2 值越大,从同一总体中抽得此样本的概率 P 值越小;在同一 P 值下,自由度越 大,2 值也越大。2 值与概率 P 呈相反的关系。2 检验的常用界值为: 20.05 在 =0.05 水准处接受 H0,差别不显著 20.0520.01 在 =0.05 水准处拒绝 HO,接受 H1,差别显著 220.01()P0.01 在 =0.01 水准处拒绝 HO,接受 H1,差别显著 这里 是预定的检验水准。20.05()是当自由度为 时与 P=0.05 相对应的 2 值, 简称 5%点,20.01()是与 P=0.01 相对应的 2 值,简称 1%点。 当 =1 时,20.05(1)3.84,20.01(1)=6.63。本例自由度为 1,求得 2=4.929,介于 3.84 与 6.63 之间,或写成 20.05(1)P0.01。在 =0.05 水准处拒绝 H0,接受 H1,两总体率不等。对照组的病死率较抗凝 血组高。 在 =0.05 水准处拒绝 H0,说明若在同样情况下作 100 次判断,将有 5 次或不到 5 次 的机会,将原没有差别的两总体率错判为有差别,或说这样判断犯 I 型错误的概率不超过 5%。 下面将实例的检验步骤集中列出。 例 3.1 两组心肌梗塞病人的病死率可见于表 3.5,其中对照组未用抗凝药。抗凝血组 病死率为 25.33%,对照组为 40.80%,问两组病死率有无显著差别? 表 3.5 两组心肌梗塞病人病死率比较 组别治疗人数死亡人数病死率(%) 抗凝血组751925.33 对 照 组1255140.80 总 计2007035.00 检验步骤如下: 1将资料列成四格表形式,如表 3.6。 表 3.6 四格表式样 死亡生存合计 抗凝血组19(26.25)56(48.75)75 对照组51(43.75)74(81.25)125 总 计70130200 2H0:两疗法的总体病死率相同,即 1=2 H1:两疗法的总体病死率不同,即 12 =0.05 3求理论频数 抗凝血组: 死亡人数为 7535.0%=26.25 人 存活人数为 75-26.25=48.75 人 对照组: 死亡人数为 12535.0%=43.75 人 存活人数为 125-43.75=81.25 人 把理论频数填入相对应的实际频数格内,见表 3.6 括号内数字。 4求 2 值 将表 3.6 里的数值代入式(3.5)得, 5求自由度,确定 P 值,作结论 =(2-1) (2-1)=1,2 0.05(1)=3.84,2 0.01(1)=6.63, 本例 2 =4.929,2 0.05(1)P0.01,在 =0.05 水准处拒绝 H0,接受 H1,即两总体病死率不等,对照组病死率较抗凝血组高。 上例告诉我们,两个样本病死率一大一小,在未作检验之前,很难说它们两总体率是 否有差别,为了作出正确判断,作 X2 检验。先假设两总体病死率相同,推算理论频数, 由实际频数与理论频数计算 2 值,二者相差越大,2 值也越大。本例得 2=4.929,根据 自由度为 1 时的 2 分布推断,从同一总体内抽样,出现 2 值等于或大于 4.929 的概率较 小,每一百次中在 5 次以下,1 次以上,因此检验假设被拒绝,而判断为有显著差别。 例 3.2 表 3.7 是六六六粉的两种配方进行野外烟剂灭黄鼠实验的观察结果。 表 3.7 六六六粉两种配方灭黄鼠的效果 烟薰后鼠洞情况 未盗开盗 开 合 计 (实验观察 洞数) 灭洞率 (%) 04 号配方13(16.63)9(5.37)2259.1 05 号配方80(76.37)21(24.63)10179.2 总 计933012375.6 (三)四格表中求 2 的专用公式 用上述基本公式(3.5)求 2 值,需要求出与实际 频数一一对应的理论频数,运算较繁。在四格表中,用下列专用公式较为简便。式中 a、b、c、d 为四格表中的实际频数,N 表示总例数(即 N=a b c d) 。 现仍以表 3.5 资料为例,先写成四格表形式,如表 3.8。 表 3.8 四格表求 2 值专用公式的符号 死 亡生存合 计 抗凝血组19(a)56(b)75(a b) 对照组51(c)74(d)125(c d) 70(a c)130(b d)200(N) 将实际频数代入式(3.8)得, 这里用专用公式求得的 2 值与前面用基本公式求得的结果完全不同,有时这两个公式 求得的结果小数点后几位可能稍有出入,这是由于受小数四舍五入的影响。 前面已介绍了连续性校正公式(3.7) ,为使运算更为简便,下面列出专用公式的连续 性校正公式(3.9) ,并以表 3.8 资料代入计算如下: 所得结果与式(3.7)求得的一致。 二、多个率或多个构成比的比较 (一)2K 表的专用公式,前面已讨论了,两个率的比较用四格表专用公式计算 2 值 较为简便。如果是多个率比较,就要列成 2K 表。这里的 K 暂为所比较的组数,2 为每个 组内所划分的类型数。求 2 值时本可用基本公式计算,但以用下列专用公式为便: 表 3.9 2K 表形式之一 a1 a2 b1 b2 n1 n2 aibiN 公式中符号的意义参阅表 3.9,以上两个公式的计算结果是完全一样的。 例 3.3 某地观察磺胺三甲氧吡嗪加增效剂(吡嗪磺合剂)预防疟疾复发的效果,用已 知有抗疟疾复发效果的乙胺嘧啶和不投药组作对照,比较三组的疟疾复发率,资料如表 3.10,问三组复发率有无显著差别? 表 3.10 三个组的疟疾复发率 组 别观察例数复发例数复发率(%) 吡嗪磺合剂 乙胺嘧啶 对 照 1996 473 484 76 27 53 3.81 5.71 10.95 合 计29531565.28 2 检验步骤如下: 1将表 3.10 资料写成 2K 表形式,见表 3.11。注意:这里必须把各组的观察例数分 为复发和未复发两部分,这样表 3.10 就为写成 23 表。 表 3.11 三个组疟疾复发率的比较 复发未复发合 计 吡嗪磺合剂7619201996 乙胺嘧啶27446473 对 照53431484 合 2H0:三个总体复发率相同 H:三个总体复发率不全相同 =0.05 3求 2 值 将表 3.11 的数值代入式(3.10) (因为在表 3.11 中,各组的 a 值较小,计 算较方便)得: 4求自由度,确定 P 值,作结论 =(K-1) (2-1)=(3-1) (2-1)=2,查 2 值表得 20.01(2)=9.21,本例 2=39.9220.01(2),P0.05) ,说 明吡嗪磺合剂有预防疟疾复发的作用,其效果不低于乙胺嘧啶。 本例 2K 表的 2 是指得发、未复发两项,K 为比较的组数,K=3。如果比较组数只有 2,而构成每组的项数则多于 2,如甲状腺肿的型别构成可分为弥漫型、结节型、混合型三 种。这类资料亦同样可用 2K 表专用公式进行检验。这时把 2 作为比较组数,K 作为项数, 检验方法同上,表 3.12 是 2K 表的另一种形式。 表 3.12 2K 表形式之二 a1a2 b1b2 ai bi n1n2N 例 3.4,为研究不同地域甲状腺型别的构成有无显著差别,某省对两个县的居民进行甲 状腺肿调查,得资料如表 3.13,问甲乙两县各型甲状腺肿患者构成比有无显著判别? 表 3.13 某省甲乙两县甲状腺肿患者型别构成比较 县名弥漫型结节型混合型合计 甲县48624492 乙合计61926255936 检验步骤如下: 1H0:两总体甲状腺肿型别构成相同 H1:两总体甲状腺肿型别构成不同 =0.05 2求 2 值, 将表 3.13 中的数值代入式 3.10 得: 3求自由度,确定 P 值,作结论。 =(3-1) (2-1)=2,查 2 值表得 20.01(2)=9.21,本例,2=494.36,P20.01(2),P0.05) ,说 明吡嗪磺合剂有预防疟疾复发的作用,其效果不低于乙胺嘧啶。 本例 2K 表的 2 是指得发、未复发两项,K 为比较的组数,K=3。如果比较组数只有 2,而构成每组的项数则多于 2,如甲状腺肿的型别构成可分为弥漫型、结节型、混合型三 种。这类资料亦同样可用 2K 表专用公式进行检验。这时把 2 作为比较组数,K 作为项数, 检验方法同上,表 3.12 是 2K 表的另一种形式。 表 3.12 2K 表形式之二 a1a2 b1b2 ai bi n1n2N 例 3.4,为研究不同地域甲状腺型别的构成有无显著差别,某省对两个县的居民进行甲 状腺肿调查,得资料如表 3.13,问甲乙两县各型甲状腺肿患者构成比有无显著判别? 表 3.13 某省甲乙两县甲状腺肿患者型别构成比较 县名弥漫型结节型混合型合计 甲县48624492 乙合计61926255936 检验步骤如下: 1H0:两总体甲状腺肿型别构成相同 H1:两总体甲状腺肿型别构成不同 =0.05 2求 2 值, 将表 3.13 中的数值代入式得: 3求自由度,确定 P 值,作结论。 =(3-1) (2-1)=2,查 2 值表得 20.01(2)=9.21,本例,2=494.36,P0.01,在 =0.05 水准处拒绝 H0,接受 H1,甲、乙两县甲状腺肿型别构成有差别(P0.01) 。甲县以弥漫型 为主,而乙县结节型较多,地域与患者的型别构成具有一定的关系。 此类资料经 2 检验作结论,如果不显著,说明两组资料的构成比来自同一总体,没有 显著差别。如果结论显著,说明两组的构成比来自不同总体,差别有显著性。同时要指出 两组构成的主要区别。 (二)RC 表的通用公式当资料的行数和列数都超过 2 时称 RC 表。对此种资料作假 设检验时,可用基本公式但运算较繁,如果用 RC 表的通用公式计算 2 值,较为简便。 式中,Aij 为 i 行第 j 列的实际频数,ni 为第 i 行的合计数,nj 为第 j 行列的合计数, N 为总频数。 这个公式也系由基本公式(3.5)推导出来,式(3.12)也可用以求四格表、2K 表资 料的 X2 值,故称通用公式,用此公式不需计算理论频数,与基本公式(3.5)相比,较为 简便。 例 3.5 某院肝胆外科在手术中观察了胆结石的部位与类型得资料如表 3.14,试分析两者 间有无关系存在? 表 3.14 胆结石类型与部位的关系 例 数百 分 比结石部位总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校食堂员工用人合同
- 住宅区电梯维修合同范例
- 供电水合同范例
- 保价合同范例
- 保姆合同范例写
- 体育赛事赛事场馆运营与管理合同
- 医院医学伦理委员会伦理审查与备案服务合同
- 大型购物中心品牌专柜租赁合同及消费者互动体验协议
- 高端网球赛事官方票务销售合作伙伴合同
- 武侠剧本改编授权及电视剧制作合同
- 《特种设备无损检测机构检测能力确认 工作导则》
- 投标项目售后服务方案
- 国土安全课件
- 第一讲-17.1一元二次方程的概念
- 【MOOC】《电子技术实验》(北京科技大学)中国大学MOOC慕课答案
- 《活塞式空压机》课件
- 新三板、北京交易所简介及上市利弊分析
- 化学实验室5S管理
- 桥梁安全隐患排查
- 2023年《计量经济学》期末试卷
- 2025年高考历史必背的228个知识点
评论
0/150
提交评论