第九章卡方检验_第1页
第九章卡方检验_第2页
第九章卡方检验_第3页
第九章卡方检验_第4页
第九章卡方检验_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、检验检验 2第九章第九章 目的目的: 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率比较的分割多个样本率比较的分割 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。 检验统计量检验统计量: 应用应用:计数资料:计数资料2 (1) 分布是一种连续型分布:按分布的密度函数可给出分布是一种连续型分布:按分布的密度函数可给出自由度自由度=1,2,3,的一簇分布曲线的一簇分布曲线 (图(图6-10)。)。 (2) 分布的一个基本性质是可加性:分布的一个基本

2、性质是可加性: 如果两个独立的如果两个独立的随机变量随机变量X1和和X2分别服从自由度分别服从自由度1和和2的分布,的分布,即即 ,那么它们的和(,那么它们的和( X1+X2 )服从自由度)服从自由度( 1+2 )的)的 分布,即分布,即 。 22122212, XX212()XX(3)2界界值值:当当确确定定后后,2分分布布曲曲线线下下右右侧侧尾尾部部的的面面积积为为时时,横横轴轴上上相相应应的的2值值,记记作作2, (见见附附表表 8)。2值值愈愈大大,P 值值愈愈小小;反反之之,2值值愈愈小小,P 值值愈愈大大。 12200.10.20.30.40.502468101214162()f2

3、1610附表8给出了自由度取不同值时, 分布单侧尾部面积的界值 ,它满足条件根据的定义,当自由度 时, 分布的界值为标准正态分布界值的平方。22, 22,()P 0112第一节第一节 2 2表表 检验检验2目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料一一、两独立样本率检验两独立样本率检验(一)(一)两独立样本率资料的四格表形式 例例9-1 为研究肿瘤标志物癌胚抗原(为研究肿瘤标志物癌胚抗原(CEA)对)对肺癌的诊断价值,随机抽取肺癌的诊

4、断价值,随机抽取72例确诊为肺癌的患例确诊为肺癌的患者为肺癌组,者为肺癌组,114例接受健康体检的非肺癌患者为例接受健康体检的非肺癌患者为对照组。用对照组。用CEA对其进行检测,结果呈阳性反应对其进行检测,结果呈阳性反应者病例组中者病例组中33例,对照组中例,对照组中10例。问两组人群的例。问两组人群的CEA阳性率有无差异?阳性率有无差异? 表表9-1 CEA对两组人群的诊断结果对两组人群的诊断结果* 分 组 阳性 阴性 合计 阳性率(%) 肺癌组 33(16.6) 39(55.4) 72 45.8 对照组 10(26.4) 104(87.6) 114 8.8 合 计 43 143 186 2

5、3.1 * 括号内为理论频数。 本例资料经整理成表本例资料经整理成表9-1形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有33、39、10、104 四个基本数据,其余数据均由此四个四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。数据推算出来的,故称四格表资料。(二)(二) 检验的基本思想检验的基本思想2处处理理组组 发发生生数数 未未发发生生数数 合合计计 甲甲 a b a+b 乙乙 c d c+d 合合 计计 a+c b+d n 表表9-2 四格表资料的基本形式四格表资料的基本

6、形式 基本思想:可通过基本思想:可通过 检验的基本公式检验的基本公式来理解。来理解。22(), ()(1)A TT行数-1 列数式中,式中,A为实际频数(为实际频数(actual frequency),), T为理论频数(为理论频数(theoretical frequency)。)。2 理论频数理论频数 是根据检验设是根据检验设 ,且,且用合并率用合并率 来估计而定的。来估计而定的。 T012:H (92)acacabcdn11()() (93)aab acTTn21()() (94)ccd acTTn (95)bdbdabcdn12()() (96)bab bdTTn22()() (97)d

7、cd bdTTn理论频数由下式求得:理论频数由下式求得: R CRCn nTn式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相应的行合计 nC 为相应的列合计为相应的列合计 检验统计量检验统计量 值反映了实际频数与理值反映了实际频数与理论频数的吻合程度。论频数的吻合程度。 若检验假设若检验假设H0:1=2成立,四个格子的实际频成立,四个格子的实际频数数A 与理论频数与理论频数T 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。如果不应该很大。如果 值很大,即相对应的值很大,即相对应的P 值很值很小,若小,若 ,则反过来推断,则反过来推断A

8、与与T相差太大,超出相差太大,超出了抽样误差允许的范围,从而怀疑了抽样误差允许的范围,从而怀疑H0的正确性,的正确性,继而拒绝继而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12 。P22 由公式(由公式(9-1)还可以看出:)还可以看出: 值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆是正值,故自由度皆是正值,故自由度愈大,愈大, 值也会愈大;所以只有考虑值也会愈大;所以只有考虑了自由度了自由度的影响,的影响, 值才能正确地反映实际频数值才能正确地反映实际频数A和理论频和理论频数数T 的吻合程度。的吻合程

9、度。 检验的自由度取决于可以自由取值的格检验的自由度取决于可以自由取值的格子数目,而不是样本含量子数目,而不是样本含量n n。四格表资料只。四格表资料只有两行两列,有两行两列,=1=1,即在周边合计数固定的情,即在周边合计数固定的情况下,况下,4 4个基本数据当中只有一个可以自由个基本数据当中只有一个可以自由取值。取值。 22()A TT2()A TT222(1) 建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2H1:12=0.05。(三)(三) 假设检验假设检验(2)求检验统计量值)求检验统计量值 1172 43/18616.6T ,1272 16.655.4T 2143

10、 16.626.4T,2211426.487.6T。 1) 12)(12( 22222(33 16.6)(3955.4)(1026.4)(10487.6)16.655.426.487.611112()34.3216.416.655.426.487.6以以= =1 1 查查附附表表 8 8 的的2界界值值表表得得005. 0P。按按05. 0 检检验验水水准准拒拒绝绝0H,接接受受1H,肺肺癌癌患患者者癌癌胚胚抗抗原原的的 阳阳性性率率显显著著高高于于健健康康人人,提提示示可可能能具具有有临临床床诊诊断断价价 值值。 四格表资料检验的专用公式四格表资料检验的专用公式22()()()()()ad

11、bc na b a c b d c d2186(33 104 10 39)234.1072 43 143 114( (四四) )四格表资料检验的校正公式四格表资料检验的校正公式 22(0.5)cA TT22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d 分布是一连续型分布,而四格分布是一连续型分布,而四格表资料属离散型分布,由此计算得表资料属离散型分布,由此计算得的的 统计量的抽样分布亦呈离散性统计量的抽样分布亦呈离散性质。为改善质。为改善 统计量分布的连续性,统计量分布的连续性,则进行连续性校正。则进行连续性校正。222四格表资料 检验公式选择条件: 40,

12、5nT2 ,不校正的理论或专用公式; ,校正公式; ,直接计算概率。40, 15nT40 1nT或 连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一般不作校正。时,一般不作校正。 212 例例9-2 将将116例癫痫患者随机分例癫痫患者随机分为两组,一组为两组,一组70例接受常规加高压氧例接受常规加高压氧治疗(高压氧组),另一组治疗(高压氧组),另一组46例接受例接受常规治疗(常规组),治疗结果见表常规治疗(常规组),治疗结果见表7-4。问两种疗法的有效率有无差别?问两种疗法的有效率有无差别? 表9-3 两种疗法治疗癫痫的效果 治疗结果 治疗方法 有效 无效 合计 有

13、效率(%) 高压氧组 66(62.8) 4(7.2) 70 94.3 常规组 38(41.2) 8(4.8) 46 82.6 合 计 104 12 116 89.7 012112:, :, 0.05HH 本例 ,故用四格表资料 检验的校正公式22116, 4.8nT但2 ,查 界值表得 。按 检验水准不拒绝 ,尚不能认为组有效率不等。 1210. 005. 0 P05. 00H2(66 84 38116 2)11622.9270 46 104 12c 本资料若不校正时,本资料若不校正时, 结论与之相反。结论与之相反。24.080.05P,二、二、两相关样本率检验两相关样本率检验(McNemar

14、检验)检验) 配对四格表资料的配对四格表资料的 检验检验2与计量资料推断两总体均数是否与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,是否有差别也有成组设计和配对设计,即即四格表资料四格表资料和和配对四格表资料配对四格表资料。 例例9-3某抗癌新药的毒理研究中,将某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因只大鼠按性别、窝别、体重、年龄等因素配成素配成39对,每个对子的两只大鼠经随机对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙

15、剂量注射,试分配,分别接受甲剂量和乙剂量注射,试验结果见表验结果见表9-4。试分析该新药两种不同剂。试分析该新药两种不同剂量的毒性有无差异。量的毒性有无差异。 表表9-4 某抗癌新药两种剂量的毒理实验结果某抗癌新药两种剂量的毒理实验结果 乙剂量 甲剂量 死亡() 生存() 合 计 死亡() 6(a) 12(b) 18 生存() 3(c) 18(d) 21 合 计 9 30 39 上述配对设计实验中,就每个对子而上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有言,两种处理的结果不外乎有四种可能四种可能:两只大鼠均死亡(甲两只大鼠均死亡(甲乙乙)数数(a);两只均生存(甲两只均生存(甲乙

16、乙)数数(d);其中一只死亡(甲其中一只死亡(甲乙乙 )数数(b);其中一只死亡(甲其中一只死亡(甲乙乙)数数 (c)。其中,其中,a, d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。cbcb22)(, 1 cbcbc22) 1(, 1= 检验统计量为检验统计量为H0: 总体四格表中甲乙 的对子数与甲乙的对子数出现频率相同 (两剂量毒性相同) ; H1: 总体四格表中甲乙 的对子数与甲乙的对子数出现频率不同 (两剂量毒性不同) ; =0.05 已知样本四格表中,b=12,c=3,因 b+c=15,故将其代

17、入公式 9-13,有 查附表 8,20.025,15.02,20.05,13.84,得 0.025P0.05,按=0.05 水准拒绝 H0,接受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 bc) 。 27. 4312) 1321(22c注意:注意: 本法一般用于样本含量不太大的资料。因本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量而未考虑样本含量n和两法结果一致的两种情和两法结果一致的两种情况况(a, d)。所以,当。所以,当n很大且很大且a与与d的数值很大的数值很大(即两法的一致率

18、较高),(即两法的一致率较高),b与与c的数值相对较的数值相对较小时,即便是检验结果有统计学意义,其实际小时,即便是检验结果有统计学意义,其实际意义往往也不大。意义往往也不大。第二节第二节R C表 检验 2行行列表资料列表资料 多个样本率比较时,有R行2列,称为R 2表; 两个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R C表。检验统计量检验统计量22(1)(1)(1)RCAnn n行数列数一、多个样本率的比较一、多个样本率的比较 例9-4用A、B、C三种不同方法分别处理新生儿脐带,发生感染的情况见表9-6,试比较3种不同方

19、法的脐带感染率有无差异。 表9-6 三种脐带处理方法的脐带感染情况 脐带感染 处理组 感染 未感染 合计 感染率(%) A 76 3143 3219 2.36 B 15 2409 2424 0.62 C 2 762 764 0.26 合计 93 6314 6407 1.45 二、两组构成比的比较 例9-5为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见表9-7,问两组患者尿路疼痛原因的分布有无差异? 表9-7 两组患者尿路疼痛原因的分布 尿路疼痛原因 分 组 尿路感染 器械损伤 其它 合计 治疗组 34 29 9 72 对照组 29 35 8 72 合 计 63 64 17 144 2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有 22222234299293582144(1)1.027263726472 177263726472 17(21)(31)2 3. 确定 P 值,下结论。查2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论