第08章χ2检验_第1页
第08章χ2检验_第2页
第08章χ2检验_第3页
第08章χ2检验_第4页
第08章χ2检验_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章 2 2检验检验(Chi Square Test ) 大理学院公共卫生学院大理学院公共卫生学院 李灿委李灿委v 目的:目的: 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别v 检验统计量:检验统计量:2 2v 应用:应用:计数资料计数资料 第一节第一节 四格表资料的四格表资料的2 2 检验检验目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别要求:要求:两样本的两分类个体数排列成两样本的两分类个体数排列成 四格表资料四格表资料 例例8.18.1 为了解某中药治

2、疗原发性高血压的为了解某中药治疗原发性高血压的疗效,将疗效,将7070名高血压患者随机分为两组。试名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表辅助治疗,观察结果如表8-18-1,问该药治疗,问该药治疗原发性高血压是否有效?原发性高血压是否有效?一、基本公式和基本思想一、基本公式和基本思想 组 别 有效 无效 合计 有效率(%) 对照组 20(25.8)a 24(18.2)b 44)(ba 45.45 试验组 21(15.2)c 5(10.8)d 26)(dc 80.77 合 计 41)(ca 29)(db 70)

3、(n 58.57 表表8-1 两种疗法治疗原发性高血压的疗效两种疗法治疗原发性高血压的疗效 四格表资料的基本形式四格表资料的基本形式 22(), ()(1)A TT行数-1 列数A A:实际频数(实际频数(actual frequencyactual frequency)T T:理论频数(:理论频数(theoretical frequencytheoretical frequency)T TRC RC :第第R R 行行C C 列的理论频数列的理论频数n nR R :相应的行合计,:相应的行合计,n nC C :相应的列合计:相应的列合计 R CRCn nTnv 检验统计量检验统计量2 2 值

4、反映了实际频数值反映了实际频数与理论频数的吻合程度。与理论频数的吻合程度。 若检验假设若检验假设H0:1=2成立,四个格子的实际成立,四个格子的实际频数频数A 与理论频数与理论频数T 相差不应该很大,即统计相差不应该很大,即统计量量2 2 不应该很大。如果不应该很大。如果2 2 值很大,即相对应值很大,即相对应的的P 值很小,若值很小,若 P,则反过来推断,则反过来推断A与与T相相差太大,超出了抽样误差允许的范围,从而怀差太大,超出了抽样误差允许的范围,从而怀疑疑H0的正确性,继而拒绝的正确性,继而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12 。v自由度自由度愈大,愈大,2 2 值

5、也会愈大;所以值也会愈大;所以只有考虑了自由度只有考虑了自由度的影响,的影响,2 2 值才值才能正确地反映实际频数能正确地反映实际频数A和理论频数和理论频数T 的吻合程度。的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不检验的自由度取决于可以自由取值的格子数目,而不是样本含量是样本含量n n。四格表资料只有两行两列。四格表资料只有两行两列, ,=1=1,即在,即在周边合计数固定的情况下,周边合计数固定的情况下,4 4个基本数据当中只有一个基本数据当中只有一个可以自由取值。个可以自由取值。(1) 建立检验假设,确定检验水平。建立检验假设,确定检验水平。 H0:1=2 即试验组与对照组

6、的总体有效率相等即试验组与对照组的总体有效率相等 H1:12 即试验组与对照组的总体有效率不等即试验组与对照组的总体有效率不等 =0.05。假设检验步骤假设检验步骤T T1111 = =44(41/70)=25.8T T1212= =44(29/70)=18.2 T T2121= =26(41/70)=15.2 T T22 22 = = 26(29/70)=10.8(2)求检验统计量值)求检验统计量值22222(20 25.8)(24 18.2)(21 15.2)(5 10.8)8.4025.818.215.210.81)12)(12(3) 确定确定P 值,作出推断结论值,作出推断结论 当自由

7、度当自由度确定后,确定后,2分布曲线下右侧尾分布曲线下右侧尾 部的面积为部的面积为时,横轴上相应的时,横轴上相应的2值记作值记作2, P 0.05,按按=0.05=0.05水准,拒绝水准,拒绝H0 ,接受,接受H1 ,可以认为两组,可以认为两组治治疗原发性高血压疗原发性高血压的总体有效率不的总体有效率不等,即可认为等,即可认为该中药治疗原发性该中药治疗原发性高血压有效。高血压有效。 二、四格表资料检验的专用公式二、四格表资料检验的专用公式22()()()()()ad bc na b a c b d c d22(2052421)708.4044264129三、四格表资料检验的校正公式三、四格表资

8、料检验的校正公式 22(0.5)cA TT22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d 2 2分布是一连续型分布,而四格表资料属分布是一连续型分布,而四格表资料属离散型分布,由此计算得的离散型分布,由此计算得的 2 2统计量的抽统计量的抽样分布亦呈离散性质。为改善样分布亦呈离散性质。为改善2 2 统计量分统计量分布 的 连 续 性 , 则 需 行 连 续 性 校 正布 的 连 续 性 , 则 需 行 连 续 性 校 正(correction for continuity)(correction for continuity)。2 2 连续性校正仅用于连续性

9、校正仅用于 = =1 1 的四格表资料,当的四格表资料,当22 时,一般不作校正。时,一般不作校正。 四格表资料四格表资料2 2 检验公式的选择检验公式的选择:40, 5nT ,专用公式;专用公式; ,校正公式;,校正公式; ,直接计算概率。,直接计算概率。40, 15nT40 1nT或 例例8.2 8.2 某医学院抽样调查大学四年级和五年某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率级学生近视眼患病情况,四年级学生的近视率为为7.14%7.14%,五年级学生的近视率为,五年级学生的近视率为35.71%, 35.71%, 调调查结果见表查结果见表8-28-2。问该大学

10、四年级与五年级学。问该大学四年级与五年级学生的近视眼患病率是否不同?生的近视眼患病率是否不同? 表 8-2 两个年级大学生的近视眼患病率比较 年级 近视 非近视 合计 近视率(%) 四年级 2(4.67) 26(23.33) 28 7.14 五年级 5(2.33) 9 (11.67) 14 35.71 合计 7 35 42 16.67 2242(|2 926 5|)4223.62(25)(269)(226)(59)c P P 0.0050.005,按,按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0 ,还不,还不能认为四年级与五年级学生近视眼患病率不等。能认为四年级与五年级学生近视眼

11、患病率不等。 本资料若不校正时,本资料若不校正时, 结论与之相反。结论与之相反。25.4905. 0Pv条件:条件:v理论依据:理论依据:超几何分布。超几何分布。40n,或1T, 或P时, 四、四格表资料的四、四格表资料的FisherFisher确切概率法确切概率法 v基本思想基本思想在四格表周边合计数固定不变的在四格表周边合计数固定不变的条件下,计算表内条件下,计算表内4 4个实际频数变动时的个实际频数变动时的各种组合之概率各种组合之概率P Pi i ;再按检验假设用单;再按检验假设用单侧或双侧的累计概率侧或双侧的累计概率 P P ,依据所取的检,依据所取的检验水准验水准 做出推断。做出推断

12、。 各组合概率各组合概率P Pi i的计算的计算 在四格表周边合计数不变的条件下,在四格表周边合计数不变的条件下,表内表内4 4个实际频数个实际频数 a a, ,b b, ,c c, ,d d 变动的组合变动的组合数共有数共有“周边合计中最小数周边合计中最小数+1+1”个。如个。如例例8.38.3,表内,表内4 4个实际频数变动的组合数个实际频数变动的组合数共有共有8+1=98+1=9个,见表个,见表8-48-4。各组合的概率各组合的概率P Pi i服从超几何分布,服从超几何分布, 其和为其和为1 1。() ()!()!()! ! ! ! !iabcdacbdPa b c d n!表 8-3

13、两种疗法对腰椎间盘脱出症的疗效 疗法 治愈 未治愈 合计 治愈率(%) 新疗法 7 2 9 77.78 保守疗法 2 6 8 25.00 合计 9 8 17 52.94 例例8.3 8.3 将将1717名腰椎间盘脱出症患者随机分到名腰椎间盘脱出症患者随机分到两组,分别用两种方法治疗,结果见表两组,分别用两种方法治疗,结果见表8-38-3,问两种疗法的疗效是否不同?问两种疗法的疗效是否不同? 表 8-4 各种组合的四格表计算的概率 四格表序号 治愈 未治愈 a-Ta P 1 1 8 8 0 -3.76 0.000370 2 2 7 7 1 -2.76 0.011847 3 3 6 6 2 -1.

14、76 0.096750 4 4 5 5 3 -0.76 0.290251 5 5 4 4 4 0.24 0.362814 6 6 3 3 5 1.24 0.193501 7* 7 2 2 6 2.24* 0.041464* 8 8 1 1 7 3.24 0.002962 9 9 0 0 8 4.24 0.000041 *:为实际四格表 二、检验步骤(二、检验步骤(本例本例n=17 0.05. 0.05.按按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0 。尚不能认为。尚不能认为两种培养基的阳性培养率不同。两种培养基的阳性培养率不同。 第三节第三节 行行列表资料的列表资料的2 2检验检

15、验 行行列表资料列表资料 多个样本率比较时,多个样本率比较时, 有有 R R 行行 2 2 列,称为列,称为 R R 2 2表;表; 两个样本的构成比比较时,两个样本的构成比比较时, 有有 2 2 行行 C C 列,称列,称 2 2C C 表;表; 多个样本的构成比比较,多个样本的构成比比较, 有有 R R 行行 C C 列,称为列,称为 R R C C 表。表。检验统计量检验统计量22(1)(1)(1)RCAnnn行 数列 数TTA22)(多个样本率的比较多个样本率的比较表 8-6 3 种方案治疗肝炎的疗效 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组

16、 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 例例8.5 8.5 某医院用某医院用3 3种方案治疗急性无黄疸型种方案治疗急性无黄疸型病毒肝炎病毒肝炎254254例,观察结果见表例,观察结果见表8-68-6,问,问3 3种疗种疗法的有效率是否不同。法的有效率是否不同。 检验步骤:检验步骤:H H0 0:3 3种治疗方案的有效率相等种治疗方案的有效率相等H H1 1:3 3种治疗方案的有效率不全相等种治疗方案的有效率不全相等 =0.05=0.05 ) 11097415145745910980451458035109100491

17、4510051(2542222222 ) 10279. 03244. 02322. 01056. 02203. 01794. 0(254 81.22 = (3-1)(2-1) = 2 P P 0.05 0.05 ,在,在=0.05=0.05的检验水准下,的检验水准下,拒绝拒绝H H0 0,接受,接受H H1 1,可以认为三种疗法的有效率有差别。可以认为三种疗法的有效率有差别。 样本构成比的比较样本构成比的比较例例8.6 8.6 某研究人员收集了亚洲、欧洲和北美洲某研究人员收集了亚洲、欧洲和北美洲人的人的A A、B B、ABAB、O O血型资料,结果见表血型资料,结果见表8-78-7,问,问不同

18、地区人群不同地区人群ABOABO血型分类构成比是否不同。血型分类构成比是否不同。 表 8-7 三个不同地区血型样本的频数分布 地区 A B AB O 合计 亚洲 321 369 95 295 1080 欧洲 258 43 22 194 517 北美洲 408 106 37 444 995 合计 987 518 154 933 2592 检验步骤检验步骤H H0 0:不同地区人群血型分布总体构成比相同:不同地区人群血型分布总体构成比相同H H1 1:不同地区人群血型分布总体构成比不全相同:不同地区人群血型分布总体构成比不全相同 =0.05=0.0522223213694442592(1)297.

19、38987 1080518 1080933 995(3 1)(4 1)6P P 0.05 0.05 ,在,在=0.05=0.05检验水准下,拒绝检验水准下,拒绝H H0 0,认为三个不同地区的人群血型分布总体构成比有差认为三个不同地区的人群血型分布总体构成比有差别。别。 2 2分割法分割法(partitions of (partitions of 2 2 method) method) ScheffeScheffe可信区间法可信区间法 SNKSNK法法 多个样本率间的多重比较多个样本率间的多重比较行行列表的分割列表的分割 重新规定检验水准:重新规定检验水准: I型错误的概率不变。型错误的概率不

20、变。检验水准的估计方法:检验水准的估计方法: 根据分析目的根据分析目的1 1多个实验组间的两两比较多个实验组间的两两比较 2) 1(2kkkK K:为样本率的个数为样本率的个数 2=k 2 2实验组与同一个对照组的比较实验组与同一个对照组的比较 K K:为样本率的个数为样本率的个数 1k表8-8 1时 的2界 值 表 ( 供 多 个 样 本 率 间 的 多 重 比 较 用 ) 2 P 2 P 2 P 6.24 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.

21、00455 8.73 0.00313 例例8.7 8.7 对例对例8.58.5中表中表8-68-6的资料进行两两比的资料进行两两比较,以推断是否任两种疗法治疗急性无黄较,以推断是否任两种疗法治疗急性无黄疸型病毒肝炎的有效率均有差别?疸型病毒肝炎的有效率均有差别? 表8-6 3种方案治疗肝炎的疗效 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 检验步骤检验步骤本例为本例为3 3个实验组间的两两比较个实验组间的两两比较 0H:BA,即任两对比组

22、的总体有效率相等 1H:AA,即任两对比组的总体有效率不等 0.05 0167. 0305. 02/ ) 13( 305. 0例例 8.8 8.8 以例以例8.58.5中表中表8-68-6资料中的中药治资料中的中药治疗组为对照组,西药治疗组与中西药结合疗组为对照组,西药治疗组与中西药结合为试验组,试分析两试验组与对照组的总为试验组,试分析两试验组与对照组的总体有效率有无差别?体有效率有无差别? 本例为各实验组与同一对照组的比较本例为各实验组与同一对照组的比较0H:CT,即各试验组与对照组的总体有效率相等 1H:CT,即各试验组与对照组的总体有效率不等 0.05 各试验组与同一对照组比较的各试验组与同一对照组比较的P P值结果见表值结果见表8-98-9025. 013 可以认为中药与中西药结合治疗肝炎可以认为中药与中西药结合治疗肝炎的有效率有差异,中西药结合的疗法好于的有效率有差异,中西药结合的疗法好于单纯用中药的疗法。尚不能认为西药与中单纯用中药的疗法。尚不能认为西药与中药治疗肝炎的有效率有差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论