医学统计方法之卡方检验_第1页
医学统计方法之卡方检验_第2页
医学统计方法之卡方检验_第3页
医学统计方法之卡方检验_第4页
医学统计方法之卡方检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、检验2chi-square test主要内容:主要内容:第一节第一节 四格表四格表 检验检验第二节第二节 配对四格表配对四格表 检验检验第三节第三节 行行列表列表 检验检验222分布分布2 是一种连续型分布,可用于检是一种连续型分布,可用于检验资料的实际频数和按检验假设计验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早算的理论频数是否相符等问题。早在在1875年,年,f. helmet即得出来自正即得出来自正态总体的样本方差的分布服从卡方态总体的样本方差的分布服从卡方分布。分布。1900年,年,k. pearson也独立也独立地从检验分布的拟合优度发现这一地从检验分布的拟合优度发现

2、这一相同的卡方分布。相同的卡方分布。karl pearson (1857-1936)个相互独立的标准正态变量个相互独立的标准正态变量ui(i=1,2, )的平方和的平方和称为称为 变量,即变量,即22222121.iuuuxu它的分布即为卡方分布,其自由度为它的分布即为卡方分布,其自由度为。卡方分布卡方分布 2检验读作卡方检验,是一种用途广泛的统计方检验读作卡方检验,是一种用途广泛的统计方法,主要用于:法,主要用于:检验检验两个(或多个)总体率两个(或多个)总体率或或构成比构成比之间是否有统计之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是学意义,从而推断两个(或多个)总体率或构成

3、比是否相同。否相同。2检验的用途检验的用途 检验实际频数检验实际频数(a)和理论频数和理论频数(t)的差别是否由抽的差别是否由抽样误差所引起的,样误差所引起的, 也就是由样本率(或样本构成比)也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。来推断总体率(或总体构成比)。2检验的基本思想检验的基本思想基本计算公式基本计算公式式中,式中,a为实际频数(为实际频数(actual frequency),t为理论频数为理论频数(theoretical frequency) r crcn ntn22(),a tt自由度行数-1 列数-1back例例8.1 为了解某中药治疗原发性高血压的疗效,为

4、了解某中药治疗原发性高血压的疗效,将将70名高血压患者随机分为两组,试验组用该名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表观察结果见表8-1。问:该药治疗原发性问:该药治疗原发性高血压是否有效?高血压是否有效?1、建立检验假设并确定检验水准、建立检验假设并确定检验水准h0:1=2 ,即试验组与对照组的总体有效率相等,即试验组与对照组的总体有效率相等h1 :12 ,即试验组与对照组的总体有效率不等,即试验组与对照组的总体有效率不等=0.052、计算检验统计量计算检验统计量8 .2570414411t2 .1870

5、294412t2 .1570412621t8 .1070292622t用基本公式计算卡方值:用基本公式计算卡方值:40. 88 .108 .1052 .152 .15212 .182 .18248 .258 .252022222)()()()(22()()()()()ad bc na b a c b d c d四格表卡方检验的专用公式:四格表卡方检验的专用公式:1113、查界值表,确定、查界值表,确定p值,做出推断结论值,做出推断结论自由度自由度=1,20.05(1)=3.84, 2 20.05(1), 所以所以 ,p0.05,在在=0.05的检验水准下,拒绝的检验水准下,拒绝h0, 差异有统

6、计差异有统计学意义,也就是学意义,也就是试验组与对照组的总体有效率不等试验组与对照组的总体有效率不等.40. 82941264470)2124520(22(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaatta推倒过程推倒过程 卡方分布是连续型的分布,卡方界值是由其分布卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确

7、定数据是不连续的,用卡方界值表确定p值时可能存在误值时可能存在误差。四格表资料中,当差。四格表资料中,当n40,有理论频数有理论频数1t5时,时,因为理论值太小,会导致因为理论值太小,会导致2值变大,易出现假阳性结值变大,易出现假阳性结论。论。四格表四格表2值的连续性校正值的连续性校正22(0.5)ca tt222()()()()()nc|ad -bc|-n=a+b c+d a+c b+d连续性校正公式连续性校正公式111)当)当n40,所有所有t 5时,用专用公式或普通公式;时,用专用公式或普通公式;2)当)当n40,但有理论频数但有理论频数1t5时,用校正公式;时,用校正公式;3) n40

8、或有或有t1,或,或p时,用确切概率法。时,用确切概率法。 连续性校正仅用于连续性校正仅用于 的的四格表资料,当四格表资料,当 时,一般不时,一般不作校正。作校正。 212例例8.2 某医学院抽样调查大学四年级和五年级学生近视某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为眼患病情况,四年级学生的近视率为7.14%,五年级学,五年级学生的近视率为生的近视率为35.71%,调查结果见下表,试问该大学四,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?年级与五年级学生的近视眼患病率是否一样?年级年级近视近视非近视非近视合计合计近视率(近视率(%)四年级

9、四年级2 26287.14五年级五年级5 91435.71合计合计7354216.67表表8-2 两个年级大学生的近视眼患病率比较两个年级大学生的近视眼患病率比较1、建立检验假设并确定检验水准、建立检验假设并确定检验水准h0: 1=2 ,即四年级与五年级学生的近视眼患病率相同,即四年级与五年级学生的近视眼患病率相同h1 :12 ,即四年级与五年级学生的近视眼患病率不同,即四年级与五年级学生的近视眼患病率不同=0.052、计算检验统计量计算检验统计量62. 3)95)(262)(926)(52(42)24252692(223、查界值表,确定、查界值表,确定p值,做出推断结论值,做出推断结论自由度

10、自由度=1, 20.05(1)=3.84, 20.05,在在=0.05的检验水准下,不拒绝的检验水准下,不拒绝h0,说明四年说明四年级与五年级学生近视眼患病率差别没有统计学意义,可级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。性差异。22(2 926 5)425.49(25)(269)(226)(59) 若不采用校正公式:若不采用校正公式:在在=0.05水准下,水准下,2 2 0.05(1),则则p0.05。back甲种属性甲种属性乙种属性乙种属性+-合计合计+aba+c-cdc+d合计合

11、计a+cb+dn=a+b+c+d注意:注意:a、b、c、d代表对子数!代表对子数!表表8-16 配对四格表基本结构的配对四格表基本结构的甲种属性甲种属性乙种属性乙种属性 + + a+-b-+c-d甲属性的阳性率:甲属性的阳性率:(a+b)/n乙属性的阳性率乙属性的阳性率:(a+c)/n若若h0成立,则有成立,则有(a+b)/n- (a+c)/n=0,即即(b-c)/n=0可见,两个变量阳性率的比较只和可见,两个变量阳性率的比较只和b、c有关,而与有关,而与a、d无关。无关。若若h0成立,两种属性不一致的两个格子理论频数都应该是成立,两种属性不一致的两个格子理论频数都应该是(b+c)/2配对检验

12、公式推导:配对检验公式推导:11式中,式中,a, d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。配对卡方检验公式使用条件:配对卡方检验公式使用条件:例例8.4 现有现有198份痰标本,每份标本分别用份痰标本,每份标本分别用a、b两种两种培养基培养结核菌,结果如下表,培养基培养结核菌,结果如下表,a培养基的阳性培培养基的阳性培养率为养率为36.36%,b培养基的阳性培养率为培养基的阳性培养率为34.34%,试,试问问a、b两种培养基的阳性培养率是否相等?两种培养基的阳性培养率是否相等?b培养基培养基a培养基

13、培养基+-合计合计+482472-20106126合计合计68130198表表8-5 两种培养基的培养结果两种培养基的培养结果a 培养基培养基b培养基培养基结果统计结果统计痰标本痰标本a培养基培养基b培养基培养基1+2+3+-4+5+-6+-7-+8+9-10-11+12+13+-14-痰标本痰标本a培养基培养基b培养基培养基15+16+17+-18+19+-20+-21-22+-23-24-25+26+-27+28-1、建立检验假设并确定检验水平、建立检验假设并确定检验水平h0:1=2 ,即两种培养基的阳性培养率相等,即两种培养基的阳性培养率相等h1 : 12 ,即两种培养基的阳性培养率不相

14、等,即两种培养基的阳性培养率不相等=0.052、计算检验统计量、计算检验统计量22(2420)0.3624203、查界值表,确定、查界值表,确定p值,做出推断结论值,做出推断结论查查2界值表,界值表,=1, 20.05(1)=3.84, 2 0.05,在在=0.05的检验水准下,不拒绝的检验水准下,不拒绝h0,尚不能认为尚不能认为两种培养基的培养率不同。两种培养基的培养率不同。back一、行列表一、行列表2检验检验行或列超过两组时称为行列表,或称行或列超过两组时称为行列表,或称rc表。表。nnntcr总例数列合计行合计理论频数代入基本公式 可推导出: 基本公式 通用公式 ) 1()(2222c

15、rnnantta 自由度=(行数1) (列数1) 例例8.5 某医院用某医院用3种方案治疗急性无黄疸型病毒种方案治疗急性无黄疸型病毒肝炎肝炎254例,观察结果如下表,试比较例,观察结果如下表,试比较3种疗法种疗法的有效率是否一样。的有效率是否一样。组别组别有效有效无效无效合计合计有效率(有效率(%)西药组西药组514910051.00中药组中药组35458043.75中西医结合组中西医结合组 59157479.73合计合09表表8-3 3种方案治疗肝炎的疗效种方案治疗肝炎的疗效1.建立检验假设并确定检验水准建立检验假设并确定检验水准h0:三种治疗方案的有效率相同三种治

16、疗方案的有效率相同h1 :三种治疗方案的有效率不全相同三种治疗方案的有效率不全相同=0.052.计算检验统计量计算检验统计量2222222514935455915254 (1)100 145100 10980 14580 10974 14574 109254 (0.17940.22030.10560.23220.32440.02791)22.813.查查2界值表,确定界值表,确定p值,做出推断结论值,做出推断结论=2, 20.05(2)=5.99, 2 20.05(2),则则p 20.05(1) ,则p0.05,在=0.05的水准下,拒绝h0,认为三个不同地区的人群血型分布总体构成比有差别。二

17、、多个样本率间多重比较二、多个样本率间多重比较行列表行列表2检验的结果说明差异有统计学意义,需作两检验的结果说明差异有统计学意义,需作两两比较时,先调整两比较时,先调整值,再进行率的两两比较。值,再进行率的两两比较。检验水准检验水准=0.05,做多次比较时,按概率理论,两两比较均正做多次比较时,按概率理论,两两比较均正确的概率为确的概率为(1-0.05)(1-0.05)(1-0.05)(1-0.05),将使,将使类错误类错误扩大,因此,必须重新规定检验水准。扩大,因此,必须重新规定检验水准。1.多个实验组间的两两比较多个实验组间的两两比较 = /n2(1)2kk kncn为要进行两两比较的次数

18、,为要进行两两比较的次数,k为参加检验的组数。为参加检验的组数。组别组别有效有效无效无效合计合计有效率(有效率(%)西药组西药组514910051.00中药组中药组35458043.75合计合计869418047.781、建立检验假设并确定检验水准、建立检验假设并确定检验水准h0:西药与中药治疗肝炎的有效率相同;西药与中药治疗肝炎的有效率相同;h1 :西药与中药治疗肝炎的有效率的有效率不同;西药与中药治疗肝炎的有效率的有效率不同;=0.05/3=0.017表表8-4 西药与中药治疗肝炎疗效的比较西药与中药治疗肝炎疗效的比较2222251493545180(1)0.94100 86100 948

19、0 8680 943、查、查2界值表,确定界值表,确定p值,做出推断结论值,做出推断结论=1, 20.017(1)=5.70, 2 0.017,在在=0.017的水准下,不拒绝的水准下,不拒绝h0,故可以故可以认为西药与中药治疗肝炎的有效率差异没有统计学认为西药与中药治疗肝炎的有效率差异没有统计学意义。意义。2、计算检验统计量、计算检验统计量组别组别有效有效无效无效合计合计有效率(有效率(%)西药组西药组514910051.00中西医结合组中西医结合组59157479.73合计合计1106417463.222222251495915174(1)15.10100 110100 6474 1107

20、4 64=1, 20.017(1)=5.70, 2 20.017(1),则则p 20.017(1),则则p 20.05(3),则则p20.05(2),则则p0.017,在在=0.017的水的水准下,拒绝准下,拒绝h0,接受接受h1,故可以认为安慰剂与,故可以认为安慰剂与a药的缓解率差异药的缓解率差异有统计学意义,有统计学意义,a药的缓解率高于安慰剂组。药的缓解率高于安慰剂组。同理,可以进行同理,可以进行b药与安慰剂组比较,药与安慰剂组比较,c药与安慰剂组比较药与安慰剂组比较2222228703920157(1)21.2098 6798 9059 6759 90=1, 20.017(1)=5.70, 2 20.05(2),则则p0.017,在在=0.017的的水准下,拒绝水准下,拒绝h0,接受接受h1,故可以认为安慰剂与,故可以认为安慰剂与b药的缓解药的缓解率差异有统计学意义。率差异有统计学意义。2222228702929156(1)7.229

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论