第五章计数资料的统计学推断_第1页
第五章计数资料的统计学推断_第2页
第五章计数资料的统计学推断_第3页
第五章计数资料的统计学推断_第4页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Dr. Dr. 宇传华宇传华 制作制作医疗等本科医疗等本科医疗等本科医学统计学医学统计学医学统计学第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第一节第一节 率的抽样误差与可信区间率的抽样误差与可信区间第二节第二节 率的统计学推断率的统计学推断 一、样本率与总体率比较的一、样本率与总体率比较的u u检验检验 二、两个样本率比较的二、两个样本率比较的u u检验检验第三节第三节 卡方检验卡方检验 一、卡方检验的基本思想一、卡方检验的基本思想 二、四格表专用公式二、四格表专用公式 三、连续性校正公式三、连续性校正公式 四、配对四格表资料的四、配对四格表资料的2

2、2检验检验 五、行五、行列(列(R RC C)表资料的)表资料的2 2检验检验计数资料的统计学推断计数资料的统计学推断第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第一节第一节 率的抽样误差与可信区间率的抽样误差与可信区间 一、率的抽样误差与标准误一、率的抽样误差与标准误 二、总体率的可信区间二、总体率的可信区间第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室一、一、 率的抽样误差与标准误率的抽样误差与标准误 样本率样本率(p)和总体率和总体率()的差异称为率的的差异称为率的抽抽样误差样误差(sampling error

3、 of rate) ,用,用率的标率的标准误准误(standard error of rate)度量。)度量。np)1( 如果总体率如果总体率未知,用未知,用样本率样本率p估计估计nppsp)1( 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室标准误的计算标准误的计算第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室二、二、 总体率的可信区间总体率的可信区间 总体率的可信区间总体率的可信区间 (confidence interval of rate):根据样本率推算总体率可能所在的范围根据样本率推算总体率可能所在的范围 第

4、四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第二节第二节 率的统计学推断率的统计学推断 一、样本率与总体率比较一、样本率与总体率比较u u检验检验 二、两个样本率的比较二、两个样本率的比较u u检验检验第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室一、样本率与总体率比较的一、样本率与总体率比较的u u检验检验u u检验的条件:检验的条件:n p 和n(1- p)均大于5时例例 55,-地地中中海海贫贫血血基基因因携携带带率率:山山区区 p=12/125=0.096, n=125;本本省省一一般般成成人人0 0=0.07

5、6, H0:= =0 0= =0 0. .0 07 76 6 H1:0 0 = =0 0. .0 05 5。 按按= =0 0. .0 05 5 水水准准,不不拒拒绝绝 H0,即即不不能能认认为为该该山山区区与与本本省省一一般般 成成人人的的-地地中中海海贫贫血血基基因因携携带带率率有有差差异异。 )1(0000nppup844.0125)076.01(076.0076.0096.0第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室二、两个独立样本率比较的二、两个独立样本率比较的u u检验检验96. 11949. 2)6412041)(1045. 01 (10

6、45. 00313. 01275. 0u表表5-1 两种疗法的心血管病病死率比较两种疗法的心血管病病死率比较疗法死亡生存 合计病死率(%)盐酸苯乙双胍26 (X1)178 204(n1) 12.75 (p1)安慰剂 2 (X2) 62 64(n2) 3.13 (p2)合 计 28240 268 10.45 (pc)2122112121nnpnpnnnXXpc)11)(1 (21212121nnppppSppuccppu u检验的条件:检验的条件:n n1 1p p1 1 和和n n1 1( (1- p1- p1 1) )与与n n2 2p p2 2 和和n n2 2( (1- p1- p2 2

7、) )均均 55第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室小小 结结 1样本率也有抽样误差,率的抽样误差的大小样本率也有抽样误差,率的抽样误差的大小用用p或或Sp来衡量。来衡量。 2率的分布服从二项分布。当率的分布服从二项分布。当n足够大,足够大,和和1-均不太小,有均不太小,有n5和和n(1-)5时,近似正态分布时,近似正态分布。 3总体率的可信区间是用样本率估计总体率的总体率的可信区间是用样本率估计总体率的可能范围。当可能范围。当p分布近似正态分布时,可用正态近分布近似正态分布时,可用正态近似法估计率的可信区间。似法估计率的可信区间。 4根据正态近

8、似原理,可进行样本率与总体率根据正态近似原理,可进行样本率与总体率以及两样本率比较的以及两样本率比较的u检验。检验。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室率的率的u检验能解决以下问题吗?检验能解决以下问题吗? 率的反应为生与死、阳性与阴性、发生与不率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关发生等二分类变量,如果二分类变量为非正反关系(如治疗系(如治疗A A、治疗、治疗B B);反应为多分类,如何进);反应为多分类,如何进行假设检验?行假设检验? 率的率的u u检验要求:检验要求:n n足够大,且足够大,且nn5

9、5和和 n n(1-1-)55。如果条件不满足,如何进行假设。如果条件不满足,如何进行假设检验?检验? 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第三节第三节 卡方检验卡方检验 2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。 本章仅限于介绍两个和多个率或构成比比较的2检验。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室一、卡方检验的基

10、本思想一、卡方检验的基本思想(1)疗法疗法死亡死亡生存生存 合计合计病死率病死率(%)盐酸苯乙双胍盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75 (p1)安慰剂安慰剂 2 (c) 62 (d) 64(c+d) 3.13 (p2)合合 计计 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc)表表5-1 5-1 两种疗法的心血管病病死率的比较两种疗法的心血管病病死率的比较(a+b)pc= (a+b)(a+c.)/ n=nRnC/n =21.3(a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n =182.7(c+d)pc

11、= (c+d)(a+c)/ n =nRnC/n =6.7(c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC/n =57.3nnncolumnrowTCR总例数合计列合计行)()(第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室一、卡方检验的基本思想一、卡方检验的基本思想(2) 各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。) 1)(1(,1)()(222CRTTATTA1) 12)(12(82. 4)3 .5717 . 617 .18213 .211(7 . 423 .57)3 .5

12、762(27 . 6)7 . 62(27 .182)7 .182178(23 .21)3 .2126(22v第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室2/) 12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布分布(chi-square distribution)第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室2检验的基本公式检验的基本公式) 1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由Pearson提出,因此软件上常称这种检验为Pea

13、reson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行列表”。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室二、四格表专用公式(二、四格表专用公式(1) 为了不计算理论频数为了不计算理论频数T, 可由可由基本公式基本公式推导出,推导出,直接由直接由各格子的实际频数(各格子的实际频数(a、b、c、d)计算卡方值的公式:)计算卡方值的公式:(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadb

14、badcbadbbabdcbacabadcbacabaaTTA第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室二、四格表专用公式(二、四格表专用公式(2)021 ,05. 0221021 ,05. 0221 ,05. 0205. 0;84. 3,05. 0;84. 305. 0;84. 31 , 82. 46424028204268)21786226(22HPHPP,即不拒绝则如果即拒绝如果下结论:2(1) u2 2.194924.82(n40,所有T5时)第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室三、连续性校正公式

15、(三、连续性校正公式(1) 2分布是一连续型分布,而行分布是一连续型分布,而行列表资料属离散型分布列表资料属离散型分布,对其进行校正称为连续性校正,对其进行校正称为连续性校正(correction for (correction for continuity),continuity),又称又称YatesYates校正(校正(Yates correctionYates correction)。)。当当n40,而,而1T5时,用时,用连续性校正连续性校正公式公式当当n40或或T1时,用时,用Fisher精确精确检验检验(Fisher exact test )校正公式校正公式:列表资料),(也适合其

16、它行TTAc22)5 . 0()()()()2/(22dbcadcbannbcadc第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室三、连续性校正公式(三、连续性校正公式(2)表 5-2 两零售点猪肉表层沙门氏菌带菌情况检查结果 沙门氏菌 零售点 阳性 阴性 合计 带菌率(%) 甲 2(4.17) 26(23.33) 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合计 7 35 42 16.67 1 , 62. 3357142842)24262592(22c1 , 49. 5357142842)26592(22因为因为1 1T T5

17、 5,且,且n n4040时,所以应用连续性校正时,所以应用连续性校正2检验检验第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室四、配对四格表资料的四、配对四格表资料的2检验检验第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室配对四格表资料的配对四格表资料的2检验也称检验也称McNemar检验(检验(McNemars test) 1,) 1(2402cbcbcb时,需作连续性校正, 1,27. 4312) 1312(22,4015采用连续性校正本例cb 1,)(2240ccbcbb时,当05. 0;84. 321 ,05.

18、 02PH0:b,c来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);=0.05。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室配对四格表资料的配对四格表资料的2检验公式推导检验公式推导第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室五、行列(RC)表资料的2检验第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室RC表的2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式 可推导出: 基本公式 通用公式 ) 1()(2222CRnnAnTTA 自由度=(行数1) (列数1) 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室几种RC表的检验假设H0第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室RC表的计算举例第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室RC表2检验的应用注意事项 1. 对RC表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论