率与构成比的假设检验概述.ppt_第1页
率与构成比的假设检验概述.ppt_第2页
率与构成比的假设检验概述.ppt_第3页
率与构成比的假设检验概述.ppt_第4页
率与构成比的假设检验概述.ppt_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本资料来源,第六节 率与构成比的假设检验,学 习 目 标,能够进行两个或多个率(或构成比)差别的 检验 能够根据资料的性质正确选择 检验方法。,2检验,2检验是一种用途较广的假设检验方法。它常用于分类计数资料的分析,如两个或多个率或构成比的比较、计数资料的相关分析等。,(1)2分布是一种连续型随机变量的概率分布,2分布的形状依赖于自由度v的大小, A:当自由度v 2时,曲线呈L型; B:当自由度v 2时,随着v的增加,曲线逐渐趋于对称; C:当自由度v趋于时, 2分布逼近正态分布,(2) 2分布的基本性质可加性,如果两个独立的随机变量X1和X2分别服从自由度为v1和v2的 2 分布,那么它们的

2、和(X1+X2)服从(V1+V2)的 2 分布。,称为自由度为k的2分布。与标准正态分布不同,2 分布的随机变量取值在 o ,十 )。图 14 一 4 描述了不同自由度2分布的概率密度曲线。从附表 13 ( 22 分布界值表)可以查到不同自由度的2分布的各种临界值。,设有k个相互独立的标准正态分布变量,则,(二)分布的2检验,我们已经知道,频率是概率的反映。当样本量足够大时,频率在概率附近波动。根据这一事实,可用下面的统计量来推断频率与概率差异的状况 。,计算2值的基本公式,2为卡方值,A为实际数,为观察所得数据; T= nPi为理论数,是按照假设或理论推算出来的数据 2统计量是度量实际计数与

3、理论计数之间偏差的统计量,该式定义的统计量对理论分布没有特殊的要求,所以应用较广。,K . Pearson ( 1899 )证明了,如果零假设“ H0 :样本来自某理论分布”成立而且当大样本时, ( 14 一 37 )式服从自由度为v的 2 分布。其中,vk一 1 一(计算 T 时利用样本估计的总体参数的个数)。,2统计量的意义,可通过下列例子说明:,例如:母豚鼠所产的幼豚鼠的性别分为雌雄两组,在某次实验中,若干只母豚鼠所产的幼豚鼠中有70只为雌性,54只为雄性,而在大量的调查资料中,雌雄豚鼠的性比例一般为1:1。 如果观察频数与理论频数相吻合,则其性比例符合1:1;如果相差很大,即需要研究某

4、种实验条件是否影响母豚鼠所产幼豚鼠的性比例,这就需要研究观察频数与理论频数相差的程度。,由每组的观察频数(A)减去相应的理论频数(T), 即得每组A与T的差异,如果将各组A-T的频数相加,其总和数常等于零,这种关系可用下式表示:,故用,不能反映实际观察频数与理论观察频数相差的程度,如果将A-T平方,并将各组 相加,得总数 。观察频数与理论频数相差越大 ,则 的数值越大,反之则越小。 尚有不足之处,因为绝对差异数还不能完全反映相差的程度: 某一资料的观察频数为204,理论频数为200 另一资料的观察频数为19,理论频数为15 故需把 的数值变为相对数,即,分母为什么是T而不是A,因为:,1.当理

5、论数的数值极小时,由于抽样误差可使实际观察例数为零; 2.理论数是大量的经验和自然规律推算出来的,论据较广,而观察例数来自有限的样本,变动较大。,二、完全随机设计两个样本率比较的四格表2检验,这里的两个样本可以是完全随机分组的两份样本,也可以是从两个总体(例如男性与女性)分别独立抽取的两份样本。,例 14 一 21,为观察替硝哇治疗急性冠周炎的效果,以甲硝唑为对照,某口腔科医生收集了如下资料。试间两药疗效是否相同。,是该表的基本数据,其余数据都是由这四个数据推算出来的,称为四格表资料。,1、建立假设,2、计算检验统计量,(1)计算每个格子理论频数的公式:,R :表示行号,n R 是格子所在行的

6、频数合计; C: 表示列号, n C是格子所在列的频数合计。 n :总频数。 于是格子 a 的理论频数,(2)计算其余三个格子的理论频数为:,(3)计算2统计量,3、计算P值并作统计结论,查附表 13:,故 0 . 01 P 0 . 025,在a= 0 . 05 水平上拒绝 H0 ,接受 H1 。 可认为两药疗效不同,替硝哗疗效较好。,四格表专用公式:,常用的2检验,成组(四格表)资料的2检验 n40,T5时,P149,n40,1T5时,三、四格表X2检验的校正公式,例 14 一 22,为探讨 P53 蛋白表达对癌前病变早期定性诊断的价值,某研究小组得到如下结果试问,两种病理切片表达率是否相同

7、?,(1)建立假设,确定检验水准,(2)计算检验统计量,(3)确定P值作统计结论,查附表13, 知 0 . 5 P 0 .75,在a 0.05 的水平上不能拒绝 H 。 所以尚不能认为P53 在两种病理切片的表达率不同。 本例如果不校正,X2 0 . 6835 ,相应的 0 . 25 P 0 . 5 。,四、四格表精确概率法,两个样本率比较的四格表资料如果出现 : n40或T1时,不能用2检验,需用Fisher 精确概率法。,例 14 一 23,1997 年血清流行病学调查部分结果如下。试间立克次氏体感染率甲地是否高于乙地?,a= 0 . 05,(1(建立假设,确定检验水准,(2)计算概率,将

8、原表以及 a = 5 与 a = 6 两个表的概率之和作为检验的P值: P = 0 . 01088 + 0 . 08899 + 0 . 25955 = 0 . 35942 0 . 05 。 按a 0 . 05 水准,不能拒绝 H0 。所以尚不能认为甲地的感染率高于乙地。,如果是双侧检验,H 0: H1 : 则应将 IA 一 Tl 大于等于原表的所有四格表(它们更支持 H1 )的概率相加作为检验的P值。,双侧检验: P=0.05, 2 =3.86 P=0.01, 2 =6.63,五、 R xC 表分析,把表达构成比或多个样本率资料的统计表统称为 R ( Row ) x C ( Column )表

9、。 行列表2常用于多个样本构成比或多个样本率的比较。,(3)行列表资料的2检验,经推导,行列表:,A为实际数;,为与某实际数(A)同行的合计数;,为与某实际数(A)同列的合计数;,n为总例数,例 14 一 24,为了解立克次体病在某省存在的情况, 1997 年对 23 个县(市)进行了血清流行病学调查,结果如下,试问不同年龄人群的立克次体感染率是否不同?,(1)建立假设,确定检验水准,(2)计算检验统计量,(3)求P值,做统计结论,例 14 一 25,为探讨青少年吸烟行为与心理特质的关系,南方某市调查到如下资料。试问,吸烟与不吸烟的中学生心理特质构成是否相同?,(1)建立假设,确定检验水准,(

10、2)计算检验统计量,(3)求P值,做统计结论,在=0.05的水平上拒绝H0,接受 H1 , 可认为吸烟与不吸烟的中学生心理特质构成不同。,(4) 作统计结论,注 意 事 项:,1.总样本量不能太小,至少50例; 2.如有1/5以上格子的理论数小于5或有一个格子的理论数小于1;应考虑 a.条件允许时增加样本含量以增大理论数;,b.将理论数太小的行或列与相邻的行或列的观察值合并,以增大理论数,但合并时应考虑资料的性质合理合并,不能把不同性质的实际频数合并,否则会导致错误的结论。,2 如果行或列的变量是有序的(等级分组的),不要仅作率或构成比的比较。根据资料特点或研究目的还应考虑作秩和检验或趋势检验

11、分析。,六、 2 x 2 列联表分析,对一份随机样本按两个二项分类的特征进行交叉分类的结果,可归纳成双向分类表,称为 2 x2 列联表。 这种表虽然在形式上与两个率比较的四格表类似,但是分析的角度却有不同。对 2 x2列联表一般可作两个方面的分析。,1.两种特征分布间独立性检验,检验的目的:是判断两种特征分类间是否存在关联 。如果一种特征的概率分布与另一种特征的概率分布无关,则认为这两种特征相互独立。,例 14 一 26,某医院从正常体检人员血清标本获得如下结果,试问,乙肝表面抗原( HbsAg )与乙肝核心抗体(-HBc )检测结果之间是否存在联系?,分析,在表 14 17 中,如果 Hbs

12、Ag 为阳性的151 人中一 HBc 的阳性率与 HbsAg 为阴性的 1911 人中一 HBe 的阳性率没有统计差异,则可认为 HbsAg 与一 HBc 检测结果之间没有关联,即相互独立。若将 HbsAg 与- HBc 位置互换进行分析,道理是一样的。因此可应用两个率比较的 X2 检验处理本例的问题。,(1)建立假设,确定检验水准,(2)计算检验统计量,在 a = 0 . 05 水平上拒绝 H0,接受 H1 , 可认为两种检测结果有关联。,(3)确定P值,作统计结论,所以P 0 . 005 ,,2. 两种检测结果比率比较,在本章前部已经对配对设计有所了解。如果这种设计的反应变量为二项分类,其

13、观察结果可以整理成 2 x2 表(如表 1418 )。对这种资料分析的目的之一是比较两种方法的阳性率 。,或当bc 40 时:,检验统计量采用( 1444 )式:,例 14-27,快速全血凝集试剂盒( JKD ) )与酶免疫分析试验( EIA )检测 HbsAg ;结果如表 14 一 l8 ,试问两种方法检测结果是否相同?,(2)计算检验统计量,(1)建立假设,确定检验水准,七、二项分布的 u 检验,(一)完全随机设计的样本率与一个数值的比较,如果二项分布的或1- 不太小,则当n足够大时,近似有 于是对于检验假设: H 0: HI : 可应用检验统计量 u 进行推断,式中: n:样本容量, X

14、:样本阳性数, 样本率 :p = X n 0.5 是连续性校正数,n较大时可略去。,例 14 一 28,某医院称治疗声带白斑的有效率为 80 。今统计来求医的此类患者60例,其中 45 例有效。试问该医院宣称的疗效是否客观?,(1)建立假设,确定检验水准,(2)计算检验统计量,(3)求P值,做统计结论,(二)完全随机设计的两个样本率比较,例 1429,用硝苯毗咤治疗高血压急症患者 75 例,有效者 57 例;用硝苯吡啶卡托普利治疗同类患者 69 例, 66 例有效。试问两疗法疗效是否相同?,(1)建立假设,确定检验水准,(2)计算检验统计量,(3)求P值,(双侧) u0.001 = 3.290

15、5 ,所以 P 0001,(4)作统计结论,在 a =0.05 水准上拒绝 H0接受 H1 ,可以认为两种疗法疗效不同。,第七节 Poisson 分布总体均数的 u 检验,当总体均数入 20 时,依据 Poisson 分布近似正态分布的原理,可以对其总体均数进行推断。,(一)样本均数与总体均数的比较,检验统计量为:,例 14 一 30,某地 10 年前计划到 2000 年把孕产妇死亡率降到 25 / l0 万以下 。2000 年监测资料显示,该地区平均相对于每 10 万例活产儿孕产妇死亡 31 人。问该地区降低孕产妇死亡的目标是否到达到?,(1)建立假设,确定检验水准,(2)计算检验统计量,(

16、3)求P值,作统计结论,(二)完全随机设计的两样本均数比较,当两总体均数均大于 20 时,依据 Poisson 分布近似正态分布的原理,可以应用 u 检验对其总体均数进行推断,当两样本取样次数相同时用。,当两样本取样次数不同时用:,其中 分别为两样本均数, n1与 n2是取样次数,其中 :x1 与 x2 分别为两样本计数,例 1431,甲、乙两检验师分别观察15名正常人末梢血嗜碱性自细胞数量。每张血片均观察 200 个视野。结果甲计数到嗜碱性白细胞 26 个乙计数到 29 个。试问两位检验师检查结果是否一致 ?,按 v= 查附表 6 ( t 界位表), 知双侧U0.50. 6745 ,所以P0

17、. 5 。 按 a =0.05 水准不能拒绝 H0,不能认为两检验师检查结果有差异。,(1)建立假设,确定检验水准,(2)计算检验统计量,(3)求P值,作统计结论,例 某医师研究血型与胃、十二指肠溃疡间的关联性,比较胃溃疡病人与十二指肠溃疡病人的血型分布,结果见下表。 胃溃疡与十二指肠溃疡病人的血型分布,我国南北方鼻咽癌患者病理组织学分类构成,例1:某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作对照,其观察结果见下表。 两种药物治疗溃疡病的疗效,理论数的推算,理论数是根据H0推算出来的:,第R行第C列格子的理论数; 为与理论数同行的合计数 为与理论数同列的合计数 n 为总例数,泰胃美 36

18、24 60,洛赛克 54 6 60,药物,有效数,无效数,合计,合计 90 30 120,两种药物治疗溃疡病的疗效,T11=60 x90/120=45,T12=60 x90/120=45,T21=60 x30/120=15,T22=60 x30/120=15,例2 某医生比较两种不同手术治疗某病的疗效,共收治病71例,结果见下表。 两种手术治愈率,(2)配对四格表资料的2检验 (P302),配对计数资料和前面介绍的计量资料的配对t检验,从设计来说是一样的,都是把两种处理分别施于条件相似的两个受试对象,或先后施于同一受试对象。,配对资料的2检验 配对设计的 资料陈述形式,甲乙两医师X线矽肺诊断结果,甲乙两医生诊断的片子实质上是一样的,不是相互独立的,两医生诊断结果,即指标为阳性或阴性,是二分类的定性变量。 目的是通过样本资料来推断两医生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论