研究生统计学第七章卡方检验_第1页
研究生统计学第七章卡方检验_第2页
研究生统计学第七章卡方检验_第3页
研究生统计学第七章卡方检验_第4页
研究生统计学第七章卡方检验_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 2 检验 (chi-square test),桂 立 辉 新乡医学院公共卫生学院,第七章 2 检验,卡方检验( 2检验,chi-square test) ,在分类资料中的应用: 推断两个或多个总体率(或构成比)之间有无差别? 两分类变量间有无相关关系; 检验频数分布的拟合优度。,第七章 2 检验,四格表资料的2检验 配对四格表资料的2检验 四格表资料的Fisher确切概率法 行列表资料的2检验 多个样本率间的多重比较 有序分组资料的线性趋势检验 频数分布拟合优度的2检验,第一节 四格表资料的2检验 一、2检验的基本思想,表6-1 两种类型胃溃疡内科疗法治疗结果比较,一、2检验的基本思想,2检验理论公式:,理论公式,一、2检验的基本思想,表6-1 两种类型胃溃疡内科疗法治疗结果比较 (理论值的计算),三、 四格表2检验的校正公式,四格表2 检验的应用条件是: 所有T5,且n40; 当有140 时,需进行连续性校正; 当有T1,或n40 时,需采用四格表确切概率法。 2分布是由正态分布派生出来的连续性分布。2界值表就是根据这种连续性分布计算出来在给定自由度条件下,2分布概率密度函数曲线下右侧尾部面积为时对应的2值,记作2, 。分类资料是间断性的,由此计算的2值不连续,尤其是=1的四格表,求出的概率P值可能偏小,故四格表2检验要有一定的条件限制。,三、 四格表2检验的校正公式,表6-3 两种药物治疗白色葡萄球菌败血症结果比较,三、 四格表2检验的校正公式,例6.4 H0: 1= 2 H1: 12 =0.05 查表得: 20.05(1)=3.84,P0.05 按=0.05水准不拒绝H0, 本例若不校正, 2 = 5.24,结论相反。,三、 四格表2检验的校正公式,对于四格表资料的连续性校正,统计学家有不同的意见。一般认为总例数n较少,理论数T较小时校正的意义较大,而n和T过小时不宜用2检验。但也有人认为所有的四格表2检验宜一律校正。不校正2值偏高,而校正后有时偏低,有可能矫枉过正。故当2检验所得的P值接近于检验水准时,最好改用四格表确切概率法。,第二节 配对四格表资料的2检验,22列联表即配对四格表,同配对数值变量资料一样,配对资料的整理与分析都应以“对子”作为基本分析单元,不能将对子拆开来分析。对于配对分类变量资料,每个对子可能是下列4种情况之一:,第二节 配对四格表资料的2检验,表6-7 两种试剂检验结果比较,第二节 配对四格表资料的2检验,(一)关联性分析 H0:甲、乙两试剂的检验结果无关系 H1:甲、乙两试剂的检验结果有关系 =0.05,查表得: 20.05(1)=3.84,P0.05 Pearson列联系数(P)=0.1887,第二节 配对四格表资料的2检验,(二)差别性分析,查表得:20.005(1)=7.88,P0.005 结论:按=0.05水准拒绝H0,接受H1 ,可以认为两种方法检验结果不一致。,第二节 配对四格表资料的2检验,(二)差别性分析,采用理论公式计算: 如果B=C,则b、c的理论值为: T=(b+c)/2= (10+31)/2 =20.5,,=k-1=2-1=1。 结论相同。,第二节 配对四格表资料的2检验,(二)差别性分析,如b+c40,应作连续性校正:,第三节 四格表资料的Fisher精确概率法,当四格表中若有理论频数1或n40时,宜用四格表确切概率法(exact probabilities in 22 table)亦称 Fishers精确概率法。本法已不属2检验的范畴,但可作为四格表2检验的补充。 基本思想:在四格表的四个周边合计不变的条件下,直接计算表内四个数据的种种组合之概率(Pi),并求出总概率P=Pi。,Fisher精确概率法,例6.9 某研究者将39例病型、病情、性别相同,年龄相近的患者随机分为2组,分别给予新疗法和传统疗法治疗并观察疗效,结果见下表,问两种疗法疗效有无差别? 表6-8 新疗法和传统疗法疗效的比较,Fisher 精确概率法,首先列出在周边合计不变的条件下所有的可能组合(最小周边合计数+1),分别计算出各种组合的治愈率差值(Di)和概率(Pi)。,Fisher 精确概率法,Fisher 精确概率法,累计概率的计算因单、双侧检验而异: 单侧检验:若P1-P2=D,取Di D的各种组合的累积概率作为单侧P 值;若P1-P2= -D,取DiD的各种组合的累积概率作为单侧P 值。 双侧检验:若| P1-P2 | =D,取Di D的各种组合的累积概率作为双侧检验P 值;若a+b=c+d,或a+c=b+d时, 四格表的全部组合对称,则只需计算一侧再乘以2即为双侧检验的累积概率。,Fisher 精确概率法,本例D=31.84%,采用双侧检验 H0: 1= 2 H1: 1 2 =0.05 取Di D的各种组合的累积概率:,按=0.05水准拒绝H0 ,可以认为两组疗效有差别。即新疗法疗效优于传统疗法。,实际数为0时直接计算概率法,若n40,当出现实际数为0时,符合超几何分布,可采用下列公式直接计算概率:,式中:P 为概率,n 为两组的总例数,f 为“0”现象对应组(即阳性组)的合计数,r 为“0”现象对应组的阳性数。,实际数为0时直接计算概率法,例6.10 调查2种饮用水水源伤寒杆菌污染情况,结果见下表,问两种饮用水水源伤寒杆菌污染情况有无差别? 表6-9 两种饮用水水源伤寒杆菌污染情况的比较,实际数为0时直接计算概率法,H0: 1= 2 H1: 1 2 =0.025,按=0.025水准拒绝H0 ,可以认为两种水源污染情况有差别。即井水污染率低于塘水。,第四节 行列表资料的2检验,前述四格表是RC表的简单形式,即22表,当R2和/或C2时称RC表。 RC表资料的2检验有下列几种情况: 多个样本率或构成比的比较: R2表 两个构成比的比较: 2C表 多个构成比的比较: RC表 双向无序分类资料的关联性检验: RC表,第四节 行列表资料的2检验,RC表资料的2检验的公式可采用前述理论公式,也可以采用专用公式,即:,一、多个样本率的比较,表6-4 3组受试者EBV-VCA-IgA抗体阳性率比较,一、多个样本率的比较,H0: 1= 2 = 3 H1: 各i不等或不全相等 =0.05,查表得: 20.005(2)=10.60,P0.005 按=0.05水准拒绝H0,接受H1 ,二、样本构成比的比较,表6-5 甲乙两医院病例的脑梗死部位比较,二、样本构成比的比较,H0: 两医院病例脑梗死部位的总体构成比相同 H1:两医院病例脑梗死部位的总体构成比不同或不全相同 =0.05,查表得: 20.005(2)=10.60,P0.005 按=0.05水准拒绝H0,接受H1 ,三 双向无序分类资料的关联性检验,例 7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型,三 双向无序分类资料的关联性检验,H0:两种血型系统间无关联 H1:两种血型系统间有关联 =0.05,查表得: 20.005(6)=18.55,P0.005 按=0.05水准拒绝H0,接受H1 ,三 双向无序分类资料的关联性检验,为进一步说明两变量间关系的密切程度,可计算Pearson列联系数(C )。计算公式: 该系数取值范围01,越接近于1,说明两变量关系越密切;越接近于0,说明两变量关系越不密切。 本例C=0.1883,说明ABO血型与MN血型间虽有关联,但关系并不太密切。,四、行列表2检验的注意事项,1. 2检验要求理论频数不宜太小,否则将导致偏性。一般认为行列表资料中不宜有1/5以上的格子理论数小于5,或有一个格子理论数小于1。处理方法: (1) 最好的方法是增加样本例数,以增大理论频数。 (2) 进行合理的合并,即将理论频数小的格子与所在行或列性质相近的邻近格子合并。 (3) 删除理论频数太小的行和列。 后两种方法将损失一定的信息并影响样本的随机性。,四、行列表2检验的注意事项,当多个样本率(或构成比)比较的2检验。结论为拒绝H0,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步解决此问题,需采用多重比较方法。常用分析方法有: 调整检验水准或检验界值法 2值分割法 可信区间(Scheffe可信区间)法,四、行列表2检验的注意事项,3. 有序分类变量的RC表的统计处理:当效应按强弱(优劣)分为若干个级别,试验结果整理为单向或双向有序RC表, 2检验只能说明各处理组的效应在构成比上有无差异,如将任意两行(或列)调换位置,检验结果不变,不能反映其有序(半定量)特征。对此类资料,应根据其研究目的和分类资料类型选用适宜的检验方法。,第五节 多个样本率间的多重比较,多个样本率比较的2 检验,如推断结论为差别有统计学意义,并非每两个总体率间的均有差别。如需要进一步推断哪些两总体率间有差别,应采用相应的多重比较方法。如直接采用四格表2检验进行两两比较,将会增大发生I型统计学错误的概率。 多个样本率间多重比较方法有多种:,第五节 多个样本率间的多重比较,样本率多重比较的方法按算法的不同,可划分为4类: 调整界值表法:杜养志法(Du)和罗文海法(Lno)。 调整检验水准法:单步调整的方法有Bonferroni法(Bon)和Sidak法;逐步调整的方法有Step-down Bonferroni法(StepB)、Step-down Sidak法(StepS)、Step-up Hochberg法(Hoch)、Step-upHommel法(Hommel)、Step-up Rom法(Rom)和Benjamini-Hochberg法(B-H)。 基于检验的方法:SNK法、Scheffe-Marascui-10法(Scheffe)、Scheffe-Cohen法(Cohen)、Scheffe-Seaman法(Seaman)、Levy法和Ryan法。 基于重复抽样的方法:Bootstrap和Permutafion抽样方法。 钱俊. 样本率多重比较方法的模拟研究.中国卫生统计,2009,26(2),2分割法,实例 某省三个地区花生黄曲霉毒素B1污染率比较,2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论