c6 卡方检验.ppt_第1页
c6 卡方检验.ppt_第2页
c6 卡方检验.ppt_第3页
c6 卡方检验.ppt_第4页
c6 卡方检验.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2检验(chi-square test),例1. 在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分为两组,A药组90人,有效人数为68人;B药组88人,有效人数为58人。资料经整理成表1的形式。问两种药有效率是否有差别?,表1. 两种药物治疗牙科术后疼痛有效率的比较,例2. 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见下表,问三个地区花生污染黄曲霉毒素B1污染率有无差别?,表2. 某省三个地区花生的黄曲霉毒素B1污染率比较,例3. 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表3,问其血型构成有无差别?,表3. 鼻咽癌患者与眼科病人的血型分布,例4. 某矿

2、工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如表4,问矽肺患者肺门密度的增加与期次有无关系?,表4. 不同期次矽肺患者肺门密度级别分布,2检验,用途: 推断两个或两个以上总体率(或构成比)之间有无差别 推断两个变量或两种属性之间有无关联性 频数分布的拟合优度检验,2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相吻合等问题。,1875年,F. Helmet即得出来自正态总体的样本方差的分布服从2分布。 1900年,K. Pearson也独立地从检验分布的拟合优度中发现这一相同的分布。,history,图1. 不同自由度的2分布曲线图,2分布的

3、特点: 1. 2分布呈正偏态,右侧无限延伸,但永不与基线相交。 2. 2分布随自由度的变化而形成一簇分布形态。 3. 自由度越小, 2分布偏斜度越大;自由度越大, 2分布形态越趋于对称。,四格表资料的2检验,基本思想:实际频数和理论频数吻合的程度 四格表资料的2检验的基本公式 A 为实际频数(actual frequency) T 为理论频数(theoretical frequency),例4. 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表4,问铅中毒病人与对照人群的尿棕色素阳性率有无差别?,表4. 两组人群尿棕色素阳性率比较,四格表资料,表4

4、中,29、7、9、28是整个表的基本数据,即实际频数,其余数据都是从这四个基本数据推算而得的,这种资料是两组两分类资料,称为四格表(fourfold table),亦称22表(22 table),表5. 四格表基本格式,提出问题,研究目的:铅中毒病人与对照人群的尿棕色素阳性率有无差别? 80.56%24.32% 能否说明铅中毒病人尿棕色素阳性率比 对照人群高?,表4. 两组人群尿棕色素阳性率比较,2检验的基本思路,H0假设: 铅中毒病人与对照人群的尿棕色素阳性率相同。 则可计算两组合计的阳性率为38/73,即理论上:铅中毒病人与对照人群的尿棕色素阳性率均为52.05%,计算理论频数,按两组合计

5、的阳性率为38/73,阴性率为35/73,则理论上: 铅中毒病人组阳性人数为 铅中毒病人组阴性人数为 对照人群组阳性人数为 对照人群组阴性人数为,表4. 两组人群尿棕色素阳性率比较,为相应行的合计数 为相应列的合计数 n 为总例数,理论频数:,理论频数的特点:,理论频数表的构成比相同,即不但各行构成比相同,而且各列的构成比亦相同; 各个基本格子中的实际频数和理论频数的差值(绝对值)相同。,实际频数表 理论频数表,| AT | = 10.26,表4. 两组人群尿棕色素阳性率比较,2检验的基本思路,H0假设: 铅中毒病人与对照人群的尿棕色素阳性率相同。 如果H0成立,则理论上,实际频数和理论频数应

6、该相等,对每一个格子有: 而对所有格子:,实际上: 2918.74 10.26 717.26 -10.26 919.26 -10.26 2817.74 10.26 由理论频数的计算原理造成 因此不能用 反映实际频数和理论频数的吻合程度,为消除符号的影响,采用 考虑绝对数不能准确体现其对值的贡献: 考虑2值受格子数多少的影响,引入,确定P值,如果检验假设成立,则实际频数与理论频数之差一般不会很大,2值应很小,即此时出现大的2值的概率P很小 2与P值的对应关系,查2界值表(附表5):2值愈大,P值愈小, 2是以理论频数为基数的相对误差,它反映了实际频数和理论频数的吻合程度。,图1. 不同自由度的2

7、分布曲线图,例4的具体步骤,建立检验假设 H0:1=2 ,铅中毒病人与对照人群尿棕色素阳性率相同 H1:12 ,铅中毒病人与对照人群尿棕色素阳性率不同 =0.05,查2界值表,得P0.01,按=0.05水准,拒绝H0,接受H1,故可认为铅中毒病人与对照人群尿棕色素阳性率差别有统计学意义。,四格表专用公式,见P59公式(6.4),表4. 两组人群尿棕色素阳性率比较,例4用四格表专用公式计算:,注:1) 这种校正称为连续性校正。 2) 如检验所得P值近于检验水准时, 最 好改用四格表确切概率法。,四格表2值的校正:,四格表2值的校正:,T 5且n 40时,无需校正; 1 T5, 而n 40时, 需

8、计算校正值, 或改用确切概率法计算; T1或n40时, 用确切概率法计算。,配对设计四格表的2检验,McNemar检验(McNemars test for correlated proportions),当b+c40时 当b+c40时,需作连续性校正,例5. 某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如表6,问两种方法检出率有无差别?,表6. 两种血清学方法检查结果,:两种方法的总体检出率相同,即B=C :两种方法的总体检出率不同,即BC =0.05 查附表5,得P0.005,按0.05水准拒绝H0,接受H1,差别有统计学意义,故可以认为两种方法的检出率不同,甲法的检出

9、率较高。,注意事项:,当a格和d格的数字都特别大,而b格和c格的数字都相对较小时,即使配对四格表的2检验结果有统计学意义,其实际意义也不大。因此,配对四格表的2检验一般用于样本含量不太大的资料。 比较两种诊断试验法诊断效能有无差异时,要求所投入试验的检品是用标准法检出的阳性检品。,行列表资料的2检验,行列表资料的2检验,行列表包括22、R2、2C、RC表,用于多个样本率或构成比的比较。 基本原理和检验步骤与四格表2检验相似 计算公式,例2. 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见下表,问三个地区花生污染黄曲霉毒素B1污染率有无差别?,表2. 某省三个地区花生的黄曲霉毒素B1污染率比

10、较,1. 建立检验假设:,H0:三个地区花生的黄曲霉毒素B1污染率相等 H1:三个地区花生的黄曲霉毒素B1污染率不等或不全相等 =0.05,2. 计算检验统计量,查2界值表,得P0.005,按=0.05水准拒绝H0,接受H1,故可认为三个地区花生污染黄曲霉毒素B1污染率不相等,有地区性差异。,3. 确定P值,作出统计推断,例3. 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表3,问其血型构成有无差别?,表3. 鼻咽癌患者与眼科病人的血型分布,H0:鼻咽癌患者与眼科病人血型分布构成比相同 H1 :鼻咽癌患者与眼科病人血型分布构成比不同 = 0.05,查2界值表,得p0.05。按=

11、0.05水准,不拒绝H0,尚不能认为鼻咽癌患者与眼科病人血型分布构成比不同。,行列表2检验时的注意事项:,2检验要求理论频数不宜太小, 一般认为行列表中不宜有1/5以上格子的理论频数小于5, 或不宜有一个理论频数小于1。 关于单向有序行列表的统计处理。 当多个样本率(或构成比)比较的检验, 结论为拒绝检验假设, 只能认为各总体率(或总体构成比)之间总的来说有差别, 但不能说明它们彼此间都有差别, 或某两者间有差别。,理论频数太小时的三种处理办法:,增加样本例数以增大理论频数; 确切概率法 删去上述理论频数太小的行和列; 将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并, 使重新计算

12、的理论频数增大。,单向有序行列表的统计处理:,当效应按强弱(或优劣)分为若干个级别, 比如分为、 、 等几个等级, 在比较各处理组的效应有无差别时, 宜用秩和检验(见第七章)或Ridit检验方法。 而2检验只说明各处理组的效应在构成比上有无差异。,列联表,对一组观察对象, 分别观察其两种分类变量的表现, 归纳成双向交叉排列的统计表, 这类统计表用以描述行变量和列变量之间的关系 , 称为列联表(contingency table)。,列联表用途:,用RC表的检验法对列联表内两个分类变量有无关联性的统计推断; 对于22列联表(即配对设计四格表), 除作关联分析之外, 还可以根据研究目的比较两种处理

13、间有无差异。,例6. 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如表7,问矽肺患者肺门密度的增加与期次有无关系?,表7. 不同期次矽肺患者肺门密度级别分布,1. 建立检验假设,H0:各期矽肺构成比相同并且各级肺门密度构成比相同,即矽肺期次与肺门密度无关联; H1:各期矽肺构成比不全相同或各级肺门密度构成比不全相同,即矽肺期次与肺门密度有关联; = 0.05,2. 计算检验统计量, =(31)(31)=4,查2界值得P0.005,按=0.05水准拒绝H0,接受H1,故可认为肺门密度与矽肺期次有关联。结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。,3. 确定P值,作出统计推断,例5. 某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如表6,问两种方法检出率有无差别?,表6. 两种血清学方法检查结果,两种检验结果之间有无联系?,:两种方法的总体检出率相同,即B=C :两种方法的总体检出率不同,即BC =0.05 查附表5,得P0.005,按0.05水准拒绝H0,接受H1,差别有统计学意义,故可以认为两种方法的检出率不同,甲法的检出率较高。,两法检验结果有无差别,两法检验结果有无联系,: 甲、乙两法的检验结果无联系 : 甲、乙两法的检验结果有联系 =0.05 Way 1:,Way 2:,两法检验结果有无联系,查附表5, 得P0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论