卡方检验_第1页
卡方检验_第2页
卡方检验_第3页
卡方检验_第4页
卡方检验_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2检验,2,2检验(Chi-square test),是现代统计学的创始人之一,英国统计学家K.Pearson于1900年提出的一种具有广泛用途的假设检验方法。常用于分类变量资料的统计推断。,3,用途,(1)单样本率或构成比的检验。(2)两样本率或构成比的检验。(3)多样本率或构成比的检验。(4)两分类配对计数资料的检验。(5)多分类配对计数资料的检验。(6)两变量关联性检验。(7)两变量线性趋势检验。(8)变量分布的拟合度检验,等等。,4,2 检验的主要方法,四格表检验:主要用于两样本率或比的检验。行列表检验:主要用于多样本率或比的检验。配对设计四格表检验:主要用于配对设计资料的检验。,5,2检验,6,2检验的基本思想是: 如果检验假设成立,则两种疗法的存活率的差异仅是抽样误差引起的,相差不会太大,由此而计算出来的理论频数(T)与实际频数(A)也不会相差很大,即2值不会相差很大;如果两样本率相差过大,即实际频数与理论频数相差较大,2值也会相差较大,相应的P值也就越小。,7,分布是一种连续性随机变量的概率分布。,X2分布,8,9,10,又称四格表X2检验,用于推断两个总体分布是否相同,主要进行两个率或两个构成比的研究。,22表资料的X2检验,11,四格表资料表格形式,12,X2 检验的基本公式为,理论频数T :,条件:n40,T5,13,四格表检验专用公式,14,例题 某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表。问两组流感发病率有无差别?,15,例 用药组和对照组流感发病率的比较,16,建立检验假设:Ho:用药组与对照组发病率相同。H1:用药组与对照组发病率不同。=0.05或者,17,18,确定p值:查表2 临界值:20.05,13.84,20.01,16.63,本例: 2=4.125 20.05,0.01PP0.05。在=0.05水准上,不拒绝H0,差别无统计学意义。即尚不能认为单纯手术疗法与联合疗法对鼻咽癌患者治疗效果有差别。,22,四格表2值的校正,英国统计学家Yates认为,2分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5),23,四格表卡方值的校正,应用条件 (1)任一格的1T5,且n40时,需计算校正值。 (2)任一格的T1或n40时,用确切概率计算法。 注意:校正后卡方值变小,结果更保守,基本公式,专用公式,24,例 某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表,问两疗法的治愈率是否相等?,表 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较,25,本例:X22.710.05,不拒绝Ho.本例若对X2值不校正, X2 =4.06,得P0.05,结论正好相反。,26,配对设计资料的2检验 又称 McNemar 检验,27,例6.9 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?,配对22列联表资料的2检验,28,配对22列联表x2检验的基本思想,29,当b+c40时,(当b+c40时),(当b+c40时),方法原理,30,例6.9 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?,配对22列联表资料的2检验,31,1、建立检验假设Ho:两种检验方法的阳性率相同(1=2); 或者总体B=C,两种检验方法无差别H1:两种检验方法的阳性率不相同(12); 或者总体BC,两种检验方法有差别 =0.052、计算统计量3、推断结论:X2=3.5, X20.05,不拒绝Ho,差异无统计学意义。不能认为两种检验方法有差别。,32,多个独立样本RC列联表资料的X2检验,33,例6.10 某市重污染区、一般市区和农村的出生婴儿的致畸情况如表6-6,问三个地区的出生婴儿的致畸率有无差别?,多个样本率的比较,34,(1)建立检验假设 H0:三个地区的出生婴儿的致畸率相等 H1:三个地区的出生婴儿的致畸率之间不全相等 =0.05 (2) 计算X2值,35,分析步骤,(3)确定P值 本例 =(31)(21)=2,查界值表,X20.005,210.60。计算结果是X2=167.11 P0.05推断结论 在=0.05的水准上,接受H0,差异无统计学意义。故尚不能认为鼻咽癌患者与眼科病人的血型构成有差别。,42,理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。理论数太小有四种处理方法:最好增加样本含量以增大理论频数;根本的方法。将理论频数较小的行或列与邻行或邻列合并以增大理论频数。用确切概率计算法。计算机软件完成。 删去理论频数太小的行和列。此法不好,行列表资料的检验的注意事项,43,第五节 行列表资料的关联性分析,对于行列表资料,我们的分析目的除了进行多个率或构成比的比较外,还可以根据研究目的利用2检验进行关联性分析及一致性检验等。,44,一、双向无序列联表资料的关联性检验,45,(1)建立检验假设,确定检验水准H0:两种血型之间无关联性H1:两种血型之间有关联性 =0.05(2)计算 值,46,47,P和C的取值范围在01之间,0表示不相关;越接近于1表示关系越密切;1表示完全相关。注意,P和C只表示两指标间的相关程度,并不表示相关方向。,48,二、双向有序且属性不同列联表资料的关联性分析 该类资料的特点是指列联表的行变量和列变量都是有序分类的,其目的是分析行变量和列变量之间有无关联性。,49,50,三、双向有序且属性相同列联表资料的一致性分析 这样的RC表被称为双向有序且属性相同的“方形”列联表,简称为“方表”。 双向有序且属性相同的“方形”列联表的关联性分析往往进行一致性分析。 一致性是指多次对事物观察、测量和评价,其结果一致的程度。,51,1960年Cohen等提出使用Kappa值,又称Kappa系数(Kappa coefficient)作为评价该类指标间一致性程度的指标。其计算公式为,52,Kappa值可波动于-1和1之间。当Kappa值为1说明两次结果完全一致;Kappa值为-1,两次结果完全不一致;Kappa值为0,说明两次结果因机遇造成。 实际应用中,Kappa值一般用正值说明一致性。当两指标为反向变化时,应调整其中之一的排列顺序以达到两者间的同向性,保证pApe。,53,Kappa值为样本统计量,需要进行假设检验,一般按照单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论