第八章 卡方检验(1).ppt_第1页
第八章 卡方检验(1).ppt_第2页
第八章 卡方检验(1).ppt_第3页
第八章 卡方检验(1).ppt_第4页
第八章 卡方检验(1).ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第八章 2检验Chi squaretest 2 掌握内容 几种常见设计类型资料的卡方检验 熟悉的内容 卡方检验的适用范围 了解内容 1 四格表资料的Fisher精确概率法 3 用样本信息推论总体特征的过程 包括 参数估计 运用统计学原理 用从样本计算出来的统计指标量 对总体统计指标量进行估计 假设检验 又称显著性检验 是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断 4 5 在总体率为 的二项分布总体中做n1和n2抽样 样本率p1和p2与 的差别 称为率抽样误差 已知 0nP 5 n 1 P 5 6 例为了解铅中毒病人是否有尿棕色素增加现象 分别对病人组和对照组的尿液作尿棕色素定性检查 结果见下表 问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义 7 2检验 Chi squaretest 是现代统计学的创始人之一 英国人K Pearson 1857 1936 于1900年提出的一种具有广泛用途的统计方法 8 2检验的用途 用途较为广泛的假设检验方法 本章仅介绍用于分类计数资料的假设检验 用于检验两个 或多个 率或构成比之间差别是否有统计学意义 配对 2检验检验配对计数资料的差异是否有统计学意义 9 2检验的基本思想 检验实际频数 A 和理论频数 T 的差别是否由抽样误差所引起的 也就是由样本率 或样本构成比 来推断总体率或构成比 10 表7 1两种药物治疗胃溃疡有效率的比较 目的 推断是否 1 2 11 本例资料经整理成下表形式 即有两个处理组 每个处理组的例数由发生数和未发生数两部分组成 表内有四个基本数据 其余数据均由此四个数据推算出来的 故称四格表资料 12 13 衡量理论频数与实际频数的差别 ARC是位于R行C列交叉处的实际频数 TRC是位于R行C列交叉处的理论频数 ARC TRC 反映实际频数与理论频数的差距 除以TRC为的是考虑相对差距 所以 2值反映了实际频数与理论频数的吻合程度 2值大 说明实际频数与理论频数的差距大 2值的大小除了与实际频数和理论频数的差的大小有关外 还与它们的行 列数有关 即自由度的大小 行 1 列 1 14 理论频数的计算 nR是ARC所在行的合计 nC是ARC所在列的合计 是两个样本例数的合计 15 理论频数是根据检验假设且用合并率来估计而定的 如本例 无效假设是A药组与B药组的总体有效率相等 均等于合计的阳性率66 67 110 165 那么理论上 A药组的85例中阳性人数应为85 110 165 56 67 阴性人数为85 55 165 28 33 同理 B药组的80例中阳性人数应为80 110 165 53 33 阴性人数为80 55 165 26 67 16 2检验的基本公式 上述基本公式由Pearson提出 因此软件上常称这种检验为Peareson卡方检验 下面将要介绍的其他卡方检验公式都是在此基础上发展起来的 它不仅适用于四格表资料 也适用于其它的 行 列表 17 分布是一种连续型分布 Continuousdistribution v个相互独立的标准正态变量 standardnormalvariable 的平方和称为变量 其分布即为分布 自由度 degreeoffreedom 为v 18 2分布是一种连续型分布 Continuousdistribution v个相互独立的标准正态变量 standardnormalvariable 的平方和称为 2变量 其分布即为 2分布 自由度 degreeoffreedom 为v 19 2分布的形状依赖于自由度 的大小 当自由度 2时 曲线呈 L 型 随着 的增加 曲线逐渐趋于对称 当自由度 时 曲线逼近于正态曲线 20 如果假设检验成立 A与T不应该相差太大 理论上可以证明 A T 2 T服从x2分布 计算出x2值后 查表判断这么大的x2是否为小概率事件 以判断建设检验是否成立 21 在 1 22 自由度一定时 P值越小 x2值越大 反比关系 当P值一定时 自由度越大 x2越大 1时 P 0 05 x2 3 84P 0 01 x2 6 63P 0 05时 1 x2 3 84 2 x2 5 99 23 第一节四格表资料 2检验 一般四格表的基本形式 24 25 四格表 2检验的专用公式 n 40 T 5 为了不计算理论频数T 可由基本公式推导出 直接由各格子的实际频数 a b c d 计算卡方值的公式 27 1 建立检验假设 检验统计量 2值反映了实际频数与理论频数的吻合程度 28 若检验假设H0 1 2成立 四个格子的实际频数A与理论频数T相差不应该很大 即统计量 2不应该很大 如果 2值很大 即相对应的P值很小 若P 则反过来推断A与T相差太大 超出了抽样误差允许的范围 从而怀疑H0的正确性 继而拒绝H0 接受其对立假设H1 即 1 2 29 2 计算检验统计量 1 当总例数n 40且所有格子的理论频数T 5时 用检验的基本公式或四格表资料检验的专用公式 基本公式 专用公式 30 2 当总例数n 40且有一个格子1 T 5时 用校正公式 或改用四格表资料的Fisher确切概率法 31 2分布是一连续型分布 而四格表资料属离散型分布 由此计算得的 2统计量的抽样分布亦呈离散性质 为改善 2统计量分布的连续性 则需行连续性校正 correctionforcontinuity 2连续性校正仅用于 1的四格表资料 当 2时 一般不作校正 32 3 当n 40 或T 1时 不能用卡方检验 改用四格表资料的Fisher确切概率法 33 3 作出统计结论 以 1查界值表 若 按检验水准拒绝 接受 可认为两总体率不同 若 按检验水准不拒绝 尚不能认为两总体率不同 34 自由度 愈大 2值也会愈大 所以只有考虑了自由度 的影响 2值才能正确地反映实际频数A和理论频数T的吻合程度 检验的自由度取决于可以自由取值的格子数目 而不是样本含量n 四格表资料只有两行两列 1 即在周边合计数固定的情况下 4个基本数据当中只有一个可以自由取值 35 例8 5某药品检验所随机抽取574名成年人 研究抗生素的耐药性 资料如表8 11 问两种人群的耐药率是否一致 表8 11某抗生素的人群耐药情况 36 理论频数的计算 实际数理论数 37 2检验的步骤 1 建立假设并确定检验水准H0 两种人群对该抗生素的耐药率相同 即 1 2 两总体率相等 H1 两种人群对该抗生素的耐药率不同 即 1 2 两总体不相等 0 05 38 2 计算检验统计量当总例数n且所有格子的理论频数T 5时 用检验的基本公式或四格表资料检验的专用公式 2 23 12 39 3 查 2界值表 附表7 确定P值 P 0 05 得出结论 按0 05水准 不拒绝H0 可以认为两组人群对该抗生素的耐药率的差异无统计学意义 40 例2某矿石粉厂生产一种矿石粉时 在数天内即有部分工人患有职业性皮肤炎 后随机抽取15名工人穿新防护服 其余仍穿原用的防护服 一个月后检查两组工人的皮肤炎患病情况 资料见下表 问两组的患病率差别有无统计学意义 41 本例n 40 因有一格子的理论数 5 因而要用校正 2检验 H0 两组工人皮肤炎总体患病率相等 即 1 2H1 两组工人皮肤炎总体患病率不等 即 1 2 0 05校正 2值为 42 以 1查界值表 按检验水准不拒绝 接受 尚不能认为穿不同防护服的两组工人的皮肤炎患病率的差别有统计学意义 43 注意 两样本率比较的资料 既可用检验也可用检验来推断两总体率是否有差别 且在不校正的条件下两种检验方法是等价的 对同一份资料有 小结T 5 用四格表专用公式n 401 T 5 用连续性校正公式T 1 用确切概率法 n 40 用确切概率法 45 第三节配对四格表资料的 2检验 与计量资料推断两总体均数是否有差别有成组设计和配对设计一样 计数资料推断两个总体率 构成比 是否有差别也有成组设计和配对设计 即四格表资料和配对四格表资料 46 将含量为n的随机样本同时按照两个二项分类的属性进行交叉分类 形成2行2列的交叉分类表 如表8 6 目的是检验两种属性间的阳性率是否相同 表8 6配对四格表资料表 47 变量1的阳性率 变量2的阳性率 可见 两个变量阳性率的比较只和b c有关 而与a d无关 变量1的阳性率 变量2的阳性率 48 前面是两个独立样本 行合计是事先固定的 而这里的 两份样本 互不独立 样本量都是n 是固定的 而行合计与列合计却是事先不确定的 49 配对四格表资料的 2检验的专用公式 b c 40b c 40 50 两种白喉杆菌培养基结果比较 配对四格表资料的 2检验步骤 51 配对四格表资料的 2检验步骤 1 H0 两种培养基阳性率相同 总体B C H1 两种培养基阳性率不同 总体B C 0 05 2 计算统计量 2 3 27 3 843 按 0 05水准 不拒绝H0 可以认为甲乙两法血清学检出阳性率无显著性差异 52 第四节行 列表 2检验 53 R C表的 2检验通用公式 54 几种R C表的检验假设H0 55 1 多个样本率的比较 例某医院用3种方案治疗急性无黄疸型病毒肝炎254例 观察结果见表 问3种疗法的有效率是否不同 56 检验步骤 H0 3种治疗方案的有效率相等H1 3种治疗方案的有效率不全相等 0 05 57 P 0 05 在 0 05的检验水准下 拒绝H0 接受H1 可以认为三种疗法的有效率有差别 58 2 样本构成比的比较 例某研究人员收集了亚洲 欧洲和北美洲人的A B AB O血型资料 结果见表 问不同地区人群ABO血型分类构成比是否不同 59 检验步骤 H0 不同地区人群血型分布总体构成比相同H1 不同地区人群血型分布总体构成比不全相同 0 05 P 0 05 在 0 05检验水准下 拒绝H0 认为三个不同地区的人群血型分布总体构成比有差别 60 1 对R C表 若较多格子 1 5 的理论频数小于5或有一个格子的理论频数小于1 则易犯第一类错误 出现某些格子中理论频数过小时怎么办 1 增大样本含量 最好 2 删去该格所在的行或列 丢失信息 3 根据专业知识将该格所在行或列与别的行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论