第7章 卡方检验.ppt_第1页
第7章 卡方检验.ppt_第2页
第7章 卡方检验.ppt_第3页
第7章 卡方检验.ppt_第4页
第7章 卡方检验.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 2检验 第一节四格表资料的 2检验 2检验 chi squaretest 是一种用途广泛的假设检验方法 适用于分类变量资料中 推断两个或两个以上的总体率 或构成比 之间有无差异 检验两个分类指标之间有无相关关系 例7 1 某院欲比较异梨醇口服液 试验组 和氢氯噻嗪 地噻米松 对照组 降低颅内压的疗效 将200例颅内压增高症患者随机分为两组 结果见表7 1 问两组降低颅内压的总体有效率有无差别 表7 1两组降低颅内压疗效比较组别有效无效合计有效率 试验组99510495 20对照组75219678 13合计1742620087 00 上表中这四个格子的数据是整个表的基本数据 其余数据都是从这四个基本数据计算出来的 这种资料称为四格表资料 一 2检验的基本思想 2检验要计算一个统计量值 2值的计算公式为 式中 A为实际频数 是实际工作中收集到的 T为理论频数 是根据检验假设计算出来的 式中 表示第R行 第C列的理论频数nR为第R行的合计nc为第C列的合计 从 2值的计算公式我们可以看到 2值反映了实际频数与理论频数的吻合程度 如果检验假设H0成立 则实际频数和理论频数一般不应相差很大 计算出的 2值也就不应很大 即得到的是较小的 2值 如果检验假设H0不成立 则实际频数和理论频数就会相差很大 计算出的 2值也就很大 即得到的是较大的 2值 2值与p值的关系见附表9 即 2值越大 p值越小 2值越小 p值越大 因此 如果检验假设H0成立 得到的是较小的 2值 即会得到较大的p值 如果检验假设H0不成立 得到的是较大的 2值 即得到较小的p值 若p 检验水准 我们就认为假设H0成立 就不拒绝H0 若p 我们就怀疑假设H0成立 因而拒绝H0 2值的大小 除取决于A T的大小外 还取决于格子数 A T的个数 的多少 因为各格子中都是正值 所以格子数愈多 2值就愈大 只有排除这种影响 2值才能正确地反映A和T的吻合程度 因此 查表确定p值时 要考虑自由度的大小 四格表的自由度 是在周边合计固定的前提下 能自由取值的格子数 因此 四格表的自由度 1 其计算公式为 二 本例的 2检验 1 建立假设并确定检验水准H0 1 2H1 1 2 0 05 2 计算统计量计算理论频数 结果见表 12 86 3 确定p值 做出统计推断结论自由度 2 1 2 1 1 得p 0 005 按 0 05的水准 拒绝H0 可以认为两组降低颅内压总体有效率不等 试验组高于对照组 三 四格表资料的专用公式 四格表的一般格式如表8 10 表7 22 2表格式B1B2A1aba bA2cdc da cb da b c d n 对于四格表资料 可直接用专用公式计算值 计算公式为 式中 a b c d分别为四格表的实际频数 n为样本例数 上例用四格表专用公式计算时 与前面结果一致 四 四格表资料 2值的连续性校正 2分布是连续性分布 2界值是根据连续性的理论分布计算出来的 而 2检验用于分类资料比较时 原始数据是不连续的 用 2界值查表确定p值可能存在误差 特别是在四格表 1时 查表确定p值时 p值会偏低 需根据具体情况作不同的处理 1 当T 5且n 40时 直接进行 2检验 2 当1 T 5而n 40时 需计算校正 2值 3 当T 1或n 40时 则不能用 2检验 应用确切概率法 校正 2值的计算公式为 例7 2某医学院抽样调查大学四年级和五年级学生的近视眼患病率情况 结果如下表 问四年级和五年级学生的近视眼患病率是否不同 表7 3两个年级大学生近视眼的患病率年级近视非近视合计患病率 四年级2 4 67 26 23 33 287 14五年级5 2 33 9 11 69 1425 71合计7354216 67 1 建立假设并确定检验水准H0 1 2两个年级学生的近视眼患病率相同H1 1 2两个年级学生的近视眼患病率不同 0 05 2 计算统计量先计算每一格子的理论频数 结果有两个格子的理论频数为140 故应计算校正 2值 3 确定p值 做出统计推断结论自由度 2 1 2 1 1 查附表9 得p 0 05 按 0 05的水准 不拒绝H0 认为两种疗法的疗效无差别 若对 2值不进行校正 则 2 5 49 p 0 05 得出差异有显著性的相反结论 五 四格表资料的精确概率法 四格表精确概率法 不属于 2检验范畴 但可作为四格表资料 2检验应用上的补充 因为对于四格表 在T40 但如果一个格子的实际数为0 此时分布也不是 2分布 而是超几何分布 也不能用 2检验 这些资料要分析其差异是否具有显著性 应采用精确概率法直接计算概率 其概率计算公式为 确切概率法的基本思想是 在四格表的周边合计不变的条件下 直接计算四格表内四个实际数据的各种组合之概率和 即 第二节行 列表资料的 2检验 四格表只有两行 两列 是行 列表的最简单形式 当行和列都大于2时 统称行 列表或R C表 行 列表的 2检验用于多个率或构成比的比较 其基本思想及值计算与四格表 2检验相同 但 2值的计算公式可推导成 一 多个样本率的比较 其目的是推断多个样本率所代表的总体率是否相等 例7 3某研究人员欲研究某中药治疗失眠的效果 将122名患者随机分为三组 分别服用新药 传统治疗失眠药和安慰剂 观察三组患者的疗效情况 结果如表8 8 试问三组患者的疗效是否相同 表7 4三组药物治疗失眠的有效率组别有效无效合计有效率 新药6424812 50传统药11263729 73安慰剂2983778 38合计467612237 70 1 建立假设并确定检验水准H0 1 2 3 三组药物有效率相等H1 三组药物有效率不等或不全相等 0 05 2 计算统计量 40 05 3 确定p值 做出统计推断结论自由度 3 1 2 1 2 查附表9 得p 0 005 按 0 05的水准 拒绝H0 接受H1 可以认为三组药物有效率不等或不全相等 二 多个样本构成比的比较 其目的是推断多个样本构成比所代表的总体构成比之间是否相等 例7 4某研究人员收集了亚洲 欧洲和北美洲人的A B AB O血型资料 结果见表8 7 问不同地区的人群血型构成是否相同 表7 5三个不同地区人群的血型构成地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592 1 建立假设并确定检验水准H0 不同地区的人群血型构成相同H1 不同地区的人群血型构成不同或不全相同 0 05 2 计算统计量 3 确定p值 做出统计推断结论自由度 3 1 4 1 6 查附表9 得p 0 005 按 0 05的水准 拒绝H0 接受H1 可以认为不同地区的人群血型构成不同或不全相同 三 行 列表检验的注意事项 1 要求理论频数不能太小 否则会导致分析的偏性 一般认为行 列表中不宜有1 5以上格子的理论频数小于5 或有一个格子的理论频数小于1 如果理论频数太小 处理办法为 1 最好是通过增加样本例数以增加理论频数 2 删去理论频数太小的行或列 3 将理论频数太小的行或列与性质相近的邻行或邻列合并 以增加理论频数 2 关于双向有序行列表的处理 当效应按强弱分为若干个级别 则结果可整理为双向有序行列表 如表8 9的数据 若比较甲乙两医生的诊断结果是否一致 不能用 2检验 只能用其他统计方法 如秩相关分析等 3 当多个样本率 构成比 比较的 2检验 结论为拒绝检验假设时 只能认为各总体率 构成比 之间总的来说有差别 但不能说明它们彼此之间有差别 要进一步说明它们彼此之间是否有差别 需应用分割法 四 行 列表资料的分割 行 列表的 2检验中 若结论为拒绝检验假设 p 0 05 时 只能认为各总体率之间总的来说有差别 但不能说明它们彼此之间有差别 要进一步说明它们彼此之间是否有差别 还要进行两两比较 即将行 列表分割成几个独立的四格表 从而对每两个四格表中两个率的差异是否具有统计学意义作出统计推断 一 多个实验组间的两两比较 经行 列表 2检验 若结论为有统计学意义的多个实验组率 要进一步说明它们彼此之间是否有差别 需进行两两比较 为了不是 扩大 因此必须对 进行校正 校正的方法有 例7 5某医院用三种方案治疗急性无黄疸型病毒肝炎254例 结果如表8 3所示 试比较三种疗法的有效率是否相同 三种方案治疗肝炎的疗效组别有效无效合计有效率 西药组514910051 00中药组35458043 75中西医结合组59157479 73合09 1 建立假设并确定检验水准H0 1 2 3 三种方案的有效率相等H1 三种方案的有效率不等或不全相等 0 05 2 计算检验统计量 3 确定p值 作出统计推断结论因为自由度 3 1 2 1 2 查 2界值表 得p 0 005 在 0 05的水准上 拒绝H0 接受H1 可以认为三种疗法的有效率的差异有统计学意义 但究竟两两之间是否都有意义 需进一步作两两比较 即对行 列表进行分割 此时应对检验水准 进行校正 计算出校正的检验水准 先对表7 5西药与中药的疗效进行检验表7 5西药与中药治疗肝炎疗效的比较组别有效无效合计有效率 西药组514910051 00中药组35458043 75合计869418047 78 1 建立假设并确定检验水准H0 1 2西药组与中药组有效率相等H1 1 2西药组与中药组有效率不等 0 017 2 计算统计量可直接用四格表资料 2检验的专用公式计算统计量 2值 3 确定p值 做出统计推断结论自由度 2 1 2 1 1 得p 0 25 按 0 017的水准 不拒绝H0 可以认为西药组与中药组的有效率相等 同样的方法 可得到中西医结合组治疗肝炎的疗效好于单纯西药组的疗效 p 0 005 中西医结合组治疗肝炎的疗效好于单纯中药组的疗效 p 0 005 二 多个实验组与同一对照组的比较 经行 列表 2检验 若结论为有统计学意义的多个实验组率 要进一步说明每个实验组与同一对照组之间是否有差别 则不需进行两两比较 为了不是 扩大 因此 也必须对 进行校正 校正的方法有 第三节配对资料的 2检验 对一组观察对象 分别观察其两种分类变量的表现 则结果可归纳成双向交叉排列的统计表 这类统计表用以描述行变量和列变量之间的关系 特称为列联表 列联表内两个分类变量是否有相关关系的统计推断 仍用R C表 2检验 但它的检验假设不同 2 2列联表 即配对计数资料 除可比较两种处理间有误差异 还可以作相关分析外 配对计数资料列表表示 称为配对设计四格表资料 如表8 17表7 6配对四格表资料表格 例7 6某研究者用甲 乙两种培养基的培养细菌的阳性率 结果见表8 18 问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论