第七章卡方检验.ppt_第1页
第七章卡方检验.ppt_第2页
第七章卡方检验.ppt_第3页
第七章卡方检验.ppt_第4页
第七章卡方检验.ppt_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第七章检验 Chi squareTest 2 2检验 Chi squaretest 是现代统计学的创始人之一 英国人K Pearson 1857 1936 于1900年提出的一种具有广泛用途的统计方法 可用于资料分布的拟合优度检验 两个或多个率或构成比间的比较等等 3 4 5 6 目的 推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验 检验统计量 应用 计数资料 8 第一节四格表资料的检验 9 目的 推断两个总体率 构成比 是否有差别要求 两样本的两分类个体数排列成四格表资料 10 1 基本思想 例7 1某院欲比较异梨醇口服液 试验组 和氢氯噻嗪 地塞米松 对照组 降低颅内压的疗效 将200例颅内压增高症患者随机分为两组 结果见表7 1 问两组降低颅内压的总体有效率有无差别 11 表7 1两组降低颅内压有效率的比较 12 本例资料经整理成图7 2形式 即有两个处理组 每个处理组的例数由发生数和未发生数两部分组成 表内有四个基本数据 其余数据均由此四个数据推算出来的 故称四格表资料 13 图7 2四格表资料的基本形式 14 基本思想 可通过检验的基本公式来理解 式中 A为实际频数 actualfrequency T为理论频数 theoreticalfrequency 式中 TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计 T为在无效假设前提下 两总体率相等 等于合计率 推算的预期值 15 如上例 无效假设是试验组与对照组降低颅内压的总体有效率相等 均等于合计的有效率87 那么在这个前提下 理论上 试验组的104例颅内压增高症患者中有效者应为104 174 200 90 48 无效者为104 26 200 13 52 同理 对照组的96例颅内压增高症患者中有效者应为96 174 200 83 52 无效者为96 26 200 12 48 16 检验统计量值反映了实际频数与理论频数的吻合程度 若检验假设H0 1 2成立 四个格子的实际频数A与理论频数T相差不应该很大 即统计量不应该很大 如果值很大 即相对应的P值很小 若 则反过来推断A与T相差太大 超出了抽样误差允许的范围 从而怀疑H0的正确性 继而拒绝H0 接受其对立假设H1 即 1 2 17 由公式 7 1 还可以看出 值的大小还取决于个数的多少 严格地说是自由度 的大小 由于各皆是正值 故自由度 愈大 值也会愈大 所以只有考虑了自由度 的影响 值才能正确地反映实际频数A和理论频数T的吻合程度 检验的自由度取决于可以自由取值的格子数目 而不是样本含量n 四格表资料只有两行两列 v 1 即在周边合计数固定的情况下 4个基本数据当中只有一个可以自由取值 18 1 分布是一种连续型分布 按分布的密度函数可给出自由度 1 2 3 的一簇分布曲线 图7 1 2 分布的一个基本性质是可加性 如果两个独立的随机变量X1和X2分别服从自由度 1和 2的分布 即 那么它们的和 X1 X2 服从自由度 1 2 的分布 即 2 分布 19 3 界值 当v确定后 分布曲线下右侧尾部的面积为a时 横轴上相应的值 记作 见附表8 值愈大 p值愈小 反之 值愈小 p值愈大 20 21 1 建立检验假设 确定检验水平 H0 1 2即试验组与对照组降低颅内压的总体有效率相等H1 1 2即试验组与对照组降低颅内压的总体有效率不相等 0 05 3 假设检验步骤 22 2 求检验统计量值 23 以v 1查附表8的界值表得P 0 005 按a 0 05检验水准拒绝H0 接受H1 可以认为两组降低颅内压总体有效率不等 即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪 地塞米松的有效率 24 二 四格表资料检验的专用公式 25 分布是一连续型分布 而四格表资料属离散型分布 由此计算得的统计量的抽样分布亦呈离散性质 为改善统计量分布的连续性 则需行连续性校正 26 三 四格表资料检验的校正公式 27 四格表资料检验公式选择条件 专用公式 校正公式 直接计算概率 28 例7 2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效 将78例脑血管疾病患者随机分为两组 结果见表7 2 问两种药物治疗脑血管疾病的有效率是否相等 29 表7 2两种药物治疗脑血管疾病有效率的比较 30 本例 故用四格表资料检验的校正公式 v 1 查界值表得0 05 P 0 10 按a 0 05检验水准不拒绝H0 尚不能认为两种药物治疗脑血管疾病的有效率不等 31 本资料若不校正时 结论与之相反 32 第二节配对四格表资料的检验 33 与计量资料推断两总体均数是否有差别有成组设计和配对设计一样 计数资料推断两个总体率 构成比 是否有差别也有成组设计和配对设计 即四格表资料和配对四格表资料 34 例7 3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定 结果见表7 3 问两种方法的检测结果有无差别 35 表7 3两种方法的检测结果 36 上述配对设计实验中 就每个对子而言 两种处理的结果不外乎有四种可能 两种检测方法皆为阳性数 a 两种检测方法皆为阴性数 d 免疫荧光法为阳性 乳胶凝集法为阴性数 b 乳胶凝集法为阳性 免疫荧光法为阴性数 c 37 其中 a d为两法观察结果一致的两种情况 b c为两法观察结果不一致的两种情况 检验统计量为 38 注意 本法一般用于样本含量不太大的资料 因为它仅考虑了两法结果不一致的两种情况 b c 而未考虑样本含量n和两法结果一致的两种情况 a d 所以 当n很大且a与d的数值很大 即两法的一致率较高 b与c的数值相对较小时 即便是检验结果有统计学意义 其实际意义往往也不大 39 40 第三节四格表资料的Fisher确切概率法 41 条件 n 40 或T 1 或P a时 理论依据 超几何分布 非检验的范畴 42 例7 4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果 将33例HBsAg阳性孕妇随机分为预防注射组和非预防组 结果见表7 4 问两组新生儿的HBV总体感染率有无差别 43 表7 4两组新生儿HBV感染率的比较 44 一 基本思想 在四格表周边合计数固定不变的条件下 计算表内4个实际频数变动时的各种组合之概率 再按检验假设用单侧或双侧的累计概率 依据所取的检验水准a做出推断 45 1 各组合概率Pi的计算在四格表周边合计数不变的条件下 表内4个实际频数a b c d变动的组合数共有 周边合计中最小数 1 个 如例7 4 表内4个实际频数变动的组合数共有9 1 10个 依次为 46 各组合的概率Pi服从超几何分布 其和为1 计算公式为 47 2 累计概率的计算 单 双侧检验不同 设现有样本四格表中的交叉积差a d b c D 其概率为P 其余组合四格表的交叉积差记为Di 概率记为Pi 48 1 单侧检验若现有样本四格表中D 0 须计算满足Di D 和Pi P 条件的各种组合下四格表的累计概率 若D 0 则计算满足Di D 和Pi P 条件的各种组合下四格表的累计概率 49 2 双侧检验计算满足和Pi P 条件的各种组合下四格表的累计概率 若遇到a b c d或a c b d时 四格表内各种组合的序列呈对称分布 此时按单侧检验规定条件只计算单侧累计概率 然后乘以2即得双侧累计概率 50 二 检验步骤 本例n 33 40 1 计算现有样本四格表的D 和P 及各组合下四格表的Di 见表7 5 本例D 66 P 0 08762728 2 计算满足条件的各组合下四格表的概率Pi 51 3 计算同时满足和Pi P 条件的四格表的累计概率 本例P1 P2 P3 P4 P5和P10满足条件 累计概率为P P1 P2 P3 P4 P5 P10 0 1210 0 05按a 0 05检验水准不拒绝H0 尚不能认为预防注射与非预防的新生儿HBV的感染率不等 52 表7 5例7 4的Fisher确切概率法计算表 53 例7 5某单位研究胆囊腺癌 腺瘤的P53基因表达 对同期手术切除的胆囊腺癌 腺瘤标本各10份 用免疫组化法检测P53基因 资料见表7 6 问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别 54 表7 6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 55 本例a b c d 10 由表7 7可看出 四格表内各种组合以i 4和i 5的组合为中心呈对称分布 表7 7例7 5的Fisher确切概率法计算表 为现有样本 56 1 计算现有样本的D 和P 及各组合下四格表的Di 本例D 50 P 0 02708978 2 计算满足Di 50条件的各组合下四格表的概率Pi 3 计算同时满足Di 50和Pi P 条件的四格表的累计概率 本例为P7和P8 4 计算双侧累计概率P P 0 05 按 0 05检验水准不拒绝H0 尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等 57 注意 例7 5中 若专业上有理由认为胆囊腺癌不会低于胆囊腺瘤的P53基因表达阳性率 则进行单侧检验 H0 p1 p2 H1 p1 p2 a 0 05 由表7 7计算单侧概率P P7 P8 0 0286 0 01 P 0 05 单侧检验拒绝H0 接受H1 可以认为胆囊腺癌的P53基因表达阳性率高于胆囊腺瘤 58 第四节行 列表资料的检验 59 行 列表资料 多个样本率比较时 有R行2列 称为R 2表 两个样本的构成比比较时 有2行C列 称2 C表 多个样本的构成比比较 以及双向无序分类资料关联性检验时 有行列 称为R C表 60 检验统计量 61 一 多个样本率的比较 62 例7 6某医师研究物理疗法 药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效 资料见表7 8 问三种疗法的有效率有无差别 表7 8三种疗法有效率的比较 63 检验步骤 H0 p1 p2 p3 即三种疗法 有效率相等H1 三种疗法 有效率不全相等a 0 05查界值表得P 0 005 按a 0 05检验水准拒绝H0 接受H1 可以认为三种疗法治疗周围性面神经麻痹的有效率有差别 64 二 样本构成比的比较 65 例7 7某医师在研究血管紧张素I转化酶 ACE 基因I D多态 分3型 与2型糖尿病肾病 DN 的关系时 将249例2型糖尿病患者按有无糖尿病肾病分为两组 资料见表7 9 问两组2型糖尿病患者的ACE基因型总体分布有无差别 表7 9DN组与无DN组2型糖尿病患者ACE基因型分布的比较 66 检验步骤 H0 两组总体构成比相同H1 两组总体构成比不同a 0 05查界值表得0 01 P 0 025 按a 0 05检验水准拒绝H0 接受H1 可认为DN与无DN的2型糖尿病患者的ACE基因型分布不同 67 三 双向无序分类资料的关联性检验R C表中两个分类变量皆为无序分类变量的行 列表资料 又称为双向无序R C表资料 注意 双向无序分类资料为两个或多个样本 做差别检验 例7 7 若为单样本 做关联性检验 68 例7 8测得某地5801人的ABO血型和MN血型结果如表7 10 问两种血型系统之间是否有关联 表7 10某地5801人的血型 单样本 做关联性检验 69 表7 10资料 可用行 列表资料检验来推断两个分类变量之间有无关系 或关联 若有关系 可计算Pearson列联系数C进一步分析关系的密切程度 列联系数C取值范围在0 1之间 0表示完全独立 1表示完全相关 愈接近于0 关系愈不密切 愈接近于1 关系愈密切 70 检验步骤 H0 两种血型系统间无关联H1 两种血型系统间有关联a 0 05 71 由于列联系数C 0 1883 数值较小 故认为两种血型系统间虽然有关联性 但关系不太密切 查界值表得P 0 05 按a 0 05检验水准拒绝H0 接受H1 可认为两种血型系统间有关联 其Pearson列联系数为 72 四 行 列表资料检验的注意事项 1 行列表中的各格T 1 并且1 T 5的格子数不宜超过1 5格子总数 否则可能产生偏性 处理方法有三种 1 增大样本含量以达到增大理论频数的目的 属首选方法 只是有些研究无法增大样本含量 如同一批号试剂已用完等 73 2 根据专业知识 删去理论频数太小的行或列 或将理论频数太小的行或列与性质相近的邻行或邻列合并 这样做会损失信息及损害样本的随机性 注意 不同年龄组可以合并 但不同血型就不能合并 3 改用双向无序R C表的Fisher确切概率法 74 2 多个样本率比较 若所得统计推断为拒绝H0 接受H1时 只能认为各总体率之间总的来说有差别 但不能说明任两个总体率之间均有差别 要进一步推断哪两两总体率之间有差别 需进一步做多个样本率的多重比较 见第五节 75 3 医学期刊中常见这样的情况 不管R C表资料中的两个分类变量是有序还是无序 均用检验分析 这种做法是不妥的 对于有序的R C表资料不宜用检验 因为行 列表资料的检验与分类变量的顺序无关 当有序变量的R C表资料中的分类顺序固定不变时 无论将任何两行 或两列 频数互换 所得值皆不变 其结论相同 这显然是不妥的 因此在实际应用中 对于R C表资料要根据其分类类型和研究目的选用恰当的检验方法 见第六节 76 第五节多个样本率间的多重比较 77 当多个样本率比较的R 2表资料检验 推断结论为拒绝H0 接受H1时 要进一步推断哪两两总体率有差别 若直接用四格表资料的检验进行多重比较 将会加大犯 类错误的概率 样本率间的多重比较不能直接用四格表资料的检验 多个样本率间的多重比较的方法有分割法 Scheffe 可信区间法和SNK法 本节仅仅介绍一种基于分割法的多个样本率间多重比较的方法 后两种方法可参阅有关书籍 78 因分析目的不同 k个样本率两两比较的次数不同 故重新规定的检验水准的估计方法亦不同 通常有两种情况 分割法 一 基本思想多个样本率比较的资料可整理成2 k表资料 若经行 列表资料检验的结论为拒绝H0 接受H1时 可不经任何处理 直接用分割法把2 k表分成多个独立的四格表进行两两比较 但必须重新规定检验水准 其目的是为保证检验假设中I型错误a的概率不变 79 1 多个实验组间的两两比较分析目的为k个实验组间 任两个率均进行比较时 须进行次独立的四格表检验 再加上总的行 列表资料的检验 共次检验假设 故检验水准a用下式估计 1 多个实验组间的两两比较分析目的为k个实验组间 任两个率均进行比较时 须进行次独立的四格表检验 再加上总的行 列表资料的检验 共次检验假设 故检验水准a用下式估计 式中 k为样本率的个数 80 2 实验组与同一个对照组的比较分析目的为各实验组与同一个对照组的比较 而各实验组间不须比较 其检验水准a 用下式估计 式中k为样本率的个数 由该式估计的检验水准a 较保守 a 通常较小 81 82 二 多个实验组间的两两比较 83 例7 9对例7 6中表7 8的资料进行两两比较 以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别 二 多个实验组间的两两比较 84 检验步骤 本例为3个实验组间的两两比较 H0 p1 p2 即任两对比组的总体有效率相等H1 p1 p2 即任两对比组的总体有效率不等a 0 05 85 表7 12三种疗法有效率的两两比较 86 按a 0 0125检验水准 物理疗法组与药物治疗组拒绝H0 接受H1 物理疗法组与外用膏药组拒绝H0 接受H1 药物治疗组与外用膏药组不拒绝H0 87 例7 10以表7 8资料中的药物治疗组为对照组 物理疗法组与外用膏药组为试验组 试分析两试验组与对照组的总体有效率有无差别 H0 pT pC 即各试验组与对照组的总体有效率相等H1 pT pC 即各试验组与对照组的总体有效率不等a 0 05本例为各实验组与同一对照组的比较 三 各实验组与同一个对照组的比较 88 物理疗法组与药物治疗组比较 6 76 P0 0125 按a 0 0125检验水准 物理疗法组与药物治疗组拒绝H0 接受H1 可认为物理疗法组与药物治疗组的总体有效率有差别 外用膏药组与药物治疗组不拒绝H0 尚不能认为两总体有效率有差别 结合表7 8资料 物理疗法的有效率高于药物治疗 8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论