卡方检验-研究生ppt课件_第1页
卡方检验-研究生ppt课件_第2页
卡方检验-研究生ppt课件_第3页
卡方检验-研究生ppt课件_第4页
卡方检验-研究生ppt课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2检验 Chi squaretest 3学时 吴成秋公共卫生学院卫生统计学教研室 2检验的应用 1 推断两个 多个 总体率或构成比之间是否有差别2 多个样本率间的多重比较3 两个分类变量之间有无关联性4 频数分布拟合优度检验 一 2检验的基本思想 例7 1某医生用两种疗法治疗前列腺癌 出院后随访3年 甲疗法治疗86例 乙疗法治疗95例 结果见下表 问两种疗法治疗前列腺癌病人的3年生存率是否有差别 表10 7甲乙两种疗法治疗前列腺癌的3年生存率处理生存数死亡数合计生存率 甲疗法a52 46 09 b34 39 91 a b 8660 47乙疗法c45 50 91 d50 44 09 c d 9547 37合计 a c 97 b d 84 n 18153 59表中为基本数据 称为实际频数 用AR C表示 表中是根据A计算得到的 称为理论频数 用TR C表示 该资料称为四格表资料 若假设两种疗法治疗前列腺癌病人的3年生存率相同 即H0 1 2 53 59 则T1 1 86 97 181 46 09T1 2 86 84 181 39 91T2 1 95 97 181 50 91T2 2 95 84 181 44 09 TR C nR nc n 2 A T 2 R 1 C 1 2 1 2 1 1 T 假如H0 1 2成立 则A T不会相差太大 那么 2会小 A与T的差别是由抽样误差所致 反之若检验假设H0不成立 则A T会相差很大 那么 2会大 抽样误差不能引起A与T如此大的差别 判断结果 根据自由度 的大小查 2界值表当 2 2 时 P 拒绝H0 接受H1当 2 2 时 P 不拒绝H0 2反映了实际频数与理论频数的吻合程度 一 四格表的一般公式 二 一般四格表的 2检验 2 A T 2 R 1 C 1 T 以例10 7为例做 2检验H0 1 2即两种疗法治疗前列腺癌的3年生存率相同H1 1 2即两种疗法治疗前列腺癌的3年生存率不相同 0 05T1 1 86 97 181 46 09T1 2 86 84 181 39 91T2 1 95 97 181 50 91T2 2 95 84 181 44 09 2 A T 2 52 46 09 2 34 39 91 2 45 50 91 2 50 44 09 2 3 11 2 1 2 1 1查 2界值表得 20 05 1 3 84 20 05 按 0 05的水准 不拒绝H0 还不能认为两种疗法治疗前列腺癌的3年生存率不相同 T 44 09 50 91 39 91 46 09 二 四格表的专用公式 当n 40 T 5时 用 2 ad bc 2n a b c d a c b d a b c d为四格表的实际频数 a b c d a c b d 是四格表周边的合计数n a b c d 为总的样本含量对例10 7的计算 2 3 11 52 50 34 45 2181 86 95 97 84 显然 计算结果与前相同 但该法避免了计算理论数的麻繁 三 四格表的校正公式 1 2检验的应用条件 1 当n 40且T 5时 用 2检验的基本公式或四格表的专用公式 当P 时 改用四格表的确切概率法 2 当n 40时但有1 T 5时 用四格表 2的校正公式或用四格表的确切概率法 3 当n 40时 或T 1时 用四格表的确切概率法2 四格表 2的校正公式 2 A T 0 5 2 T 2 ad bc n 2 2n a b c d a c b d 例7 2某医师用两种疗法治疗心绞痛 结果如表10 10 问两种疗法的疗效有无差别 表10 10两种疗法治疗心绞痛的效果率 H0 1 2即两种疗法的疗效相等H1 1 2即两种疗法的疗效不等 0 05T 29 9 59 4 42 计算行合计和列合计均为最小的理论数 c2 0 61 1 查 2界值表得 P 0 05 按 0 05的水准不拒绝H0 尚不能认为两种两种疗法的疗效不等 23 3 6 27 59 2 2 59 29 30 50 9 三 配对四格表资料的 2检验 配对四格表资料的 2检验是对配对设计研究所获得的资料为计数资料进行比较 配对设计包括 同一批样品用两种不同的处理方法 观察对象根据配对条件配成对子 同一对子内的不同个体分别接受不同的处理 在病因或危险因素的研究中 将病人和对照按配对条件配成对子 研究是否存在某种病因或危险因素 观察的结果只有阳性 阴性两种可能 清点成对资料时只有四种情况 a 甲 乙 b 甲 乙 c 甲 乙 d 甲 乙 列成下面四格表 适用于配对设计的计数资料配对资料的结果有甲乙结果 a b c d 配对设计的计数资料 2 b c 2 b c 1 b c 40 c2 b c 1 2 b c 1 b c 40 例对120名确诊的乳腺癌病人 分别用甲乙两种方法来检测 甲方法检出阳性率为60 乙方法检出阳性率为50 甲乙一致检出阳性率为35 问甲乙两方法检出阳性率有无差别 表 两种方法的检测结果 H0 B C 1 2 H1 B C 1 2 0 05 b c 30 18 48 40 2 30 18 2 30 18 3 0 1 查 2界值表得P 0 05 按 0 05水准 不拒绝H0 还不能认为两种方法的检验结果不同 配对四格表资料的关联性检验 P761 H0 两种方法无关 无一致性 H1 两种方法有关 有一致性 0 05 2两种方法检测结果的相关系数rr必定等于kappa检验的kappa值 K 0 75一致性好0 40 k 0 75一致性较好K 0 40一致性差 例7 3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定 结果见表7 3 问两种方法的检验结果有无差别 表7 3两种方法的检测结果 H0 B CH1 B C 0 05 b c 12 4 14 40 c2 12 2 1 2 12 2 5 79 1 查 2界值表得0 01 P 0 025 按 0 05水准拒绝H0 接受H1 认为两种方法的检验结果不同 免疫荧光法的阳性检出率较高 四 行 列表资料的 2检验 可以用于多个率及多个构成比资料的比较和双向无序分类资料关联性检验 其基本数据有三种情况 1 多个样本率比较 有R行2列 称为R 2表2 两个样本的构成比比较 有2行C列 称为2 C表3 多个样本的构成比比较 以及双向无序分类资料关联性检验 有R行C列 称为R C表 行列表检验的专用公式 2 n A2 nRnC 1 R 1 C 1 一 多个样本率的比较 例7 6某医师研究物理疗法 药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效 资料见表7 8 问三种疗法的有效率有无差别 表7 8三种疗法有效率的比较 H0 1 2 3 即三种疗法的有效率相等H1 三种疗法的有效率不全相等 0 05 2 532 1992 206 481 72 206 51 262 144 51 1 21 04 3 1 2 1 2查 2界值表 得P 0 005 按 0 05拒绝H0 接受H1 可以认为三种疗法治疗周围性面神经麻痹的有效率有差别 二 样本构成比的比较例7 7某医师在研究血管紧张素转化酶 ACE 基因I D多态与2型糖尿病肾病 DN 的关系时 将249例 型糖尿病患肾病分为两组 资料见表7 9 问两组 型糖尿病患者的ACE基因型总体分布有无差别 表7 9DN组与无DN组 型糖尿病患者ACE基因型分布 H0 两组2型糖尿病患者ACE基因型的总体构成比相同H1 两组2型糖尿病患者ACE基因型的总体构成比不同 0 05按公式 7 10 计算 2 249 422 111 72 482 111 120 362 138 57 1 7 91 2 1 3 1 2查 2界值表得0 01 P 0 025 按 0 05拒绝H0 接受H1 认为DN与无DN的2型糖尿病患者的ACE基因型分布不同 三 双向无序分类资料的关联性检验 例7 8测得某地5801人的ABO血型和MN血型结果如表7 10 问两种血型系统之间是否有关联 表7 10某地5801人的血型 H0 两种血型系统间无关联H1 两种血型系统间有关联 0 05 2 5801 4322 1823 1451 4902 1823 1666 322 348 2684 1 213 16 4 1 3 1 6查 2界值表得P 0 005 按 0 05拒绝H0 接受H1 认为两种血型系统间有关联 若需进一步分析关系的密切程度时 可计算Pearson列联系数CC取值范围在0 1之间 0表示独立 1表示完全相关 愈接近于0 关系愈不密切 愈接近于1 关系愈密切 四 行 列表资料检验的注意事项 1 理论频数T不应太小 不宜有1 5以上的格子1 T 5 不宜有一个格子的T 1若出现上述情况 处理的方法有 1 最好是增加样本的含量 继续观察 使T增加 2 根据专业知识 考虑能否删去T太小的行或列 或T太小的行间或列间 进行合理的合并 3 改用双向无序表的确切概率法2 多个率比较 若所得统计推断为拒绝H0 接受H1时 只能认为各总体率之间总的来说有差别 要进一步推断哪两两总体率之间有差别 需进一步做多个样本率的多重比较 3 对于有序的R C表资料不宜用 2检验 见后 五 R C表的分类及其检验方法的选择 1 双向无序R C表 R C表中两个分类变量皆为无序分类变量 如表7 8 7 9 7 10 对于该类资料 若研究目的为多个样本率 或构成比 的比较 可用R 2表资料的 2检验 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时 可用R C表资料的 2检验以及Pearson列联系数进行分析 2 单向有序R C表 有两种形式 R C表中的分组变量是有序的 如年龄 而指标变量是无序的 如传染病的类型 其研究目的通常是分析不同年龄组各种传染病的构成情况 此种单向有序R C表资料可用行 列资料的 2检验 R C表中的分组变量为无序的 如疗法 而指标变量是有序的 如疗效按等级分组 其研究目的为比较不同方法的疗效 此种单向有序R C表资料宜用秩和检验进行分析 3 双向有序属性相同的R C表 R C表中的两分类变量皆为有序且属性相同 实际上是2 2配对设计的扩展 即水平数 3的诊断试验配伍设计 如用两种检测方法同时对同一批样品的测定结果 其研究目的通常是分析两种检验方法的一致性 此时宜用一致性检验 Kappa检验 4 双向有序属性不同的R C表 R C表中两分类变量皆为有序的 但属性不同 如表7 13 若目的为分析不同年龄组的疗效有无差别时 可把它视为单向有序R C表资料 选用秩和检验 若目的为分析两有序分类变量间是否存在相关关系 宜用等级相关分析或积矩相关分析或Pearson积矩相关分析 若研究目的为分析两有序分类变量间是否存在线性变化趋势 宜用有序分组资料的线性趋势检验 方法 1 2分割法 partitionsof 2method 2 Scheffe 可信区间法3 SNK法 五 多个样本率间的多重比较 一 2分割法 1 基本思想 多个样本率比较若结论为拒绝H0 接受H1时 需进一步做多重比较 即做两两之间的比较 说明每两个总体率之间是否有差异 方法 把R 2表直接分割成多个独立的四格表 进行两两比较的 2检验 但必须重新规定检验水准 其目的是保证检验假设中的 型错误 的概率不变 表7 12 表7 8三个有效率的比较可分割成3个四格表 2 的调整方法 多个率之间的每两两之间的比较 k个样本率每两两之间进行比较 共有次独立的四格表 2检验 加上总的行 列表的 2检验 共作了 1次检验 故其检验水准 各实验组与对照组比较 k 1 个实验组与对照组 其检验水准 3 多个率之间的每两两之间的比较 例7 9对例7 6资料进行两两比较 以推断任何两种疗法治疗周围性面神经麻痹的有效率是否有差异 H0 A B即任何两种疗法的疗效相等H1 A B即任何两种疗法的疗效不等 0 05本题为3个率的比较 K 3 计算 2值见表7 12 查表7 11界值表 确定P值 按 0 0125水准 可认为物理疗法与药物疗法及外用膏药疗法的疗效有差异 还不能认为药物疗法与外用膏药疗法的疗效有差异 4 各实验组与对照组比较 例7 10对例7 6资料中以药物疗法为对照组 物理疗法和外用膏药疗法为实验组 试分析实验组的总体有效率与对照疗法是否有差异 H0 T C即各实验组与对照组的总体有效率相等H1 T C即各实验组与对照组的总体有效率不等 0 05K 3 0 0125可认为物理疗法与药物疗法的疗效有差异 还不能认为外用膏药疗法与疗药物法的疗效有差异 四格表资料Fisher确切概率法 2学时 吴成秋公共卫生学院卫生学教研室 一 基本思想例7 4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果 将33例HBsAg阳性孕妇随机分为预防注射组和非预防组 结果见表7 4 问两组新生儿的HBV总体感染率有无差别 表7 4两组新生儿的感染率 在四格表周边合计数固定不变的条件下表内4个实际频数变动的情况如下 变动组合数 周边合计中最小数 1 1 2 3 4 5 ad bc 198ad bc 165ad bc 132ad bc 99ad bc 66 6 7 8 9 10 ab bc 33ad bc 0ad bc 33ad bc 66ad bc 99 a b c d a c b d a b c d n Pi 1 计算各组合的概率Pi服从超几何分布 其和为1 2 计算累计概率P 设现有样本四格表中的交叉积差a d b c D 其概率为P 其余情况下的组合四格表的交叉积差记为Di 概率记为Pi 1 单侧检验 若现有样本四格表中D 0 须计算满足Di D 和Pi P 条件的各种组合下四格表的累计概率 若D 0 则计算满足Di D 和Pi P 条件的各种组合下四格表的累计概率 2 双侧检验计算满足 Di D 和Pi P 条件的各种组合下四格表的累计概率 若a b c d或a c b d时 四格表内各种组合的序列呈对称分布 此时按单侧检验规定条件只计算单侧累计概率 乘以2即得双侧累计概率 确定P值和作出结论P值是指由H0规定的总体中作随机抽样 获得等于及大于 和 或等于及小于 现有样本检验统计量值的概率 t u t u P t u t u P t t0t t 2 2 P 2 二 检验步骤1 计算现有样本的D 和P 及各组合下四格表的Di2 计算满足 Di D 条件的各组合下四格表的累计概率Pi3 计算同时满足 Di 66和Pi P 条件的四格表的累计概率P P1 P2 P3 P4 P5 P10 0 1210 表7 5例7 4的Fisher确切概率法 例7 5某单位研究胆囊线癌 线瘤的P53基因表达 对同期手术切除的胆囊线癌 线瘤标本各10份 用免疫组化法检测P53基因 资料见表7 6 问胆囊线癌和胆囊线瘤的P53基因表达阳性率有无差别 表7 6胆囊线癌和胆囊线瘤的P53基因表达 H0 1 2H1 1 2 0 05本例a b c d 10 四格表内各种组合以i 4和i 5的组合为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论