




已阅读5页,还剩117页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章 2检验 内容简介 1 卡方检验基本思想 2 四格表资料 完全随机设计 配对设计 3 行x列表 多个率 构成比 关联性检验 4 率的多重比较 5 有序分组资料的线性趋势检验 6 分层资料的M H检验 2检验是应用范围较广的一种计数资料假设检验方法 可以用于两个或多个样本率 或构成比 的比较 多个样本率的多重比较 关联性检验以及频数分布的拟合优度检验 第一节四格表资料的 2检验 一 2检验的基本思想 1 2分布 Chi squaredistribution 2分布是一种连续型随机变量的概率分布 设X1 X2 X 是相互独立的随机变量 且均服从标准正态分布N 0 1 则随机变量的平方和称为 2变量 2变量服从自由度为 的 2分布 记为 2 2 1 2分布的定义 2 2分布的图形 由 2分布的密度函数可以绘制出 2分布曲线 从曲线可以看出 2分布的形状依赖于自由度 的大小 当自由度 2时 曲线呈L型 随着自由度的增加 曲线逐渐趋于对称 当自由度 时 2分布趋于正态分布 3 2分布的基本性质 2分布的一个基本性质是可加性 如果两个独立的随机变量X1和X2分别服从自由度为 1和 2的 2分布 则X1 X2服从自由度为 1 2 的 2分布 2 2检验的基本思想 例7 1某院欲比较异梨醇口服液 试验组 和氢氯噻嗪 地塞米松 对照组 降低颅内压的疗效 将200例颅内压增高症患者随机分为两组 结果见表7 1 问两组降低颅内压的总体有效率有无差别 如果一个统计表中有四个格子中的数据为基本数据 其他格子中的数据是由这四个基本数据计算得到 称这个统计表为四格表 用四格表陈述的资料称为四格表资料 计算公式 A 实际频数 用ARC表示 T 理论频数 用TRC表示 理论频数是根据检验假设H0 1 2确定的 由公式可以看出 2值反映了实际数与理论数的吻合程度 若H0成立 实际频数与理论频数的差值会小 计算出的 2值也会小 反之 若H0不成立 实际频数与理论频数的差值会大 计算出的 2值也会大 行数 1 列数 1 但由于均是正值 格子数越多 2值也会越大 所以 2值的大小还和格子数有关 严格地说和自由度的大小有关 因此只有考虑了自由度的影响 2值才能正确的反应实际频数和理论频数的吻合程度 2检验时 根据自由度和检验水准查 2界值 从而得出统计结论 3 2检验的检验步骤 建立假设并确定检验水准H0 1 2H1 1 2 0 05 计算统计量 首先计算理论频数TRC T11 90 48T12 13 52T21 83 52T22 12 48 确定P值 作出统计推断 2 1 2 1 1 查 2界值表 P 0 0005 按 0 05的水准 拒绝H0 接受H1 可以认为两组降低颅内压总体有效率不等 二 四格表资料 2检验的专用公式 其中 a b c d代表4个实际频数 建立假设并确定检验水准H0 1 2H1 1 2 0 05 计算统计量 确定P值 作出统计推断 2 1 2 1 1 查 2界值表 P 0 005 按 0 05的水准 拒绝H0 接受H1 可以认为两组降低颅内压总体有效率不等 以上 2检验的基本公式和四格表资料 2检验的专用公式要求总例数n 40并且所有格子的T 5 当不满足上述条件时 需要对其进行连续性校正 基本公式的矫正公式 专用公式的矫正公式 三 四格表资料 2检验的校正公式 该校正方法为连续性校正 其原因为 计数资料中的实际频数A为计数资料 不是连续的 所以此时计算的 2值是离散型分布 而 2分布是连续型的分布 此时用 2检验的公式计算得到的 2值会偏大 确定的概率值会偏小 所以要进行连续校正 但当满足总例数n 40并且所有格子的T 5的条件时 这种差异可以忽略不计 不用校正 而在不满足条件时 差异就不能忽略不计 在实际工作中 对于四格表资料 通常规定 1 当n 40且所有的T 5时 用 2检验的基本公式或四格表资料的专用公式 当出现P 时 改用四格表资料的Fisher确切概率法 2 当n 40但有1 T 5时 用校正公式 或者使用四格表资料的Fisher确切概率法 3 当n 40或T 1时 用四格表资料的Fisher确切概率法 例7 2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效 将78例脑血管疾病患者随机分为两组 结果见表7 2 问两种药物治疗脑血管疾病的有效率是否相等 表7 2两种药物治疗脑血管疾病有效率的比较 建立假设并确定检验水准H0 1 2H1 1 2 0 05 分析 本例n 78 40 但T22 4 67 5 所以应使用校正公式 计算统计量 确定P值 作出统计推断 2 1 2 1 1 查 2界值表 0 05 P 0 10 按 0 05的水准 不拒绝H0 还不能认为两种药物治疗脑血管疾病的总体有效率不等 第二节配对四格表资料的 2检验 例7 3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定 结果见表7 3 问两种方法的检测结果有无差别 表7 3两种方法的检测结果 两种四格表格式的比较 配对四格表中a d为两法观察结果一致的两种情况 b c为两法观察结果不一致的两种情况 pA a b n pB a c n 当b和c所对应的总体B和C相等时 A B 说明两种处理方法无差别但由于在抽样研究中 抽样误差不可避免 样本中的b和c往往不等 为此 需要进行假设检验 McNemartest 配对四格表资料 2统计量的公式 b c 40时 b c 40时 建立假设并确定检验水准H0 B CH1 B C 0 05 计算统计量 b c 12 2 14 40 确定P值 作出统计推断 2 1 2 1 1 查 2界值表 0 01 P 0 025 按 0 05的水准 拒绝H0 接受H1 可以认为两种方法的检测结果不同 配对四格表资料的 2检验一般用于样本含量不太大的资料 因该方法仅考虑了两种结果不一致的两种情况 b c 而未考虑样本含量n和两种方法结果一致的情况 a d 所以当n很大且a d的数值很大 b与c的数值相对较小时 即使是检验结果有统计学意义 实际意义往往也不大 0 025 P 0 05 差别有统计学意义 p甲 800 1000 80 p乙 792 1000 79 2 差别的实际意义不大 第四节行 列表资料的 2检验 行 列表 行数或列数至少有一个超过2的统计表称为行 列表 也可以表示为R C表 行 列表 2检验可用于 多个样本率的比较2个或多个样本构成比的比较双向无序分类资料的关联性检验 行 列表资料的 2检验可以使用 2检验的基本公式 也可以使用下面的专用公式 一 多个样本率的比较 例7 6某医师研究物理疗法 药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效 资料见表7 8 问三种疗法的有效率有无差别 表7 8三种疗法有效率的比较 1建立假设并确定检验水准H0 1 2 3 三种疗法治疗周围性面神经麻痹的总体有效率相等 H1 1 2 3不全相等 三种疗法治疗周围性面神经麻痹的总体有效率不全相等 0 05 2计算统计量 3确定P值 作出统计推断 3 1 2 1 2 查 2界值表 P 0 005 按 0 05的水准 拒绝H0 接受H1 可以认为三种疗法的治疗周围性面神经麻痹的总体有效率不全相等 二 两个或多个样本构成比的比较 例7 7某医师在研究血管紧张素I转化酶 ACE 基因I D多态与 型糖尿病肾病 DN 的关系时 将249例 型糖尿病患者按有无糖尿病肾病分为两组 资料见表7 9 问两组 型糖尿病患者的ACE基因型分布有无差别 表7 9DN组与无DN组2型糖尿病患者ACE基因型分布的比较 1建立假设并确定检验水准H0 两组2型糖尿病患者ACE基因型的总体构成相同H1 两组2型糖尿病患者ACE基因型的总体构成不同 0 05 2计算统计量 3确定P值 作出统计推断 2 1 3 1 2 查 2界值表 按 0 05的水准 拒绝H0 接受H1 可以认为两组2型糖尿病患者的ACE基因型的总体构成不同 0 01 P 0 025 三 双向无序分类资料的关联性检验 两个变量均为无序分类变量的行 列表称为双向无序行 列表 对于双向无序行 列表可使用 2检验分析两个变量之间有无关系 例7 8测得某地5801人的ABO血型和MN血型结果如表7 10 问两种血型系统之间是否有关联 表7 10测得某地5801人的血型结果 1建立假设并确定检验水准H0 两种血型系统间无关联H1 两种血型系统间有关联 0 05 2计算统计量 3确定P值 作出统计推断 4 1 3 1 6 查 2界值表 按 0 05的水准 拒绝H0 接受H1 可以认为两种血型系统间有关联 P 0 005 若两变量间存在关联 可以进一步分析关联的密切程度 计算Pearson列联系数C 列联系数C的取值范围为0 1 取值为1表示两个变量完全相关 取值为0表示两个变量无关 取值越接近1关系越密切 越接近0关系越疏远 题中得到 拒绝H0 接受H1 可以认为两种血型系统间有关联的结论 可以进一步分析其关系的密切程度 可以看出两种血型系统间虽然存在联系 但列联系数较小 说明其关系不密切 四 行 列表资料 2检验的注意事项 1 在对行 列表资料进行 2检验时 要求不能有1 5以上的格子1 T 5或者一个格子的T 1 当不满足该条件时 解决的办法 增大样本容量 根据专业知识 删除理论频数太小的行或列 或者将理论频数太小的行或列与性质相近的邻行或邻列合并 使用行 列表资料的确切概率法 2 多个样本率比较 在得到拒绝H0 接受H1时 只能认为各总体率不全相等 需要进一步作多个样本率的多重比较 3 并不是所有的行 列表都可以使用 2检验进行分析 需要分类类型和研究目的选择合适的方法进行检验 第三节四格表资料的确切概率法 Fisher确切概率法的理论依据是超几何分布 并不是 2检验的范畴 但由于在实际应用中作为四格表资料假设检验的补充 所以放在本章中讲授 例7 4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果 将33例HBsAg阳性孕妇随机分为预防注射组和非预防组 结果见表7 4 问两组新生儿的HBV总体感染率有无差别 表7 4两组新生儿HBV感染率的比较 一 基本思想 在周边合计数固定不变的条件下 计算表中4个实际频数变动时的各种组合的概率Pi 再求单侧或双侧累计概率 最后依据检验水准做出推断 各种组合的概率Pi服从超几何分布 其概率之和为1 Pi的计算公式为 1建立假设并确定检验水准H0 1 2H1 1 2 0 05 2计算累计概率 1 在周边合计数不变的条件下 列出所有可能的四格表 可能的四格表共有 周边合计数最小数 1 个 2 计算各四格表的交叉积差 Di ad bc D 表示现有样本四格表的交叉积差 4 计算累计概率 单侧检验时 若D 0 需计算满足Di D 和Pi P 的各四格表的累积概率 若D 0 需计算满足Di D 和Pi P 的各四格表的累积概率 双侧检验时 计算同时满足 和条件的各四格表的累计概率 3 计算各四格表的概率Pi P 表示现有样本四格表的概率 1 2 3 4 5 6 7 8 9 10 A T 6 3 2 1 0 1 2 3 4 5 P P1 P2 P3 P4 P5 P10 0 1210 按 0 05的水准 不拒绝H0 还不能认为两组新生儿的HBV总体感染率不同 本例为双侧检验 第1 2 3 4 5 10共6个四格表满足要求 所以 当a b c d 两行合计数相等 或a c b d 两列合计数相等 时 四格表内各种组合的序列呈对称分布 此时按单侧检验规定条件只计算单侧累积概率 然后乘以2即得双侧概率 例7 5某单位研究胆囊腺癌 腺瘤的P53基因表达 对同期手术切除的胆囊腺癌 腺瘤标本各10份 用免疫组化法检测P53基因 资料见表7 6 问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别 表7 6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 1建立假设并确定检验水准H0 1 2H1 1 2 0 05 2计算累计概率 在周边合计数不变的条件下 列出所有可能的四格表 计算各四格表的交叉积差 计算满足 的四格表的概率Pi 计算累计概率 P 2 P7 P8 0 057 按 0 05的水准 不拒绝H0 还不能认为胆囊腺瘤和胆囊腺癌P53基因表达总体阳性率不同 如果专业上有理由认为胆囊腺癌P53基因表达率不会低于胆囊腺瘤 则作单侧检验 1建立假设并确定检验水准H0 1 2H1 1 2 0 05 2计算累计概率 P P7 P8 0 0286 按 0 05的水准 拒绝H0 接受H1 可以认为胆囊腺癌P53基因表达总体阳性率高于胆囊腺瘤 第五节多个样本率比较的 2分割法 多个样本率比较 在得到拒绝H0 接受H1时 只能认为各总体率不全相等 需要进一步作多个样本率的多重比较 多重比较的方法有 2分割法 Scheff 可信区间法 SNK法 一 基本思想 将多个样本率比较的R 2表 分割成多个独立的四格表进行两两比较 但需要注意的是 为保证检验假设中 型错误 的概率不变 必须重新规定检验水准 新检验水准的估计方法 1 多个处理组间的两两比较 分析目的是对k个处理组间任意两个率进行比较 此时 需要将k 2表分割成个四格表分别进行检验 共进行次检验 所以新的检验水准为 分析目的是各实验组与同一个对照组进行比较 此时 新的检验水准为 2 实验组与同一个对照组的比较 二 多个处理组间的两两比较 例7 9对例7 6中表7 8的资料进行两两比较 以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别 表7 8三种疗法有效率的比较 1建立假设并确定检验水准H0 A B 任两对比组的总体有效率相等H1 A B 任两对比组的总体有效率不等 本例k 3 当 0 05时 新的检验水准 为 2将3 2表拆分为3个四格表 分别进行检验 对此表进行检验 n 40 T22 11 73 5 可以使用四格表资料 2检验的专用公式 经计算 2 6 76 0 00833 P 0 0167 对此表进行检验 n 40 T22 13 58 5 可以使用四格表资料 2检验的专用公式 经计算 2 21 23 P 0 00313 对此表进行检验 n 40 T22 19 44 5 可以使用四格表资料 2检验的专用公式 经计算 2 4 59 P 0 0167 3作出统计推断 按 0 0167的水准 物理疗法组与药物治疗组 拒绝H0 接受H1 可以认为两组的总体有效率不同 物理疗法组和外用膏药组 拒绝H0 接受H1 可以认为两组的总体有效率不同 而药物治疗组和外用膏药组 不拒绝H0 还不能认为两组的总体有效率不同 三 各实验组与同一个对照组的比较 例7 10以表7 8资料中的药物治疗组为对照组 物理疗法组和外用膏药组为实验组 分析两实验组与对照组的总体有效率有无差别 1建立假设并确定检验水准H0 T C 各实验组与对照组的总体有效率相等H1 T C 各实验组与对照组的总体有效率不等 本例k 3 当 0 05时 新的检验水准 为 2将3 2表拆分为2个四格表 分别进行检验 3作出统计推断 按 0 0125的水准 物理疗法组与药物治疗组 拒绝H0 接受H1 可以认为两组的总体有效率不同 而药物治疗组和外用膏药组 不拒绝H0 还不能认为两组的总体有效率不同 对此表进行检验 n 40 T22 11 73 5 经计算 2 6 76 0 00833 P 0 0125 对此表进行检验 n 40 T22 19 44 5 经计算 2 4 59 P 0 0125 第六节有序分组资料的线性趋势检验 一 行 列表的分类及其检验方法的选择 行 列表都可以分为双向无序 单向有序 双向有序属性相同 双向有序属性不同4类 1 双向无序行 列表 表中的两个变量均为无序变量 对于双向无序行 列表资料可以使用 2检验进行多个样本率 两个 多个样本构成比的比较或者关联性检验 分组变量有序 而指标变量无序 2 单向有序行 列表 分组变量有序 而指标变量无序 分组变量有序 而指标变量无序的单向有序行 列表 其研究目的通常是分析不同组别的各种构成是否相同 此时可以使用行 列表资料 2检验进行构成比的比较 分组变量无序 而指标变量有序 分组变量无序 而指标变量有序的单向有序行 列表 其研究目的通常是比较不同疗法的疗效 疗效的等级分布 有无差别 此时应选用非参数检验进行分析比较 3 双向有序属性相同的行 列表 表中的两个变量均为有序变量而且属性相同 它实际上是配对四格表资料的扩展 即水平数 3的诊断试验配伍设计 该资料的研究目的通常是分析两种检测方法的一致性 此时应选用一致性检验 Kappa检验 也可以使用特殊模型分析方法 3 双向有序属性不同的行 列表 表中的两个变量均为有序变量但属性不同 若研究目的为分析不同年龄组动脉硬化等级分布有无差别时 可以把它看作单项有序行 列表资料 进行秩和检验 若研究目的为分析两变量之间的相关关系 可使用等级相关分析 若研究目的为分析两变量间是否存在线性变化趋势 则需进行线性趋势性检验 二 有序分组资料的线性趋势性检验 一 基本思想 首先计算行 列的 2值 然后将总的 2值分解成线性回归分量与偏离线性回归分量 若两分量均有统计学意义 说明两分量存在相关关系 但关系不是简单的直线关系 若线性回归分量有统计学意义 偏离线性回归分量无统计学意义时 说明两分量不仅存在相关关系 而且是线性相关 例7 11某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系 将278例尸解资料整理成表7 13 问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势 二 分析步骤 1建立假设并确定检验水准H0 年龄与冠状动脉粥样硬化等级之间无线性关系H1 年龄与冠状动脉粥样硬化等级之间有线性关系 0 05 本例T44 5 42 使用行 列表 2的专用公式计算 2值 2计算统计量 1 计算总的 2值 2 计算线性回归分量 给两个变量分别赋值 1 2 3 对年龄从小到大赋值为 1 2 3 4 对冠状动脉粥样硬化的等级由小到大赋值为 1 2 3 4 计算线性回归分量 式中 b为回归系数 为b的方差 式中 lXX lYY分别为X Y变量的离均差平方和 lXY为X Y变量的离均差积和 3确定P值 作出统计推断 查界值表 P回归 0 005 0 25 P偏 0 50 按 0 05的水准 线性回归分量 拒绝H0 接受H1 有统计学意义 而偏离线性回归分量 不拒绝H0 无统计学意义 所以可以认为年龄与冠状动脉硬化之间不仅存在相关关系而且为线性相关关系 分层四格表资料的统计分析 Mantal Haenszel分析方法 相关知识 病例对照研究 case controlstudy 1 简介又称回顾性研究 retrospectivestudy 是一种分析流行病学研究方法 主要应用于探索疾病的危险因素和病因 病例对照研究方法是对临床医疗及各种基础研究中形成的病因假设 进行初步验证 近30年来 该方法被广泛应用 特别在研究罕见病及慢性病的发病因素时是非常有效的方法 近年来 病例对照研究已在疫苗效果评价 疗效评价 筛检项目评估以及爆发调查中得到应用 2 基本概念病例对照研究是选择一组患某病的病人 病例组 再选择一组不患该病的对象 对照组 比较两组人群之间在疾病发生之前有关可疑因素 危险因素 的暴露情况 如果两组的暴露率确有差别 则可认为所研究疾病与因素之间存在关联 但不一定是因果关系 病例 对照 暴露 未暴露 暴露 未暴露 调查方向 研究开始 图26 2病例 对照研究过程的示意图 病例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电器具生产过程中的能源管理考核试卷
- 稀土金属冶炼与冶炼设备出口策略考核试卷
- 设备噪声控制与振动分析考核试卷
- 如何设计整个系统架构
- 环保职业卫生课件
- 企业资产管理软件操作教程课件
- 医院病案管理模板
- 2019-2025年标准员之专业管理实务提升训练试卷B卷附答案
- 2025年特种装备电缆合作协议书
- 2025年年快手短视频合作协议书
- 2025年乡村振兴战略相关考试试题及答案
- 2025防撞缓冲车标准
- 中职ps期末考试试卷及答案
- 高温下质子交换膜燃料电池密封垫泄漏机理分析
- 廉洁课件教学课件
- 2024-2025学年全国版图知识竞赛(小学组)考试题库(含答案)
- 2024年广东大亚湾开发区招聘公办学校教师笔试真题
- 江苏交控笔试试题及答案
- 《低压电工实操及考证》全套教学课件
- JJF1033-2023计量标准考核规范
- 三对三篮球赛记录表
评论
0/150
提交评论