卡方检验ppt课件.ppt_第1页
卡方检验ppt课件.ppt_第2页
卡方检验ppt课件.ppt_第3页
卡方检验ppt课件.ppt_第4页
卡方检验ppt课件.ppt_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实例1已知北方农村儿童前囟门闭合月龄为14 1月 某研究者从东北某县抽取36名儿童 得囟门闭合月龄均值为14 3月 标准差为5 08月 问该县儿童前囟门闭合月龄的均数是否与一般儿童不同 问题1 研究目的是什么 问题2 用什么方法解决 1 实例2 某军区总医院欲研究A B C三种降血脂药物对家兔血清肾素血管紧张素转化酶 ACE 的影响 将26只家兔随机分为四组 均喂以高脂饮食 其中三个试验组 分别给予不同的降血脂药物 对照组不给药 一定时间后测定家兔血清ACE浓度 u ml 如表1 问四组家兔血清ACE浓度是否相同 2 问题1 研究目的是什么 问题2 用什么方法解决 3 例11 1某研究者欲比较甲 乙两药治疗小儿上消化道出血的效果 将90名患儿随机分为两组 一组采用甲药治疗 另一组采用乙药治疗 一个疗程后观察结果 见表11 1 问两药治疗小儿上消化道出血的有效率是否有差别 4 表11 1甲 乙两药治疗小儿上消化道出血的效果 问题1 本例资料类型 此表称为 问题3 研究目的是什么 问题4 用什么方法解决 问题2 本例设计类型 5 第十一章检验 6 卡方检验是英国统计学家K Pearson于1900年提出的 以卡方分布和拟合优度为理论依据 一种用途较广的假设检验方法 英国生物计量学派KarlPearson 1857 1936 现代统计学之父 7 完全随机设计下两个或多个样本率 或构成比 配对设计下两组频数分布线性趋势卡方检验推断两变量间有无相关关系等 用途 8 第一节独立样本列联表资料的卡方检验第二节配对设计资料的卡方检验第三节拟合优度的卡方检验第四节线性趋势卡方检验第五节四个表的确切概率法 本章内容 9 第一节完全随机设计 独立样本 列联表资料的检验在抽样研究中 由于个体间存在变异 必然存在着抽样误差 率 或构成比 的抽样误差与均数的抽样误差概念相同 10 例11 1某研究者欲比较甲 乙两药治疗小儿上消化道出血的效果 将90名患儿随机分为两组 一组采用甲药治疗 另一组采用乙药治疗 一个疗程后观察结果 见表11 1 问两药治疗小儿上消化道出血的有效率是否有差别 11 表11 1甲 乙两药治疗小儿上消化道出血的效果 研究目的 12 表11 1甲 乙两药治疗小儿上消化道出血的效果两组的有效率不同有两种可能 1 两药的总体有效率无差别 两样本率的差别仅由抽样误差所致 2 两种药物的有效率确有不同 13 1 建立检验假设H0 1 2两药的有效概率相同H1 1 2两药有效概率不同检验水准 0 05 2 计算检验统计量 一 2检验基本思想 14 一 卡方检验的基本思想表11 1中 27 18 40 5是整个表的基本数据 是实际观察得到的 其余数据都是从这四个基本数据相加而得的 这种资料是两组两分类资料 称为四格表 fourfoldtable 亦称2 2表 2 2table 画黑板 15 表两独立样本率比较的四格表 16 无效假设H0为 1 2 即两种药物治疗小儿消化道出血的有效率相同 两样本的有效率的差别仅有抽样误差所致 由于此时总体情况未知 故用样本合计有效率对总体有效率进行估计 即H0为 1 2 74 44 在此基础上 可以推算每个格子的期望频数 称为理论频数 用符号T表示 从样本观察到的频数称为实际频数 用符号A表示 17 若H0成立 则理论上 甲药组有效人数为 甲药组无效人数为 乙药组有效人数为 乙药组无效人数为 18 为相应行的合计为相应列的合计n为总例数 19 表11 1甲 乙两药治疗小儿上消化道出血的效果 20 检验的基本公式 从基本公式可以看出 统计量值反映了实际频数和理论频数的吻合程度 值与什么有关 1 与A与T的差别 吻合程度有关 2 与格子数 严格地说是自由度有关 21 由统计量的公式 11 2 可以看出 格子数越多 非负数之和 则卡方值越大 即卡方值的大小除了与A与T的差别大小有关外 还与格子数量有关 因而考虑卡方值大小的同时 应同时考虑格子数的多少 引入自由度v 式中 k为格子数 s为估计的参数个数 R为行数 C为列数 如本例中 4个格子 估计甲乙两药的有效率 则k 4 s 2 v 4 1 2 2 1 2 1 1 22 检验的基本公式 一定自由度下 如果假设检验H0 1 2 成立 则实际频数和理论频数之差一般不会相差太大 值相应也不会太大 反之 实际频数和理论频数之差相差很大 则值相应也会很大 大到什么程度认为不是抽样误差造成的而是两个不同总体呢 值近似服从自由度为v分布 23 分布是一种连续型随机变量的概率分布 设有v个相互独立的标准正态分布随机变量Z1 Z2 Zv 的分布称为自由度为v的分布 记为 分布的形状依赖于自由度v的大小 当自由度v 1时 随着v的增加 曲线逐渐趋于对称 v趋于度 时分布逼近正态分布 24 各种自由度的分布右侧尾部面积为 时的临界值记为 列于附表9 25 检验的基本公式 一定自由度下 如果假设检验H0 1 2 成立 则实际频数和理论频数之差一般不会相差太大 值相应也不会太大 反之 实际频数和理论频数之差相差很大 则值相应也会很大 大到什么程度认为不是抽样误差造成的而是两个不同总体呢 当P 则有理由认为无效假设不成立 继而拒绝H0 作出统计推断 26 二 2 2列联表资料的检验 一 2 2列联表资料检验的步骤现以例11 1说明2 2列联表资料检验的步骤 建立假设H0 1 2H1 1 2 确定检验水准 0 05 计算统计量值 27 确定P值自由度 行数 1 列数 1 2 1 2 1 1 查界值表得P 0 01 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为两药治疗小儿上消化道出血的有效率有差别 其中乙药的有效率高于甲药 28 二 四格表的专用公式a b c d分别为四格表中的四个实际频数 n为总例数 本例 29 三 四格表统计量的连续性校正1 当n 40 且T 5时 不须校正 直接用基本公式 11 2 或专用公式 11 5 计算 2 任一格子的1 T 5 且n 40时 需计算校正值 或使用四格表的确切概率法 3 任一格子的T 1或n 40时 需改用四格表确切概率法 30 例11 2某研究欲比较甲 乙两药治疗下呼吸道感染的疗效 将65例下呼吸道感染者随机分为两组 进行随机双盲试验 结果见表11 3 两组纳入分析的病例数分别为32和33人 问两药治疗下呼吸道感染的有效率有无差别 表11 3两药治疗下呼吸道感染的效果 31 建立假设H0 1 2H1 1 2 确定检验水准 0 05 计算统计量值本例 而n 40 故应计算校正的卡方值 32 确定P值自由度 行数 1 列数 1 2 1 2 1 1 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 还不拒绝H0 即差异没有统计学意义 即还不能认为两药治疗下呼吸道感染的有效率有差别 注意 如果本例不校正 直接用公式 11 5 计算值 则P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 结论相反 33 例某医师用甲 乙两疗法治疗单纯消化不良 结果如下表 问两种疗法的治愈率有无差别 表两种疗法对单纯消化不良的治愈率比较 34 建立假设H0 1 2H1 1 2 确定检验水准 0 05 计算统计量值 确定P值 2 1 x 2 1 1 查界值表得P 0 05 35 下结论因为P 0 05 按 0 05的水准 不拒绝H0 差异无统计学意义 尚不能认为甲 乙两疗法对小儿单纯性消化不良的治愈率不等 36 完全随机设计四格表资料 2检验适用条件当n 40且Tmin 5时 2检验基本公式或四格表专用公式 当n 40 1 Tmin 5时 需对 2值进行校正 当n 40或Tmin 1时 改用四格表确切概率计算法 2检验所得概率P 时 37 完全随机设计四格表资料 2检验适用条件例 38 完全随机设计四格表资料 2检验适用条件例 39 完全随机设计四格表资料 2检验适用条件例 2 9 40 三 R C列联表资料的检验 当基本数据的行数或列数大于2时 统称为行 列表或R C表 R C表的检验主要用于多个样本率 或构成比 的比较 行 列资料检验的专用公式n为总例数 A为每个格子的实际频数 nR为与A同行的行合计 nC为与A同列的列合计 41 一 多个样本率的比较例11 3某研究者欲比较A B C三种方案治疗轻 中度高血压的疗效 将年龄在50 70岁的240例轻 中度高血压患者随机等分为3组 分别采用三种方案治疗 一个疗程后观察疗效 结果见表11 4 问三种方案治疗轻 中度高血压的有效率有无差别 42 表11 4三种方案治疗轻 中度高血压的效果 43 建立假设H0 1 2 3H1 三种方案治疗轻 中度高血压的有效率不等或不全等 确定检验水准 0 05 计算统计量值 44 确定P值 3 1 2 1 2 查界值表得P 0 01 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为三种方案治疗轻 中度高血压的有效率不等或不全等 45 例某市重污染区 一般污染区和农村的出生婴儿的致畸情况如下表 问三个地区的出生婴儿的致畸率有无差别 表某市三个地区出生婴儿的致畸率比较 46 建立假设H0 1 2 3H1 1 2 3之间不等或不全等 确定检验水准 0 05 计算统计量值 47 确定P值 3 1 2 1 2 查界值表得P 0 01 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为三个地区的出生婴儿的致畸率有差别 48 例为研究某镇痛药的不同剂量镇痛效果是否有差别 研究人员在自愿的原则下 将条件相似的53名产妇随机分成三组 分别按三种不同剂量服用该药 镇痛效果如下表 试分析该药不同剂量的镇痛效果有无差别 表某药不同剂量的镇痛效果 49 建立假设H0 三种剂量的镇痛效果相同H1 三种剂量的镇痛效果不同或不全相同 确定检验水准 0 05 计算统计量值 50 确定P值 3 1 2 1 2 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为三种剂量的镇痛效果不同或不全相同 51 二 两个或多个构成比的比较例11 4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响 在经济条件相似的甲 乙两个国家级贫困县 其中甲县2006年已开展新型农村合作医疗 乙县2006年尚未开展 分别进行抽样调查 得到2006年应住院者未住院原因 见表11 5 问甲 乙两县应住院者未住院原因构成比是否不同 52 表11 5甲 乙两县应住院者未住院原因构成比 53 建立假设H0 甲 乙两县应住院者未住院原因总体构成比相同同H1 甲 乙两县应住院者未住院原因总体构成比不同 确定检验水准 0 05 计算统计量值 54 确定P值 2 1 4 1 3 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 还不拒绝H0 差异没有统计学意义 即尚不能认为甲 乙两县应住院者未住院原因总体构成比分布不同 55 例1986年某地城市和农村20至40岁已婚妇女避孕方法情况如下表 试分析该地城市和农村避孕方法的总体分布有无差别 56 表某地城市和农村已婚妇女避孕方法情况 57 建立假设H0 城市和农村已婚妇女避孕方法的总体分布相同H1 城市和农村已婚妇女避孕方法的总体分布不全同 确定检验水准 0 05 计算统计量值 58 确定P值 2 1 4 1 3 查界值表得P 0 01 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为城市和农村已婚妇女避孕方法的总体分布不同 59 例某医院研究急性白血病患者与慢性白血病患者的血型构成情况 其资料如下表 问两组血型构成比是否不同 表急性与慢性白血病患者的血型构成 60 建立假设H0 急性与慢性白血病患者的构成比相同 H1 急性与慢性白血病患者的构成比不相同 确定检验水准 0 05 计算统计量值 61 确定P值 2 1 4 1 3 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 不拒绝H0 差异无统计学意义 尚不能认为急性与慢性白血病患者的构成比不相同 62 行 列表检验时的注意事项 计算 2值时 只能用绝对数 不能用相对数 2检验要求理论频数不宜太小 一般认为行 列表中不宜有1 5以上格子的理论频数小于5 或有一个理论频数小于1 关于单向有序行列表的统计处理 当多个样本率 或构成比 比较的检验 结论为拒绝检验假设 只能认为各总体率 或总体构成比 之间总的说来有差别 但不能说明它们某两者间有差别 63 适用条件及注意事项举例 独立样本RXC列联表 2检验 64 适用条件及注意事项举例 独立样本RXC列联表 2检验 某省三个地区花生的黄曲霉毒素污染率的比较 65 独立样本RXC列联表 2检验 适用条件及注意事项举例 66 表2慢性咽炎两种药物疗效资料 67 理论频数太小有三种处理办法 增加样本例数以增大理论频数 删去上述理论频数太小的行或列 将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并 使重新计算的理论频数增大 68 单向有序行列表的统计处理 当效应按强弱 或优劣 分为若干个级别 比如分为 等6个等级 在比较各处理组的效应有无差别时 宜用第12章的秩和检验法 如作 2检验只说明各处理组的效应在构成比上有无差异 69 多个样本率的两两比较 当多个样本率 或构成比 比较的检验 结论为拒绝检验假设 只能认为各总体率 或总体构成比 之间总的说来有差别 但不能说明它们某两者间有差别 两两比较的方法较多 大致分为三类 调整水准后进行两两比较 本教材介绍此法 2分割 估计两率之差的置信区间 70 例为研究某镇痛药的不同剂量镇痛效果是否有差别 研究人员在自愿的原则下 将条件相似的53名产妇随机分成三组 分别按三种不同剂量服用该药 镇痛效果如下表 试分析该药不同剂量的镇痛效果有无差别 表某药不同剂量的镇痛效果 71 建立假设H0 三种剂量的镇痛效果相同H1 三种剂量的镇痛效果不全相同 确定检验水准 0 05 计算统计量值 72 确定P值 3 1 2 1 2 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为三种剂量的镇痛效果不全相同 73 对于比较多组独立样本的卡方检验 拒绝H0只能说各组总体率不全相同 即多组中至少有两组的有效率是不同的 但并不是多组有效率彼此间均不相同 若要明确哪两组间不同 还须进一步作多组间的两两比较 两两比较的可能数量 两两比较时新检验水准 74 本例为三种剂量的镇痛效果进行比较 因为经假设检验 拒绝H0 接受H1 差异有统计学意义 即可认为三种剂量的镇痛效果不全相同 然后 可以进行三种剂量的镇痛效果的两两比较 两两比较的可能数量 两两比较时新检验水准 75 表不同剂量有效率之间的两两比较注 表中 表示差别没有统计学意义 表示差别有有统计学意义 76 第二节配对设计资料的检验一 配对2 2列联表资料的检验 McNemar检验 配对四格表资料作比较的目的是通过单一样本数据推断两种处理的结果有无差别 常用于判断两种检验方法 两种培养方法等的差别 77 第二节配对设计资料的 2检验 配对四格表资料设有132份食品标本 每份一分为二 分别用两种方法做沙门菌检验 结果如下 试比较两法的阳性结果是否有差别 表9 8两法检验结果比较 78 配对设计资料的原始记录形式 79 第二节配对设计资料的 2检验 表9 8两法检验结果比较 80 由上表可看出 由此可见 在配对四格表中 a d在比较两种属性的阳性率有无差异时不起作用 故只需比较甲 乙 的对子数b与甲 乙 的对子数c之间的差别来反映两种属性的阳性率的差异 则无效假设H0为B C 即b c代表的总体相等 b c对应的理论频数为 81 将这两个格子的实际频数和理论频数代入卡方统计量的基本公式中 式11 2 82 即配对设计四格表检验公式为 上式又称McNemar检验 83 当b c 40时 需做连续性校正 公式如下 注意 a d反映的甲 乙两种属性一致的情况 由于a d两个格子不能反映差异 因此 当a d比较大 b c比较小时 若得到差异有统计学意义 需结合两样本率差异的大小得出专业结论 84 例有28份白喉病人的咽喉涂抹标本 把每份标本分别接种在甲 乙两种白喉杆菌培养基上 结果如下表 问两种白喉杆菌培养基的效果有无差别 表甲 乙两种白喉杆菌培养基的培养结果甲培养基乙培养基合计 11 a 9 b 20 1 c 7 d 8合计121628 85 建立假设H0 B CH1 B C 确定检验水准 0 05 计算统计量值本例b 9 c 1 b c 40 故计算校正值 确定P值 2 1 2 1 1 查界值表得P 0 05 86 下结论因为P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为甲 乙两种白喉杆菌培养基的培养效果不同 甲培养基阳性率较高 87 例11 6有某研究者欲比较心电图和生化测定诊断低钾血症的价值 分别采用两种方法对79名临床确诊的低钾血症患者进行检查 结果见下表 问两种方法的检测结果是否不同 表两种方法诊断低钾血症的结果 88 建立假设H0 B CH1 B C 确定检验水准 0 05 计算统计量值本例b 25 c 4 b c 29 40 故计算校正值 确定P值 2 1 2 1 1 查界值表得P 0 01 89 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为两种方法的检测结果不同 由于心电图检测的阳性率为88 62 生化测定方法的阳性率为62 03 故心电图检测的阳性率高于生化测定方法的阳性率 90 二 配对设计的R R表资料的检验在配对四格表中 分类变量只有2个取值 即二分类 但在实际工作中 分类变量具有R R 2 个可能的取值 这样就构成了更一般的配对R R列联表 表配对设计的R R列联表资料 91 配对设计的R R表资料检验的T统计量当R 2时 公式 11 11 与公式 11 9 完全等价 即该方法是McNemar的推广 92 例11 7对某研究欲比较X线和CT对强直性脊柱炎 AS 骶髂关节病变的诊断价值 收集临床上诊断为AS的患者136例 对272个骶髂关节分别拍摄X线平片和CT扫描 结果见表11 11 问两种方法诊断骶髂关节病变的分级有无差别 93 表11 11两种方法诊断骶髂关节病变的分级情况 94 建立假设H0 两种方法诊断骶髂关节病变分级的频率分布相同H1 两种方法诊断骶髂关节病变的分级频率分布不同 确定检验水准 0 05 计算统计量T值 95 确定P值 R 1 3 查界值表得P 0 01 下结论因为P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 即可认为两种方法诊断骶髂关节病变的分级频率分布不同 96 例对150名冠心病患者用两种方法检查室壁收缩运动的情况 检查结果见下表 试比较两种方法测定结果的概率分布有无差别 表两种方法检查室壁收缩运动的情况 97 建立假设H0 两变量的频率分布相同H1 两变量的频率分布不同 确定检验水准 0 05 计算统计量T值 98 确定P值 k 1 2 查界值表得P 0 05 下结论因为P 0 05 按 0 05的水准 不拒绝H0 差异无统计学意义 即尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同 99 第三节 拟合优度检验 拟合优度检验 goodnessoffittest 根据样本的频率分布检验其总体分布是否服从于某种分布 正态分布 Poisson分布等 基本思想是判断实际频数和理论频数的差别是否由抽样误差所引起 100 第三节 拟合优度检验 拟合优度检验 goodnessoffittest 实际频数用A表示 根据H0确定的理论频数用T表示 则构造的 2统计量为 2值的大小反映了实际频数与理论频数的吻合程度 在H0成立的条件下 实际频数与理论频数相差不应该很大 即 2值不会太大 若一次抽样得到的 2值超过的预先规定检验水准所对应的 2界值 则有理由怀疑H0的成立 101 第三节 拟合优度检验 102 103 第三节 拟合优度检验 例7对表7所示数据作正态分布拟合优度检验 136例体模骨密度测量值的均数 1 260 标准差 0 010 1 检验的假设 H0 总体分布等于均数为1 260 标准差为0 010的正态分布H1 总体分布不等于该正态分布 104 表7136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算 105 第四节线性趋势检验当资料是按某自然顺序的等级分层 或连续型变量等计划后再分层的情况下 可采用CochranArmitage趋势检验以分析率随该分层因素变化的趋势 统计量计算公式如下 106 例11 9对例11 9为了解某市中学生的吸烟状况 抽样调查了891名中学生 结果见表11 13 问该市中学生吸烟率是否有随年级增加而增高的趋势 表某市不同年级中学生吸烟率 107 式中 N是总人数 n是各组人数 T是总阳性数 t是各组阳性数 Z是各组的评分 如果是按数量分组的资料 评分的原则与分组间隔相适应 如果是按性质分组的资料 评分的原则是1 2 3 108 例11 9对例11 9为了解某市中学生的吸烟状况 抽样调查了891名中学生 结果见表11 13 问该市中学生吸烟率是否有随年级增加而增高的趋势 表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论