卡方检验及SPSS分析PPT课件.pptx_第1页
卡方检验及SPSS分析PPT课件.pptx_第2页
卡方检验及SPSS分析PPT课件.pptx_第3页
卡方检验及SPSS分析PPT课件.pptx_第4页
卡方检验及SPSS分析PPT课件.pptx_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卡方检验Chi SquareTest 预防医学教研室张杰 2020 1 27 1 课程内容 第一节 四格表 fourfolddata 资料的x2检验 第二节 配对 paireddata 资料的x2检验 第三节 R C表资料的x2检验 第四节 分层卡方检验第五节 多个样本率间的多重比较课程小结 2020 1 27 2 SPSS统计分析 交叉表 Crosstabs 过程 一 四格表 fourfolddata 资料的x2检验 二 配对 paireddata 资料的x2检验 三 R C表资料的x2检验 四 两分类变量有无关联分析及列联系数C卡方 Chi Square 过程 五 拟合问题 比较样本与已知总体的分布 2020 1 27 3 第一节四格表资料的检验x2testoffourfolddata 2020 1 27 4 目的 推断两个总体率 构成比 是否有差别要求 两样本的两分类个体数排列成四格表资料 2020 1 27 5 一 2检验的基本思想 2是一种用途较广的计数资料的假设检验方法 属于非参数检验的范畴 根本思想 在于比较理论频数和实际频数的吻合程度或拟合优度问题 x2检验 以x2分布为方法的理论基础 2020 1 27 6 2检验的基本公式 A为实际频数 actualfrequency T为理论频数 theoreticalfrequency nR是行和 nC是列和 n是四格数之和 2表示观察值与期望值之间的偏离程度 1900年由英国统计学家KarlPearson首次提出 故被称为Pearson 2 2020 1 27 7 8 2020 1 27 例1 四格表资料的x2检验 x2检验基本步骤 建立检验假设H0 两总体龋患率相等H1 两总体龋患率不等计算理论频数计算x2统计量确定P值 作出推论 2020 1 27 9 可编辑 四格表检验的条件 1 2 3 校正公式 10 SPSS操作过程 建立数据文件 例1 sav数据格式 包括4行3列的频数格式 3个变量即行变量 group 列变量 effect 和频数变量 freq 说明频数变量 数据加权个案DataWeightCases x2检验 从菜单选择分析描述统计交叉表AnalyzeDescriptiveStatisticsCrosstabs结合例1数据演示操作过程 2020 1 27 11 首先建立数据文件 如下 2020 1 27 12 注意 由于上表给出的不是原始数据 而是频数表数据 应该进行预处理 2020 1 27 13 指定加权变量 weightcases 在实际的统计中 经常需要计算数据的加权平均数 例如 希望了解不用牙膏使用者的平均患龋量 如果仅以各种牙膏的患龋量的平均数作为平均患龋量是不合理的还应考虑到各牙膏使用者的患龋量对平均患龋量的影响 因此 以各牙膏使用者的患龋量作为权重计算各牙膏患龋率的加权平均数 才是我们需要求的数据 在SPSS处理中就需要将各牙膏的患龋量作为加权变量 2020 1 27 14 WeightCases 对话框 2020 1 27 15 2020 1 27 16 交叉表 Crosstabs 过程 Crosstabs过程用于对分类资料和有序分类资料进行统计描述和统计推断 统计描述过程可以产生2维至n维列联表 并计算相应的百分数指标 统计推断包括了常用的x2检验 Kappa值 分层X2 X2M H 以及四格表资料的确切概率 Fisher sExactTest 值 2020 1 27 17 2020 1 27 18 Crosstabs过程详解 界面说明 行Rows框 用于选择行 列表中的行变量 列Columns框 用于选择行 列表中的列变量 层Layer框 指定分层变量 即控制变量 如果要指定不同的分层变量做分析 则将其选入Layer框 并用Previous和Next钮设为不同层 Displayclusteredbarcharts复选框 显示复式条图 Suppresstable复选框 不在输出结果中给出行 列表 2020 1 27 19 Crosstabs过程详解 界面说明精确 Exact 子对话框 针对2 2以上的行 列表设计计算确切概率的方法 统计量 Statistics 子对话框 用于定义所需计算的统计量 Chi square复选框 计算pearson卡方值 对四格表资料自动给出校正卡方检验和确切概率法结果 Correlations复选框 计算行列变量的pearson相关系数和Spearman等级相关系数 2020 1 27 20 Crosstabs过程详解 界面说明 Kappa复选框 计算Kappa值 即内部一致性系数 介于0 0 7071之间 Risk复选框 计算比数比OR值 RR值 McNemanr复选框 进行配对卡方检验的McNemanr检验 一种非参数检验 Cochran sandMantel Haenszelstatistics复选框 计算X2M H统计量 X2CMH 可在下方输出H0假设的OR值 默认为1 2020 1 27 21 可编辑 Crosstabs过程详解 界面说明单元格 Cells 子对话框 用于定义列联表单元格中需要计算的指标 Counts复选框 是否输出实际观察数 Observed 和理论频数 Expected Percentages复选框 是否输出行百分数 Row 列百分数 Column 以及合计百分数 Total Residuals复选框 选择残差的显示方式格式 Format 子对话框 用于选择行变量是升序还是降序排列 2020 1 27 22 表示含氟牙膏与一般牙膏患龋率的比较 除了观察值以外 还有期望值 SPSS结果输出 2020 1 27 23 结论 2 2 82 P 0 093 按 0 05水准 不拒绝H0 尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低 Pearson卡方连续校正卡方似然比卡方Fisher确切卡方线性相关检验样本数 注意检查样本例数n和理论频数T是否满足条件 N 40且理论频数T 5 2020 1 27 24 例2 x2检验 校正公式将116例癫痫患者随机分为两组 一组70例接受常规加高压氧治疗 高压氧组 另一组46例接受常规治疗 常规组 结果如下 问两种疗法的有效率有无差别 2020 1 27 25 2020 1 27 26 2020 1 27 27 T 5 2020 1 27 28 按检验水准不拒绝 尚不能认为组有效率不等 本资料若不校正时 结论与之相反 2020 1 27 29 例3 x2检验 Fisher确切概率法 2020 1 27 30 一 适用条件 T 1或n 40 P 二 基本思想 超几何分布 在四格表周边合计不变的条件下 直接计算表内四个数据的各种组合之概率 找出的所有表格并将概率求和 若这些表的合计P 则推翻H0假设 例3 x2检验 Fisher确切概率法 2020 1 27 31 三 检验步骤 假设H0 H1 2 计算最小理论频数及值 边缘合计不变条件下 变动表中数据 3 找出边缘合计中的最小值 对应的格子中的数据从0到 排出所有可能的四格表 5 选出值的所有表 分别求P值后相加 2020 1 27 32 2020 1 27 33 SPSS操作过程 建立数据文件 例3 sav数据格式 包括4行3列的频数格式 3个变量即行变量 group 列变量 effect 和频数变量 freq 说明频数变量 数据加权个案DataWeightCases x2检验 从菜单选择分析描述统计交叉表AnalyzeDescriptiveStatisticsCrosstabs结合数据 例3 sav 演示操作过程 2020 1 27 34 2020 1 27 35 2020 1 27 36 第二节配对资料的检验x2testofpairedfourfolddata 2020 1 27 37 与计量资料推断两总体均数是否有差别有成组设计和配对设计一样 计数资料推断两个总体率 构成比 是否有差别也有成组设计和配对设计 即四格表资料和配对四格表资料 2020 1 27 38 例4某抗癌新药的毒理研究 将78只大鼠按性别 窝别 体重 年龄等因素配成39对 每个对子的两只大鼠经随机分配 分别接受甲剂量和乙剂量注射 试验结果见下表 分析该新药两种不同剂量的毒性有无差异 配对 paireddata 资料的x2检验 2020 1 27 39 上述配对设计实验中 就每个对子而言 两种处理的结果不外乎有四种可能 两种剂量方法皆为阳性数 a 两种剂量方法皆为阴性数 d 甲剂量注射法为阳性 乙剂量注射法法为阴性数 b 乙剂量注射法为阳性 甲剂量注射法为阴性数 c 2020 1 27 40 其中 a d为两法结果一致的两种情况 b c为两法结果不一致的两种情况 检验统计量为 b c b c 40 2020 1 27 41 注意 本法一般用于样本含量不太大的资料 因为它仅考虑了两法结果不一致的两种情况 b c 而未考虑样本含量n和两法结果一致的两种情况 a d 所以 当n很大且a与d的数值很大 即两法的一致率较高 b与c的数值相对较小时 即便是检验结果有统计学意义 其实际意义往往也不大 2020 1 27 42 检验步骤 2020 1 27 43 可编辑 SPSS操作过程 建立数据文件 例4 sav数据格式 包括4行3列的频数格式 三个变量分别为行变量 列变量和频数变量 说明频数变量 数据加权个案DataWeightCases x2检验 从菜单选择分析描述统计交叉表AnalyzeDescriptiveStatisticsCrosstabs统计量Statistics McNemar Kappa 2020 1 27 44 选中进行配对卡方检验 2020 1 27 45 2020 1 27 46 Pc 2020 1 27 47 48 例4的问题改为 试评价两种剂量对老鼠致死率的一致性 评价两种方法对同一样本的一致性 2020 1 27 在Pearson卡方检验中 对行变量和列变量的相关性作检验 其中行变量和列变量是一个事物的两个不同属性 在实际中 还有一种列联表 其行变量和列变量反映的是一个事物的同一属性的相同水平 只是对该属性各水平的区分方法不同 Kappa一致性检验目的 检验两种方法对同一个样本 研究对象 的检验结果是否一致 一致性检验 2020 1 27 49 一般认为 当Kappa 0 75时 表明两者一致性较好 0 75 Kappa 0 4时 表明一致性一般 Kappa 0 4时 表明两者一致性较差 一致性检验 2020 1 27 50 Kappa系数 0 1980 05 说明两种方法的吻合度没有统计学意义 且吻合度较差 Pc 两种结论一致 2020 1 27 51 52 例5用A B两种方法检查已确诊的乳腺癌患者140名 A法检出91名 65 B法检出77名 55 A B两法一致的检出56名 40 问哪种方法阳性检出率更高 练习题 课后自行练习 2020 1 27 注意 计数资料的配对设计常用于两种检验方法 培养方法 诊断方法的比较特点 对样本中各观察单位分别用两种方法处理 然后观察两种处理方法的某两分类变量的技术结果 2020 1 27 53 第三节行 列表资料的检验testofR Ctable 2020 1 27 54 比较某市重污染区 一般市区和农村三个地区的出生婴儿的致畸率 以母乳 牛乳 混合三种不同方式喂养的新生儿体重增长的构成是否一致 推断2个分类变量是否有关联 如 研究冠心病与眼底动脉硬化的关系 2020 1 27 55 2020 1 27 56 行 列表资料 多个样本率比较时 有R行2列 称R 2表 两样本的构成比比较时 有2行C列 称2 C表 多个样本的构成比比较 以及双向无序分类资料关联性检验时 有行列 称R C表 2020 1 27 57 检验统计量 2020 1 27 58 3 1多个样本率的比较 例6用A B C三种不同方法分别处理新生儿脐带 发生感染的情况见下表 试比较3种不同方法的脐带感染率有无差异 三种脐带处理方法的脐带感染情况 2020 1 27 59 2020 1 27 60 SPSS操作过程 行 列表卡方检验 建立数据文件 例6 sav数据格式 包括6行3列的频数格式 3个变量分别为行变量 列变量和频数变量 说明频数变量 数据加权个案DataWeightCases x2检验 从菜单选择分析描述统计交叉表AnalyzeDescriptiveStatisticsCrosstabs结合例6数据 例6 sav 演示操作及界面 2020 1 27 61 结论 按 0 05检验水准拒绝H0 接受H1 可以认为三种处理脐带感染率有差别 2020 1 27 62 3 2两组构成比的比较 例7为研究某种新药对尿路疼痛的止痛效果 将有尿路疼痛的患者144例随机分为两组 每组72例 一组服该新药 治疗组 另一组服安慰剂 对照组 两组患者尿路疼痛的原因见下表 问两组患者尿路疼痛原因的分布有无差异 两组患者尿路疼痛原因的分布 2020 1 27 63 2020 1 27 64 结论 按 0 05检验水准不拒绝H0 尚不可认为两组患者尿路疼痛原因的分布有差异 2020 1 27 65 3 4多组构成比的比较 例8在某项疼痛测量研究中 给160例手术后疼痛的患者提供四种疼痛测量量表 即直观模拟量表 VAS 数字评估量表 NRS 词语描述量表 VDS 面部表情疼痛量表 FPS 患者首选的量表以及患者的文化程度见下表 问患者首选疼痛量表与文化程度是否有关 不同文化程度患者首选疼痛量表的类型 2020 1 27 66 2020 1 27 67 结论 按 0 05检验水准不拒绝H0 尚不能认为术后疼痛患者首选测痛量表类型与文化程度有关 2020 1 27 68 可编辑 3 5双向无序分类资料的关联性检验 表中两个分类变量皆为无序分类变量的行列表资料 又称为双向无序表资料 注意 双向无序分类资料为两个或多个样本 做差别检验 例7 若为单样本 做关联性检验 例9 例9测得某地5801人的ABO血型和MN血型结果如下表 问两种血型系统之间是否有关联 单样本 做关联性检验 2020 1 27 70 上表资料 可用行 列表资料检验来推断两个分类变量之间有无关系 或关联 若有关系 可计算Pearson列联系数C进一步分析关系的密切程度 列联系数C取值范围在0 0 7071之间 0表示完全独立 0 7071表示完全相关 2020 1 27 71 检验步骤 2020 1 27 72 由于列联系数C 0 1883 数值较小 故认为两种血型系统间虽然有关联性 但关系不太密切 2020 1 27 73 SPSS操作过程 建立数据文件 例9 sav数据格式 包括12行3列的频数格式 三个变量分别为行变量 列变量和频数变量 说明频数变量 数据加权个案DataWeightCases x2检验 从菜单选择分析描述统计交叉表AnalyzeDescriptiveStatisticsCrosstabs统计量Statistics Chi square名义 相依系数Contingencycoefficient 2020 1 27 74 SPSS输出结果 2020 1 27 75 结论 按 0 05检验水准拒绝H0 接受H1 可认为两种血型系统间有关联 但由于列联系数C 0 1883 数值较小 故认为两种血型系统间虽然有关联性 但关系不太密切 2020 1 27 76 1 行列表中的各格T 1 并且1 T 5的格子数不宜超过1 5格子总数 否则可能产生偏性 处理方法有三种 增大样本含量以达到增大理论频数的目的 首选 根据专业知识 删去理论频数太小的行或列 或将理论频数太小的行或列与性质相近的邻行或邻列合并 这样做会损失信息及损害样本的随机性 例如 不同年龄组可以合并 但不同血型就不能合并 改用双向无序R C表的Fisher确切概率法 R C表检验的注意事项 2020 1 27 77 78 79 练习题例10 某实验室为研究乙肝免疫球蛋白预防小白鼠胎儿宫内感染HBV的效果 将33例HBsAg阳性小白鼠 孕鼠 随机分为预防注射组和非预防组 结果见下表 问两组新生小白鼠的HBV总体感染率有无差别 第四节分层资料的卡方检验TestsofConditionalIndependence 2020 1 27 81 例11 Doll和Hill以709例肺癌患者做病例 709个非肿瘤患者做对照 按性别分层 研究吸烟与肺癌的关系 调查结果如下 试做肺癌的病例对照分析 2020 1 27 82 Weightcases 2020 1 27 83 2020 1 27 84 2020 1 27 85 2020 1 27 86 2020 1 27 87 2020 1 27 88 关于OR值与RR值 相对危险度RR 是一个概率的比值 指试验组人群反应阳性概率与对照组人群反应阳性概率的比值 数值为1 表明试验因素与反应阳性无关联 小于1时 表明试验因素导致反应阳性的发生率降低 大于1时 表明试验因素导致反应阳性的发生率增加 优势比OR 是一个比值的比 是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比 暴露者的疾病危险度为非暴露者的多少倍 OR 1说明疾病的危险度因暴露而增加 暴露与疾病为 正 关联 OR 1说明疾病的危险度因暴露而减少 负 关联 当关注的事件发生概率比较小时 0 1 优势比可作为相对危险度的近似 2020 1 27 89 2020 1 27 90 2020 1 27 91 2020 1 27 92 第五节多个样本率间的多重比较Multiplecomparisonofsamplerates 2020 1 27 93 一 基本思想 卡方分割法 因分析目的不同 k个样本率两两比较的次数不同 故重新规定的检验水准的估计方法亦不同 通常有两种情况 2020 1 27 94 2020 1 27 95 2020 1 27 96 2020 1 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论