卡方检验解释ppt课件

上传人：闯*** IP属地：广东上传时间：2020-04-21 格式：PPT 页数：81 大小：2.72MB 积分：25 举报 版权申诉

已阅读5页，还剩76页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

许林勇博士医学统计学卡方检验 E MAIL xybms 主讲内容第一概述基本思想第二2 2表卡方检验第三配对四格表卡方检验第四R C表卡方检验第五Fisher确切概率检验第六多个样本率的多重比较第七有序分组资料的线性趋势检验卡方检验概述p136 研究目的率or构成比的假设检验大样本率或小样本率资料类型计数资料基本思想检验中的是希腊字母称为卡方检验是一种用途较广的计数资料的假设检验方法属于非参数检验的范畴主要是比较两个及两个以上样本率构成比以及两个分类变量的关联性分析其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题检验的应用检验两个样本率之间差别的显著性检验多个样本率或构成比之间差别的显著性检验两个双向无序分类变量是否存在关联配对计数资料的比较一两独立样本率检验一两独立样本率资料的四格表形式例7 1为研究肿瘤标志物癌胚抗原 CEA 对肺癌的诊断价值随机抽取72例确诊为肺癌的患者为肺癌组 114例接受健康体检的非肺癌患者为对照组用CEA对其进行检测结果呈阳性反应者病例组中33例对照组中10例问两组人群的CEA阳性率有无差异表7 1CEA对两组人群的诊断结果括号内为理论频数本例资料经整理成表7 1形式即有两个处理组每个处理组的例数由发生数和未发生数两部分组成表内有33 39 10 104四个基本数据其余数据均由此四个数据推算出来的故称四格表资料二检验的基本思想表7 2四格表资料的基本形式基本思想可通过检验的基本公式来理解式中 A为实际频数 actualfrequency T为理论频数 theoreticalfrequency 理论频数是根据检验设且用合并率来估计而定的理论频数由下式求得式中 TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计检验统计量值反映了实际频数与理论频数的吻合程度若检验假设H0 1 2成立四个格子的实际频数A与理论频数T相差不应该很大即统计量不应该很大如果值很大即相对应的P值很小若则反过来推断A与T相差太大超出了抽样误差允许的范围从而怀疑H0的正确性继而拒绝H0 接受其对立假设H1 即 1 2 由公式 7 1 还可以看出值的大小还取决于个数的多少严格地说是自由度的大小由于各皆是正值故自由度愈大值也会愈大所以只有考虑了自由度的影响值才能正确地反映实际频数A和理论频数T的吻合程度检验的自由度取决于可以自由取值的格子数目而不是样本含量n 四格表资料只有两行两列 1 即在周边合计数固定的情况下 4个基本数据当中只有一个可以自由取值 1 建立检验假设确定检验水平 H0 1 2H1 1 2 0 05 三假设检验 2 求检验统计量值四格表资料检验的专用公式四四格表资料检验的校正公式分布是一连续型分布而四格表资料属离散型分布由此计算得的统计量的抽样分布亦呈离散性质为改善统计量分布的连续性则进行连续性校正四格表资料检验公式选择条件不校正的理论或专用公式校正公式直接计算概率 Fisher 连续性校正仅用于的四格表资料当时一般不作校正例7 2将116例癫痫患者随机分为两组一组70例接受常规加高压氧治疗高压氧组另一组46例接受常规治疗常规组治疗结果见表7 3 问两种疗法的有效率有无差别表7 3两种疗法治疗癫痫的效果本例故用四格表资料检验的校正公式查界值表得按检验水准不拒绝尚不能认为组有效率不等本资料若不校正时结论与之相反四卡方检验的连续性校正问题赞成依据是这样做可使卡方统计量抽样分布的连续性和平滑性得到改善可以降低I类错误的概率连续性校正后的卡方检验其结果更接近于Fisher确切概率法不过校正也不是无条件的它只适合于自由度为1时样本含量较小如n 40 或至少有一个格子的理论频数太小如T 5的情形四卡方检验的连续性校正问题反对依据是经连续性校正后 P值有过分保守之嫌此外 Fisher确切概率法建立在四格表双边固定的假定下而实际资料则是单边固定的四格表连续性校正卡方检验的P值与Fisher确切概率法的P值没有可比性就应用而言无论是否经过连续性校正若两种检验的结果一致无须在此问题上纠缠但是当两种检验结果相互矛盾时如例7 2 就需要谨慎解释结果了为客观起见建议将两种结论同时报告出来以便他人判断当然如果两种结论一致如均为或则只报道非连续性检验的结果即可第二节两相关样本率检验 McNemar检验配对四格表资料的检验与计量资料推断两总体均数是否有差别有成组设计和配对设计一样计数资料推断两个总体率构成比是否有差别也有成组设计和配对设计即四格表资料和配对四格表资料例7 3某抗癌新药的毒理研究中将78只大鼠按性别窝别体重年龄等因素配成39对每个对子的两只大鼠经随机分配分别接受甲剂量和乙剂量注射试验结果见表7 4 试分析该新药两种不同剂量的毒性有无差异表7 4某抗癌新药两种剂量的毒理实验结果上述配对设计实验中就每个对子而言两种处理的结果不外乎有四种可能两只大鼠均死亡甲乙数 a 两只均生存甲乙数 d 其中一只死亡甲乙数 b 其中一只死亡甲乙数 c 其中 a d为两法观察结果一致的两种情况 b c为两法观察结果不一致的两种情况检验统计量为注意本法一般用于样本含量不太大的资料因为它仅考虑了两法结果不一致的两种情况 b c 而未考虑样本含量n和两法结果一致的两种情况 a d 所以当n很大且a与d的数值很大即两法的一致率较高 b与c的数值相对较小时即便是检验结果有统计学意义其实际意义往往也不大第三节 R C表检验行列表资料多个样本率比较时有R行2列称为R 2表两个样本的构成比比较时有2行C列称2 C表多个样本的构成比比较以及双向无序分类资料关联性检验时有行列称为R C表检验统计量一多个样本率的比较例7 4用A B C三种不同方法分别处理新生儿脐带发生感染的情况见表7 6 试比较3种不同方法的脐带感染率有无差异表9 6三种脐带处理方法的脐带感染情况二两组构成比的比较例7 5为研究某种新药对尿路疼痛的止痛效果将有尿路疼痛的患者144例随机分为两组每组72例一组服该新药治疗组另一组服安慰剂对照组两组患者尿路疼痛的原因见表7 7 问两组患者尿路疼痛原因的分布有无差异表7 7两组患者尿路疼痛原因的分布三多组构成比的比较例7 6在某项疼痛测量研究中给160例手术后疼痛的患者提供四种疼痛测量量表即直观模拟量表 VAS 数字评估量表 NRS 词语描述量表 VDS 面部表情疼痛量表 FPS 患者首选的量表以及患者的文化程度见表7 8 问患者首选疼痛量表与文化程度是否有关表7 8不同文化程度患者首选疼痛量表的类型四 R C表检验的条件 1 行列表中的各格T 1 并且1 T 5的格子数不宜超过1 5格子总数否则可能产生偏性处理方法有三种增大样本含量以达到增大理论频数的目的属首选方法只是有些研究无法增大样本含量如同一批号试剂已用完等根据专业知识删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并这样做会损失信息及损害样本的随机性注意不同年龄组可以合并但不同血型就不能合并改用双向无序R C表的Fisher确切概率法可用SAS软件实现第四节 Fisher确切概率检验确切概率检验是由Fisher1934年提出的一种用于两个独立样本率比较的方法故又称Fisher确切概率法有人认为当样本量n和理论频数T太小时如n 40而且T 5 或T 1 或n 20 应该用确切概率检验这一观点所基于的理论是当样本量太小时二项分布的正态逼近性较差因而不宜用基于正态分布的检验提出上述条件的另外一种考虑是确切概率法的计算量偏大但随着计算工具的大大改进确切概率法的应用不一定限于上述条件例7 4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果将33例HBsAg阳性孕妇随机分为预防注射组和非预防组结果见表7 4 问两组新生儿的HBV总体感染率有无差别基本思想在四格表周边合计数固定不变的条件下计算表内4个实际频数变动时的各种组合之概率再按检验假设用单侧或双侧的累计概率依据所取的检验水准做出推断 1 各组合概率的计算在四格表周边合计数不变的条件下表内4个实际频数变动的组合数共有周边合计中最小数 1 个如例7 4 表内4个实际频数变动的组合数共有个依次为 1 计算现有样本四格表的和及各组合下四格表的见表7 5 本例 2 计算满足条件的各组合下四格表的概率 3 计算同时满足和条件的四格表的累计概率本例满足条件累计概率为教材批p143 本例宜用四格表资料的Fisher确切概率法直接计算累计概率检验步骤为即两组新生儿HBV的总体感染率相等即两组新生儿HBV的总体感染率不等第五节多个样本率间的多重比较当多个样本率比较的表资料检验推断结论为拒绝接受时只能认为各总体率之间总的来说有差别但不能说明任两个总体率之间有差别要进一步推断哪两两总体间有差别若直接用四格表资料的检验进行多重比较将会加大犯类错误的概率 1 多个实验组间的两两比较 k为样本率的个数 2 实验组与同一个对照组的比较第六节双向无序分类资料的关联性检验例7 8测得某地5801人的ABO血型和MN血型结果如表问两种血型系统之间是否有关联步骤 1 建立检验假设2 计算检验统计量3 求出P值作结论注意若须进一步分析关系的密切程度时可计算Pearson列联系数第七节有序分组资料的线性趋势检验例7 11某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系将278例尸解资料整理成表7 13 问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势步骤 1 建立检验假设2 计算检验统计量3 求出P值作结论注意基本思想是首先计算表资料的值然后将总的值分解成线性回归分量与偏离线性回归分量若两分量均有统计学意义说明两个分类变量存在相关关系但关系不是简单的直线关系若线性回归分量有统计学意义偏离线性回归分量无统计学意义时说明两个分类变量不仅存在相关关系而且是线性关系 NonzeroCorrelation863 3895 0001 Chi Square171 4325 0001 dataex7 11 inputrcf cards 1170122213414221272224239243311632233313347419422043154414 procfreq weightf tablesr c cmh1 run 注意双向有序属性不同的表资料表资料中两个分类变量皆为有序的但属性不同如表7 13 对于该类资料若研究目的为分析不同年龄组患者疗效之间有无差别时可把它视为单向有序表资料选用秩转换的非参数检验若研究目的为分析两个有序分类变量间是否存在相关关系宜用等级相关分析或Pearson积矩相关分析见第九章若研究目的为分析两个有序分类变量间是否存在线性变化趋势宜用本节所介绍的有序分组资料的线性趋势检验 summary 1 研究目的率or构成比的假设检验大样本率或小样本率 2 资料类型计数资料3 基本思想根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题 4 应用条件检验两个样本率之间差别的显著性检验多个样本率或构成比之间差别的显著性检验两个双向无序分类变量是否存在关联配对计数资料的比较 5 理论频数和fisher确切概率法6 多个样本率的多重比较7 表资料的分类和相应检验目的可以分为双向无序单向有序双向有序属性相同和双向有序属性不同4类 A 对于双向无序资料若研究目的为多个样本率或构成比的比较可用行列表资料的检验若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时可用行列表资料的检验以及Pearson列联系数进行分析 B 单向有序表资料有两种形式一种是表资料中的分组变量如年龄是有序的而指标变量如传染病的类型是无序的其研究目的通常是分析不同年龄组各种传染病的构成情况此种单向有序表资料可用行列表资料的检验进行分析另一种情况是表资料中的分组变量如疗法为无序的而指标变量如疗效按等级分组是有序的其研究目的为比较不同疗法的疗效此种单向有序表资料宜用秩转换的非参数检验进行分析见第八章 C 双向有序属性相同的表资料表资料中的两个分类变量皆为有序且属性相同实际上是配对四格表资料的扩展即水平数3的配伍资料如用两种检测方法同时对同一批样品的测定结果其研究目的通常是分析两种检测方法的一致性此时宜用一致性检验或称Kappa检验见第二十八章也可用特殊模型分析方法可用SAS软件 D 双向有序属性不同的表资料资料中两个分类变量皆为有序的但属性不同如表7 13 对于该类资料若研究目的为分析不同年龄组患者疗效之间有无差别时可把它视为单向有序表资料选用秩转

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

卡方检验解释ppt课件

文档简介

温馨提示

最新文档

评论

卡方检验解释ppt课件

文档简介

温馨提示

最新文档

评论

相关文档