已阅读5页,还剩113页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
检验Chi-SquareTest,第七章,李胜联 流行病与卫生统计学教研室 公共卫生学院,Content,test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of RC table Multiple comparison of sample rates test of goodness of fit,目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量: 应用:计数资料,第一节 四格表资料的 检验,目的:推断两个总体率(构成比)是 否有差别 (和u检验等价) 要求:两样本的两分类个体数排列成四 格表资料,(1) 分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线 (图7-1)。 (2) 分布的一个基本性质是可加性: 如果两个独立的随机变量X1和X2分别服从自由度1和2的分布,即 ,那么它们的和( X1+X2 )服从自由度( 1+2 )的 分布,即 。,一、 检验的基本思想 1 分布,2 检验的基本思想,例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?,表7-1 两组降低颅内压有效率的比较,本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。,图7-2 四格表资料的基本形式,基本思想:可通过 检验的基本公式来理解。,式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。,理论频数由下式求得:,式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,理论频数 是根据检验假设 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。那么理论上,试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为96(26/200)=12.48。,检验统计量 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:1=2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。如果 值很大,即相对应的P 值很小,若 ,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12 。,由公式(7-1)还可以看出: 值的大小还取决于 个数的多少(严格地说是自由度的大小)。由于各 皆是正值,故自由度愈大, 值也会愈大;所以只有考虑了自由度的影响, 值才能正确地反映实际频数A和理论频数T 的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。,(1) 建立检验假设,确定检验水平。 H0:1=2 即试验组与对照组降低颅内压的总体有效率相等 H1:12 即试验组与对照组降低颅内压的总体有效率不相等 =0.05。,3. 假设检验步骤,(2)求检验统计量值,二、四格表资料检验的专用公式,分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量 的抽样分布亦呈离散性质。为改善 统计量 分布的连续性,则需行连续性校正。,三、四格表资料检验的校正公式,四格表资料 检验公式选择条件:,,专用公式; ,校正公式; ,直接计算概率。,连续性校正仅用于 的四格表资料,当 时,一般不作校正。,例7-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?,表7-2 两种药物治疗脑血管疾病有效率的比较,本例 ,故用四格表资料 检验的校正公式,,查 界值表得 。按 检验水准不拒绝 ,尚不能认为两种药物治疗脑血管疾病的有效率不等。,本资料若不校正时, 结论与之相反。,第二节,配对四格表资料的 检验,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,例7-3 某实验室分别用乳胶凝集法(甲)和免疫荧光法(乙)对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?,105,32,甲+,甲+,甲-,甲-,乙+,乙-,乙+,乙-,第1份 第2份 第3份 第4份.,甲+,甲+,甲-,甲-,乙-,乙-,乙+,乙+,第25份 第26份 第27份 第28份.,.,105,33,表7-3 两种方法的检测结果,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为 阴性数(b); 乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。,其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,检验统计量为,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,检验步骤:,第三节,四格表资料的Fisher确切概率法,条件: 理论依据:超几何分布 (非 检验 的范畴),例7-4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?,表7-4 两组新生儿HBV感染率的比较,一、基本思想,在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率 ;再按检验假设用单侧或双侧的累计概率 ,依据所取的检验水准 做出推断。,1各组合概率Pi的计算 在四格表周边合计数不变的条件下,表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:,各组合的概率Pi服从超几何分布,其和为1。,计算公式为,!为阶乘符号,2累计概率的计算 ( 单、双侧检验不同),二、检验步骤( ),表7-5 例7-4的 Fisher确切概率法计算表,例7-5 某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?,表7-6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较,本例 a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。,表7-7 例7-5的Fisher确切概率法计算表,*为现有样本,(1)计算现有样本的D*和P*及各组合下四格表的Di。 本例D*=50,P*=0.02708978。 (2)计算满足Di50条件的各组合下四格表的概率Pi。 (3)计算同时满足Di50和PiP*条件的四格表的累 计概率。本例为P7和P8, (4)计算双侧累计概率P。 P0.05,按=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。,注意:,105,56,105,57,第四节,行列表资料的 检验,行列表资料, 多个样本率比较时,有R行2列,称为R2表; 两个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R C表。,检验统计量,用列联表进行分类资料的检验称为列联表分析,列联表分析的方法必须根据RC表的双向无序,单向无序,双向有序且属性不同,双向有序且属性相同四种类型,选择相应的检验方法。,双向无序RC表,两个分类变量分类标志无数量大小与先后顺序之分,检验目的是考察两个变量是否独立。 在总频数和各格的理论频数都较大时,选用Pearson卡方检验; 四格表在理论频数小于5时用校正卡方检验,总频数40或理论频数1时,用Fisher精确检验。,单向无序RC表:两个分类变量一个无序,另一个有序。 卡方检验与有序性之间没有联系,不宜用卡方检验,用与有序性有联系的Ridit分析或秩和检验。,双向有序且属性不同的RC 表,两个分类变量均有序但属性不同,不宜用卡方检验,应选用与有序性有联系的对应分析或线性趋势检验。,双向有序且属性相同的RC表,两个分类变量均有序且属性相同,不宜用卡方检验,应选用与有序性有联系的一致性检验,称为Kappa检验。,一、多个样本率的比较,例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别? 表7-8 三种疗法有效率的比较,检验步骤:,二、样本构成比的比较,例7-7 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?,检验步骤,三、双向无序分类资料的关联性检验,表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料。,注意: 双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。,例 7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?,表7-10 某地5801人的血型,(单样本,做关联性检验),表7-10资料,可用行列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:,列联系数C取值范围在01之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。,检验步骤,由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,四、行列表资料 检验的 注意事项,1行列表中的各格T 1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:,增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。,根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。 注意:不同年龄组可以合并,但不同血型就不能合并。 改用双向无序RC 表的Fisher确切概率法(可用软件实现)。,3医学期刊中常见这样的情况:不管RC表资料中的两个分类变量是有序还是无序,均用2检验分析。这种做法是不妥的。,对于有序的RC表资料不宜用2检验,因为行列表资料的2检验与分类变量的顺序无关,当有序变量的RC表资料中的分类顺序固定不变时,无论将任何两行(或两列)频数互换,所得值皆不变,其结论相同,这显然是不妥的。 对于有序的分类变量,采用卡方检验方法不能考虑数据的有序性质。 为此,对于单向有序可采用秩和检验、Ridit分析;双向有序可采用趋势检验等。,多个样本率间的多重比较,第五节,当多个样本率比较的R2表资料X2检验,推断结论为拒绝H0,接受时H1,要进一步推断哪两两总体率有差别,若直接用四格表资料的2检验进行多重比较,将会加大犯类错误的概率。因此,样本率间的多重比较不能直接用四格表资料的2检验。 多个样本率间的多重比较的方法有分割法、Scheffe可信区间法和SNK法。,分割法,一、基本思想,因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:,二、 多个实验组间的两两比较,例7-9 对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?,检验步骤,本例为3个实验组间的两两比较,表7-12 三种疗法有效率的两两比较,三、各实验组与同一个对照组的比较,例 7-10 以表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?,本例为各实验组与同一对照组的比较,有序分组资料的线性趋势检验,第六节,年龄与冠状动脉硬化的关系,经验表明用甲药治疗慢性气管炎有一定疗效,再用乙药治疗同样病人114例,结果如下表,问乙药的疗效是否优于甲药?,建议参照组的累计方向,由“差优”,如本例由“无效控制”,则“控制”等级的R最大。 参照组的平均R值恒等于0.5,第1组平均R值的95%可信区间不包括0.5,则认为第1组与对照组相比,差别有统计意义(P0.5,可认为乙药优于甲药;反之,若可信区间包括0.5,则认为差别无统计意义(P0.05)。,某医院用A、B两种配方治疗慢性阑尾炎,结果如下表,试比较两配方的疗效有无差别?,本例只关心A、B两配方疗效有无差别,可取u检验,双侧概率P=0.11610.05,认为差别无统计意义。,论文,第七节,频
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年吉林公务员考试题库及答案
- 考点解析人教版八年级上册物理光现象《光的反射》专题练习试卷(含答案详解版)
- 难点详解人教版八年级物理上册第5章透镜及其应用专项测评练习题(含答案详解)
- 难点解析-人教版八年级物理上册第5章透镜及其应用-生活中的透镜专项测试试题(详解版)
- 立春营销策略解析
- 难点解析人教版八年级物理上册第5章透镜及其应用-透镜章节测试试卷(含答案详解版)
- 达标测试人教版八年级物理上册第4章光现象-光的色散专项训练试题(解析卷)
- 考点攻克人教版八年级物理上册第5章透镜及其应用-生活中的透镜达标测试试题(详解版)
- 综合解析人教版八年级物理《压强》必考点解析试卷(含答案详解版)
- 2025年高二下学期生物心理与健康题
- 2025成人高等学校招生全国统一考试专升本《英语》试题及答案解析
- 《休闲活动策划与管理》课件-拓展训练策划
- 新型电力系统简介演示
- 管道设备安装培训课件模板
- 应急救援课件8
- 羽毛球英语版介绍PPT
- 2023年DCA考试试题题库
- 华为BEM战略解码体系完整版
- 深圳港危险品海运出口流程
- 《以奋斗者为本》摘要
- GB/T 7714-2015信息与文献参考文献著录规则
评论
0/150
提交评论