X检验_第1页
X检验_第2页
X检验_第3页
X检验_第4页
X检验_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第四章 两个率或多个率的比较 (chi-square test),樊秦,分类数据组间比较的假设检验计数资料组间的比较,2,第四章 两个率或多个率的比较(计数资料组间的比较),第一节 四格表资料的2检验 连续性校正2检验 Fisher确切概率检验第二节 配对四格表资料的2检验第三节 行列表资料的2检验,3,概念回顾,资料的类型 一、 1.计量资料:用仪器、工具等测量(measure) 方法获得的数据,即为计量资料measurment data。也叫定量数据Quantitative data 特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L) 2.检验:t检验分析,方差分析(正态分布,方差齐性)二、1.计数资料:按某种属性分类,然后清点每类的数据,称计数资料(count data)或enumeration data。也叫定性数据Qualitative data 特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工人、教师)、性别(男女) 2.检验:卡方 检验 三、等级资料 :秩和检验,4,第一节、四格表资料的 2 检验,1.2检验在分类资料中的应用:(1)推断两个(或多个)总体率或构成比是否相同;(2)检验配对计数资料的差异是否有显著性(3)检验两种因素或特征之间有无相关关系。,一、率,率(rate)又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。计算公式为:,式中:K为比例基数,常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)表示,原则上使计算结果至少保留12位整数。但在医学资料中某些指标的比例基数是固定的。,粗死亡率、出生率、人口自然增长率、婴儿死亡率、新生儿死亡率等人口学指标常用的比例基数是1000。 2.恶性肿瘤的死亡率、发病率、患病率通用比例基数是100000/10万。 3.生存率、病死率通用的比例基数是100%。,二、构成比,构成比(proportion)表示部分在全体中所占的比重,又称百分比。常用来表示疾病或死亡的顺位、位次或所占比重。由于构成比之和为100%,一部分变化会影响其它部分的也发生变化。,7,2.2检验的基本思想:是检验实际频数和理论频数的差别是否由抽样误差所引起的。,8,2分布,1875年 F. Helmet提出2统计量,设Xi为来自正态总体的连续性变量。,2分布是一个连续型变量的分布,分布的参数为自由度()。,9,3.84,7.81,12.59,P0.05的临界值,2 分布的概率密度函数曲线,10,1900年K.Pearson提出下述公式,在n40公式值与2分布近似,在理论数5,近似程度较好。,3.2检验的统计量基本公式为: 其中,式中符号含义:A:实际频数,表中实际发生的阳性或阴性频数T:理论频数,按某H0假设计算理论上的阳性或阴性频数,11,12,4.2值的含义:反映了实际频数与理论频数的吻合程度。 2值永远是正值。(即20) 5. 2检验判别准则: 若20.05,不拒绝无效假设H0; 若220.05() ,则P0.05,拒绝无效假设H0,接受H1 。,13,6. 2分布的参数:自由度。其计算公式为:=(行数-1)(列数-1) =(R-1)(C-1) 7. 2界值特点:在同一自由度下,2值越大,相应的概率P值越小;2值越小,相应的概率P值越大。,14,不同2分布的界值(附表 8 ) 239页,在=1,15,一、两个样本率比较的2检验(一)、两个独立样本率比较的2检验1.两个独立样本率资料的四格表2检验例6-1表6-1 两种疗法的心血管病病死率比较疗法 死亡 生存 合计 病死率/%盐酸苯乙双胍 26(21.3) 178(182.7) 204 12.75安慰剂 2(6.7) 62(57.3) 64 3.13 合计 28 240 268 10.45,16,1.建立检验假设并确定检验水准 H0: H1: =0.05 2. 计算检验统计量:,17,四格表资料2检验专用公式: (n40且所有的T5) (5-8),2=4.82,18,3. 查表及统计推断自由度=(2-1)(2-1)=120.05(1) = 3.84,220.05(1),所以,P0.05, 在=0.05的检验水准下,“拒绝”H0,接受H1,用盐酸苯乙双胍治疗引致的心血管病病死率高于安慰剂。,19,(二)四格表资料2检验的连续性校正: (n40 且某一个理论数1T5) 校正公式分别为: (5-9),20,两药物治疗脑血管病有效率比较,组别 有效数 无效数 合计 有效率%甲药 46 6 52 88.46乙药 18 8 (4.67) 26 69.23合计 64 14 78 82.05校正公式不校正2=4.35 p0.05,P0.05.,21,数据用SPSS统计软件计算结果,22,(三)四格表的Fisher确切概率法(条件:T1,或n40用),例:表4-1 两组新生儿HBV感染率的比较组别 阳性 阴性 合计 感染率%预防组 4 18 22 18.18非预防组 5(3) 6 11 45.45合计 9 24 33 27.27,23,1),2),24,SPSS统计软件计算结果,25,四格表2 检验公式应用原则* (两组不配对资料),当T 5,且n40,Pearson 2 检验1T5,同时n40, 连续校正2检验(3) 当T1,或n40,用Fisher确切概率法,两个样本率比较的2检验SPASS统计软件应用(四格表卡方检验 Pearson 2 检验),例 4-2 在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组单纯用亚硝胺向鼻腔滴注(鼻注组),另一组在鼻注基础上加肌注维生素B12,实验结果如下表4-2。问两组发癌率有无差别。表4-2 两组大白鼠发癌率的比较处理 发癌鼠数 未发癌鼠数 合计 发癌率 (1) (2)鼻注组(1) 52 19 71 73.24鼻注+维生素B12(2) 39 3 42 92.86合计 91 22 113 80.53,26,两个样本率比较的2检验SPASS统计软件应用(四格表卡方检验 连续校正2检验),例4-3 某矿粉长当生产一种矿石时,在数天内即有部分工人换职业性皮炎,在本生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服。生产进行一个月后,检验两组工人的皮夫炎患病率,资料如表4-3,问两组工人的皮肤炎患病率有无差别?表4-3 穿新旧防护服工人的皮肤炎患病率比较防护服 皮肤炎 合计 患病率(%)种类 阳性例数 阴性例数新 1 14 15 6.7旧 10 18 28 35.7合计 11 32 43 25.6,两个样本率比较的2检验SPASS统计软件应用(四格表卡方检验 Fisher确切概率检验),例4-4 在某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,资料如表4-4,问活动型与稳定型布氏病患者PHA反应阳性率有无差别?表4-4 两型慢性布氏病的PHA皮试反应病人类型 阳性数 阴性数 合计 阳性率(%)活动型 1 14 15 6.67稳定型 3 7 10 30.09合计 4 21 25 16.00,29,(二)两个相关样本率比较的2检验 (配对设计两个样本率的2检验) ( McNemer检验 ),用途特点:对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。 乙处理 + - 甲处理 +,公式,a bc d,-,McNemer检验,用途特点:对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。 乙处理 + - 甲处理 +,配对设计资料的SPSS软件统计,例4-6 某研究室用甲乙两种血清学方法检查401例确诊的鼻咽癌患者,得结果如表4-6,问两种检验结果之间有无关系?有无差别?表4-6 两种血清学检验结果 乙法甲法 合计 261 110 371 8 31 39合计 269 141 410,31,第二节 行列表的2检验,当比较组行或列分类数2,称为行列表。1.多组(独立样本)样本率差别有无统计意义?2.多组(独立样本)的构成比(分布)有无统计意义?,32,行列表的2检验公式,自由度=(行数-1)(列数-1),33,表4-7 三组疗法有效率的比较,疗法 有效 无效 合计 有效率%物理组 199(186.2) 7 206 96.6药物组 164 18 182 90.1外用组 118 26 144 81.9 合计 481 51 532 90.4,一、多个样本率的比较,H0:1= 2 = 3 =90.4(三组总体有效率相等)H1:三组总体率不等或不全等,34,表4-7 三组疗法有效率的计算,A为表中的实际频数,自由度=(行数-1)(列数-1)=(3-1)(2-1)=2,35,表4-7资料SPSS软件计算结果,结论:在=0.01水准,拒绝H0,P0.01,认为三组疗法有效率不等或不全等.注意:此结果不能得到各两两组比较的结论.,36,三、RC表数据的注意事项*,1. 多个样本率比较的2检验,当拒绝H0时,不能得出任何两组间都有差别。2. 理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:最好增加样本含量以增大理论频数;根本的方法。删去理论频数太小的行和列;此法不好。将理论频数较小的行或列与邻行或邻列合并以增大理论频数。但后两法可能会损失信息。,例题:行列表的2检验 SPSS软件统计(多个率比较),例4-8 某省观察三个地区的花生污染黄曲霉素B1的情况,见表4-9 ,问三个地区花生的黄曲黄曲霉素B1污染率有无差别?表4-8 某省三个地区花生的黄曲霉素B1污染率的比较 地区 检验的样品数 合计 污染率(%) 未污染 污染 甲 6 23 29 79.3 乙 30 14 44 31.8 丙 8 3 11 27.3 合计 44 40 84 47.6,38,39,多组构成比的比较SPSS软件统计,例 4-9 1979年某地爆发毛虫病,333例患者按年龄以14岁为界分为两组,资料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论