卡方检验_第1页
卡方检验_第2页
卡方检验_第3页
卡方检验_第4页
卡方检验_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医 学 统 计 学Medical Statistics,彭志行,Department of Epidemiology & Biostatistics School of Public Health Nanjing Medical University,Review:,正态分布和标准正态分布正态分布的应用抽样误差和标准误参数估计假设检验,假设检验与可信区间是从两个不同目的出发并有密切关联的分析方法。就同一资料而言,若假设检验结果为P,得出拒绝H0而接受H1的结论时,则其1-可信区间必定不包括H0所规定的总体参数,并估计总体参数在H1所界定的范围内;反之亦然。可见假设检验与可信区间的作用是相辅的,结论的涵义是一致的,基础都是抽样误差理论。,例 某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果如下,(1) 可信区间:已通过t分布法求得95%可信区间为26.4846.88(g/dl),显然不包括两组均数之差为0在内。(2) 假设检验:用t检验。设H0:1=2, H1:12,=0.05。P0.05,拒绝H0而接受H1,故两组均数之差有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量低于正常人。这个结论与可信区间所得相同。再作进一步分析。此处t检验是以1=2即1-2=0为原假设计算的,若取t=7.41为界值计算可信区间,其下限理应为(271.89-235.21)-7.414.95=0这一结果足以说明假设检验与可信区间的分析具有相同的量化判定,它们的结论仅是对同一问题所作的不同侧面的描述,其效果是等价的。,第六章、分类资料的统计分析Statistical Analysis for Categorical Data,主要内容,分类资料的特点相对数常用的相对数相对数应用的注意事项率的标准化率的假设检验样本率与总体率的比较两样本率的比较u检验卡方检验多个率的比较构成比的比较配对设计两样本的比较正确应用,分类资料的特点,分类资料的特点离散性,变量仅取有限的几个值;资料不含有次序的信息;举例血型(A、B、O、AB)人群中某病发生与否(发生、不发生),常用的相对数:率,率(Rate),又称频率指标,说明某现象发生的频率和强度。(强度相对数),常用的相对数:比,比(Ratio),又称相对比,是A,B两个有关指标之比,说明A为B的若干倍或百分之几。两个指标可以性质相同,也可以不同。,常用的相对数:构成比,构成比(Proportion),又称构成指标,说明一种事物内部各组成部分所占的比重或分布。,相对数的例子 I,某病发病率某病患病率,相对数的例子 II,性别比 男性数/女性数 *100%出生 10020岁 9850岁 9860岁 9570岁 8580岁 68,相对数的例子 III,体质指数(BMI) 体重/身高2(kg/m2)低体重 18.0正常 18.0超重 24.0肥胖 28.0,相对数的例子 IV,血型 O型 205 40.03% A型 112 22.09% B型 150 29.59% AB型 40 7.89% 507 100.00%,相对数的例子 V,相对数的例子 VI,表某医院门诊病人医疗费报销情况,应用相对数的注意事项,分母不能太小;区分率和构成比;合并率的计算不是直接求率的均数;两个合并率的计算需要注意两者的内部构成比。,某市某年各区急性传染病发生数及其相对数,总体率的区间估计,应用条件:n足够大,p和1p均不接近于0,率的标准误,总体率的区间估计,正态近似法:查表法,例19 检测某地200人,乙肝表面抗原阳性7人,估计该地乙肝表面抗原阳性率。,检 验,Chi-square test,问题的提出, Karl Pearson (18571936) 英国统计学家 1901年10月与Weldon、Galton一起创办Biometrika,理论分布和实际分布间总存在差异,1900年,Karl Pearson提出 检验,随机误差?,本质性差异?,Why,四格表(fourfold table),例20 两组人群尿棕色素阳性率的比较,理论数的计算,如果两组率相等,则理论上阳性率为52.05%。理论与实际相吻合!则观察36人,有18.74人阳性,17.26阴性。观察37人,有19.26人阳性,17.74阴性。,实际数 理论数,衡量理论数与实际数的差别,自由度为1 的2分布,0.0,0.1,0.2,0.3,0.4,0.5,自由度为2 的2分布,2分布,0.0,0.1,0.2,0.3,0.4,0.5,2检验的步骤,(1) H0: 1 = 2; H1: 12 , =0.05(2) 2=23.12(3) P0.05(4)按0.05水准,不拒绝H0,尚不能认为两种方法的治疗效果不同。,四格表2的检验的应用条件:, n40,T5,用2; n40,但1T5,用校正2。 n 40,或T1,用确切概率。当P值接近检验水准时,推荐使用确切概率法。,小结,两个样本率之间的差别等价于实际数与理论数之间的差别;对实际数与理论数差值的假设检验等价于对两样本率差值的假设检验;比较两个样本率所代表的总体率是否有差别,实质是考察现有的样本频数分布是否与假设下的理论频数分布间差异到底是否包含了本质上的差异。 2 统计量代表了实际数与理论数吻合的程度。,2、多个率比较的2检验,贫血捡出率的比较,如果各年度检出率相等(H0成立),那么每年的检出率应当均为11.45%。由此可以计算出每格的理论频数。根据实际频数与理论频数之差所得出的卡方值越大,说明假设的总体中得到现有偏差及更偏差的样本的概率越小。!It means the probability of obtain the current deviation and more extreme deviation is less.P,拒绝H0。,多个率比较的2检验的过程,H0:12 34H1:四个年度学生检出率不等或者不全相等 0.05=313 , P0.05; 按照0.05的检验水准,拒绝H0,接受H1,差别有统计学意义,可认为四个年份中小学女生贫血检出率不同,多个率比较的2检验,某省三个地区花生的黄曲酶毒素B1污染率比较,理论数的计算,实际数A 理论数T,2值的计算,实际数A 理论数T,2值的计算,3个率比较的2检验步骤,H0: 1= 2 = 3H1: 1, 2 , 3不等或不全相等0.05。计算统计量: 217.91, v = 2。P=0.0000按0.05水准,拒绝H0 ,接受H1 。认为三个地区花生中黄曲酶毒素B1污染率不等或不全相等。,3、构成比的比较,甲乙两城市空气质量比较,2值的计算,2值的计算,3个构成比比较的2检验步骤,H0: 两城市的空气状况构成比相同;H1:两城市的空气状况构成比不同。0.05。计算统计量: 213.84 , v = 4 。P0.01按0.05水准,拒绝H0 ,接受H1 。认为两城市的空气状况构成比不同。,RC表的分析方法选择条件,理论数不能小于1;理论数大于1小于5的格子数不超过总格子数的1/5。否则用确切概率;,4、 配对四格表资料的2检验,两种血清学检验结果比较,配对四格表资料的2检验,两种检验结果比较,配对四格表资料的实际数与理论数,b+c40时:,配对四格表资料的2检验步骤,H0: 两法检出阳性率相同,总体BC;H1: 两法检出阳性率不同,总体BC。0.05。计算统计量: C24.92。P0.05按0.05水准,拒绝H0 。认为两种方法的阳性率不同。,阳性率相同,而非检验结果完全一致!,5、定性资料假设检验的正确应用,四格表的卡方检验 n40,T5,用2;n40,但1T5,用校正2。n 40,或T1,用确切概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论