卫生统计学-潘海燕卫生统计学第10章卡方检验.ppt_第1页
卫生统计学-潘海燕卫生统计学第10章卡方检验.ppt_第2页
卫生统计学-潘海燕卫生统计学第10章卡方检验.ppt_第3页
卫生统计学-潘海燕卫生统计学第10章卡方检验.ppt_第4页
卫生统计学-潘海燕卫生统计学第10章卡方检验.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卡方检验,Chi-square test,第十章,统计与流行病学教研室,2 检验的基本思想,【例10-1】为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合研究标准的110例慢性支气管炎患者随机分为两组,西药组86例,中药组24例。服药一个疗程后,观察患者的疗效,问两种药有效率是否有差别?,分析思想:假设两疗法相同,则两疗法的平均显效率=53/110= 48.18,因此理论上西药组显效人数8648.18%=41.44,无效人数86-41.44=44.56;理论上中药组显效人数2448.18=11.56 ,无效人数24-11.56=12.44。 理论与实际存在差异,如该差异如果为抽样误差的许可范围,则两治疗组的生存率一致,否则,则两组的生存率不是来自同一总体,即两治疗组有效率不同。,41.44 44.56 11.56 12.44,实际频数与理论频数的差异可以表示为 值反映了实际频数与理论频数吻合的程度(差别的程度)。如果两组率没有差别(H0假设成立),则实际频数和理论频数的差别不会很大,出现大的 值的概率P是很小的。 如果 ,就怀疑H0假设而拒绝它 如果 ,则尚无理由拒绝,值服从自由度为的卡方分布,第一节 22表的卡方检验,基本数据的行数和列数均为2者,称为22表资料或四格表(fourfold table)资料;基本数据的行数或列数大于2者,称为RC列联表资料或行列表资料。,2 检验( Pearson 卡方检验)基本公式: 上式中A 为实际频数,T 为理论频数,TRC为第R 行C 列的理论频数,为相应的行合计,为相应的列合计,一、完全随机设计 检验,由计算公式,代入理论数,可以推导出四格表的专用计算公式,四格表资料 2 检验的计算公式 当 n40 且所有 T5 时: 基本公式为: 专用公式为: 当 n40 但有 1T5 时: 校正的基本公式为: 校正的基本公式为: 当n40或T1时,采用四格表确切概率法,H0:两种药显效率相同:1=2,H1:两种药显效率不同:12,双侧a=0.05,1、建立检验假设,确定检验水准,据题意可知,n=11040, T最小=5324/110=11.565,2、计算统计量 值,3、确定P值,作出统计推断,如果将表10-2中的四个基本数据分别用a、b、c、d表示,则可用专用公式(10-4)计算卡方值。,【知识点10-1】 1. 检验是一种以 分布为基础,以 值为检验统计量的计数资料的假设检验方法。 2. 值反映实际频数(A)和理论频数(T)的符合程度。 3. 检验主要用途: 推断两个或两个以上总体率(或构成比)之间有无差别 两变量间有无相关关系(有无关联) 检验频数分布的拟合优度,检验基本公式: 5. 22表 检验的专用公式: 6. 22表 检验的基本步骤 (1)建立检验假设,确定检验水准 H0:两总体率相等,即 H1:两总体率不等,即 (2)计算检验统计量值 计算理论频数: 计算 值:根据n值和T值采用相应的公式 (3)确定概率P 值,作出统计推断,用校正公式:,二、配对设计 检验,配对四格表资料 2 检验的计算公式 当 b+c40 时: 2计算公式为: 当 b+c40 : 校正 2计算公式为:,1. 建立检验假设,确定检验水准 H0 :两种方法检测的阳性率相同,即:B=C H1: 两种方法检测的阳性率不同,即:BC 检验水准 =0.05 2. 计算检验统计量值 3. 确定P值,作出统计推断 查附表9( 界值表)得 ,按=0.05水准,不拒绝H0 ,差异无统计学意义,尚不能认为两种方法的检测结果有差别。,配对四格表资料的2检验也称McNemar检验(McNemars test),第二节 行列(RC)表资料的 2 检验,行列(RC)表资料的2检验,RC表资料有以下几种类型:,双向无序RC表资料 单项有序RC表资料 双向有序且属性不同RC表资料 双向有序且属性相同RC表资料,双向无序RC表资料,适于 检验。,单项有序RC表资料, 检验与疗效的有序性之间无任何联系,应用秩和检验或Ridit分析。,双向有序且属性不同RC表资料, 等级相关或线性趋势检验,双向有序且属性相同RC表资,一致性检验,RC表的2检验通用公式,适用条件:无 T1 的理论数,并且 1T5 的 格子数不超过总格子数的1/5 注意事项: 差别具统计学意义(拒绝H0)时,只能认为 各总体率或构成比之间总的来说有差别,但 不能说明它们彼此之间都有差别,适用条件不满足时,可采用以下三种措施 增加样本含量:可以增大理论频数 将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并:合并后可以产生较大的理论频数,但要注意相邻类别合并的合理性,合并后要有实际意义,合并后自由度应作相应调整 删去理论频数太小的格子所对应的行或列。 第一种措施为首选,但实际工作中实施起来较难后两种措施会损失部分信息,应慎用,H0:1 2 3 ,即三种疗法治疗气阴两虚型老年型糖尿病的有效率相等 H1:三种疗法治疗气阴两虚型老年型糖尿病的有效率不等或不全相等,双侧a=0.05,查2界值表,得p0.005,按0.05水准,拒绝H0 ,接受H1 ,三种疗法治疗气阴两虚型老年型糖尿病的有效率不全相等。,3种中药治疗气阴两虚型老年型糖尿病有效率之间的两两比较结果见表10-7,表的 检验的两两比较 常用的方法:将多个样本率(或构成比)拆分为若干个22(或2C)表进行检验。为减小犯I类错误的概率,需要调整检验水准a。 计算方法: 式中,k为比较的样本组数。,或,两组构成比的比较,建立检验假设 H0:蒙族与汉族血型分布的构成相同 H1:蒙族与汉族血型分布的构成不同,单向有序分类资料的比较,对于单向有序的多分类资料, 表的 检验仅 比较各组的构成比是否相同,没有利用等级信息, 因此,在对等级资料进行统计比较时,常用秩和检验或Ridit分析。,第三节 拟合优度 检验,医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。 Pearson 值能反映实际频数和理论频数的吻合程度,故 检验可用于推断频数分布的拟合优度拟合优度(goodness of fit),拟合优度是根据样本的频率分布检验其总体分布是否等于某一给定的理论分布,例10-7 观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为279个取样单位,统计各取样单位历年累计病例数,资料见表10-10的第(1)、(2)栏,问此资料是否服从Poisson分布?,表10-10 Poisson分布的拟合与检验,*: X8的概率:,第四节 线性趋势 检验,若研究目的是分析不同眼底动脉硬化分级与冠心病诊断结果有无差别时,可将它视为单向有序表,选用秩和检验; 若研究目的是分析两个有序分类变量间是否存在相关关系,适合用等级相关分析或积差相关分析; 若研究目的是分析两个有序分类变量间是否存在线性变化趋势,就要用到下面所介绍的有序分组资料的线性趋势检验(test for linear trend)。,对双向有序属性不同的RC表资料,通过 分解推断其相关是否为线性相关。 基本思想是: 首先计算RC表的 值,然后将总的 值分解成线性回归分量与偏离线性回归分量 若两分量均有统计学意义,表明两分类变量存在相关关系,但关系不是简单的直线关系; 若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,表明两分类变量不仅存在相关关系,而且是线性关系。,计算过程 计算总 值: 计算线性回归分量 (先给有序分类变量赋值1,2,3),1,2,3,1,2,3,计算偏离线性回归分量 : 检验假设需注意 H0:眼底动脉硬化分级与冠心病诊断结果之间 无线性关系 H1:眼底动脉硬化分级与冠心病诊断结果之间 有线性关系,线性回归分量与偏离线性回归分量均有统计学意义,说明眼底动脉硬化分级与冠心病诊断结果之间存在相关关系,但关系不是简单的线性关系。,条件: 理论依据:超几何分布 (非 检验 的范畴),第五节 Fisher确切概率法,原理: 在四格表周边合计数不变的条件下,依次增减样本四格表中某一格的值可得各种组合的四格表,直接计算各种事件发生的概率。,计算公式为:,【例10-9】 某医师为观察中西药结合治疗慢性寻麻疹的疗效,将27例慢性寻麻疹患者随机分成两组,分别给予中西药结合治疗和西药治疗,结果见表10-13。,1. 建立检验假设,确定检验水准 H0:中西药结合和西药的有效率相等,即 H1:中西药结合和西药的有效率不等,即 2. 计算概率 计算样本 ,本例样本 85.7%46.2%39.5% 计算在四格表的周边合计不变的条件下,变动四个基本数据a、b、c、d,列出所有各种组合的四格表(所列出的四格表个数等于最小周边合计数加1个)的 及相应的概率P,一般选用行合计与列合计均为最小的那个格子,从0开始,依次增加1,直到该格子的观测频数等于最小周边合计数。 用下式直接计算表内四个数据的各种组合之概率,再计算等于及大于样本的 各四格表的累计概率,双侧检验取两侧累计概率,单侧检验只取一侧累计概率。,本例需计算双侧概率,因此计算满足 39.5%条件的所有四格表的累计概率,本例P = P1 + P2 + P3 + P9 + P10 = 0.046;若计算单侧概率P = P1 + P2 + P3 = 0.037(即只计算满足 39.5%的四格表的累计概率)。,3. 确定P值,作出统计推断 按 水准,拒绝H0,接受H1,差异有统计学意义,可认为中西药结合组与西药组的有效率不同,中西药结合组疗效较高。,掌握内容,(1)四格表资料的 2 检验 (2)配对四格表的 2 检验 (3)行列(RC)表资料的 2 检验 (4)四格表的确切概率法,后面内容直接删除就行 资料可以编辑修改使用 资料可以编辑修改使用,主要经营:网络软件设计、图文设计制作、发布广告等 公司秉着以优质的服

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论