医学统计学课件:第九章 卡方分析_第1页
医学统计学课件:第九章 卡方分析_第2页
医学统计学课件:第九章 卡方分析_第3页
医学统计学课件:第九章 卡方分析_第4页
医学统计学课件:第九章 卡方分析_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章 2检验 (Chi Square Test ),重点掌握: 1、2检验的基本思想 2、完全随机设计和配对设计四格表资料2检验的步骤及应用条件。 3、行列表资料的2检验及应用中应注意的问题。,2检验用途: 用于计数资料。 1、检验两样本率之间有无差异; 2、多个样本率(或多组构成比)之间比较; 3、配对设计两样本率之间比较;,3,2检验(Chi-square test),是现代统计学的创始人之一,英国统计学家K.Pearson于1900年提出的一种具有广泛用途的假设检验方法。常用于分类变量资料的统计推断。,(一)2 检验基本思想,例 某神经内科医师欲比较A、B两种药物治疗脑血栓病人的疗效,

2、将病情轻重、病程相近且满足实验入选标准的156例脑血管栓塞患者随机分为两组,结果见表7-1,问两药治疗近期有效率是否有差别?,两样本率比较资料,经整理有四个基本数据,四格表资料的基本形式,a b c,请判断下列a、b、c谁属四格表:两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?,2检验遵循假设检验的基本思想,是指在建立无效假设的基础上,利用a、b、c、d四个格子的数,计算统计量2值,统计量2值 检验水准下2界值,相比较,P值 检验水准a值,相比较,10,2界值表,A:实际频数(actual frequency) T:理论频数(theoretical frequency) 对

3、资料要求:n 40,且T5,统计量2值通用公式,T 怎么求 ? T:理论频数(theoretical frequency) TRC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计,nR,nC,其他格子的理论频数均可由这个格子的理论频数计算而得, 即 T11=65.7,那么 T12=82-65.7=16.3, T21=125-65.7=59.3, T22=31-16.3 =14.7。见表7-1括号内数字。,如果Pa,则可认为A与T的差别已超出了抽样误差可以解释的范围,即有理由拒绝H0,接受H1,即12。 如果Pa,则尚无充分理由拒绝H0。,可见,2值的大小反映了实际频数A

4、与H0成立条件下的理论频数T之间的偏差,即实际频数与理论频数的吻合程度。 卡方值越大,说明实际频数与理论频数的差别越明显,两组有效率不同的可能性越大。,2检验的基本思想: 首先建立检验假设,在此基础上计算理论频数,将样本率的比较演绎为实际频数与理论频数间是否吻合的比较,借助统计量2值和自由度,根据该统计量在其特定分布中的位置确定概率,做出统计推断结论。,(一)用途: 检验两样本率之间差异有无统计学意义。,第一节 独立样本四格表资料的2检验,(二)公式 基本公式:n40,且T5(所有格子),19,四格表专用公式:,式中, a,c 为阳性绝对数;b,d 为阴性绝对数;n 为总例数,20,例9-1

5、为了解吲达帕胺治疗原发性高血压的疗效,将70名高血压患者随机分为两组,实验组用吲达帕胺加辅助治疗,对照组用安慰剂加辅助治疗,结果如下表,试分析吲达帕胺治疗原发性高血压的有效性。,22,建立检验假设并确定检验水准 H0:1=2,即试验组与对照组总体有效率相等 H1:12,即试验组与对照组总体有效率不等 =0.05 2. 计算检验统计量: 计算四格表中每一格的理论数,,假设检验步骤,23,T11=(4144)/70=25.77,那么 T12=44-25.77=18.23, T21=41-25.77=15.23, T22=26-15.23 =10.77。见表9-1括号内数字。,24,自由度为:=(行

6、数-1)(列数-1)=(2-1)(2-1)=1,3. 确定P 值 查附表7(P225),4. 结论:按=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为两组治疗原发性高血压的总体有效率不等。,= + + =8.40,(20-25.77)2,25.77,(24-18.23)2,18.23,25,四格表专用公式:,26,四格表专用公式:(n 40,且T5),= =8.40,44264129,(205-2421)270,四格表资料卡方检验的校正,2、基本公式,专用公式,1、校正条件: n40,且 1T5(一个及以上格子),28,例9-2 某医师欲比较胞磷胆碱与神经节苷脂治疗脑血管疾病的疗效

7、,将58例脑血管疾病患者随机分为两组,结果如下表。问两种药物治疗脑血管疾病的有效率是否不同?,表9-2 两种药物治疗脑血管疾病有效率的比较,29,建立检验假设并确定检验水准 H0:1=2 ,两药物治疗脑血管疾病有效率相等 H1:12 ,两药物治疗脑血管疾病有效率不等 =0.05 2. 计算检验统计量: 计算H0成立时各格子的理论频数,由此得到四格表中有两个格子理论频数,1T5,n 40, 需采用校正公式,30,= =0.376,(256-324 -58/2)258,4992830,31,3. 确定P值 查附表7,4. 结论:按=0.05水准,不拒绝H0,差别无统计学意义。尚不能认为两种药物治疗

8、脑血管疾病有效率不等。,当n40,或T1时,校正公式也不恰当, 这时须用四格表的Fisher确切概率法。,查X2界值表 X20.05,1=3.84 X20.3763.84,故P0.05,,(一)用途: 检验配对设计计数资料(率)有无差异。 如研究中对同一观察单位分别采用两种 方法进行检测,比较两种检测方法的检测情况(计数资料)有无差别。 这种资料分析时要整理为配对设计的四格表形式。,第二节 配对四格表资料 2 检验,(二)配对资料 McNemar X2检验 1、检验的基本思想 例 某研究组采用病理检查法和超声检查法,检查确诊乳腺癌患者257例,结果见表7-4,问两种方法检出率有无差别?,表7-

9、4 病理法和超声法检查乳腺癌患者的检查结果,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,病理法和超声法两种检测方法皆为阳性数(a); 病理法和超声法两种检测方法皆为阴性数 (d); 病理法为阳性、超声法为阴性数 (b); 病理法为阴性、超声法为阳性数 (c)。,其中,a, d 为两法观察结果一致的两种情况 b, c为两法观察结果不一致的两种情况。,因此,我们只对检查结果不一致的格子(b、c)进行检验。 检验的方法就是配对资料McNemarX2检验,但其适用条件是b+c40。,2、检验公式:检验统计量(McNemar test),38,例9-4 现有198份痰标本,每份

10、标本分别用A、B两种培养基培养结核菌,结果如下表,问A、B两种培养基的阳性培养率是否不等?,39,建立检验假设并确定检验水准 H0:B=C, 两种培养基的阳性培养率相等 H1:BC,两种培养基的阳性培养率不相等 =0.05 2.计算检验统计量:若H0成立时,检出结果不一致的两个格子理论频数都应该是(b+c)/2,40,3. 确定P值,作出推断结论 (查附表7,=1),=(24-20)2/(24+20)=0.36,查X2界值表 X20.05,1=3.84 X20.363.84,故P0.05,按0.05水准,不拒绝H0,差别无统计学意义。故尚不能认为两种培养基的阳性培养率不同。,(三)当bc40时

11、,配对设计四格表资料的X2统计量需校正。 (|bc|1)2 2 v=1 bc 注:当b+c40时,对于配对四格表资料,采用确切概率法进行检验要优于使用连续性校正公式检验。,两个率的比较也属于行列表资料的2检验,是最简单一种行列表(22表)。 如果两个以上的率或构成比的比较,由于行或列都大于2,所以不能再用四格表资料2检验。 只能用行列表资料的2检验。,第三节 行列表资料的2检验,行列 表资料分类,1、 双向无序资料 例:双向无序资料之多个样本率比较 有 R 行 2 列,称为 R 2表;,2、 双向无序资料 例:双向无序资料之多个样本构成比比较 有 R 行 C 列,称为 R C表;,3、单向有序

12、多分类(多组)资料 例:多个样本率(构成比)比较 有 R 行 C 列,称为 R C表;,4、双向有序资料 例:双向有序的两个变量分析 有 R 行 C 列,称为 R C列联表;,一、行列表资料2检验的用途 1、检验两个及以上样本构成比有无差异; 2、检验多个样本率间有无差异;,二、计算公式 检验统计量,(通用),(专用),2检验的应用条件: (1)1T5的格子数不超过总格子数的1/5。,(2)不能有任意一个格子理论频数小于1。,50,例9-5 某医院用三种方案治疗急性无黄疸型病毒肝炎254例,结果如表9-6所示,问三种方案治疗急性肝炎的有效率是否不同?,1、多个样本率的比较,51,三个样本率的比

13、较,32表资料,1. 建立检验假设 ,确定检验水准 0:三种治疗方案有效率相同,即123 1:三种治疗方案有效率不全相同。 0.05 2.计算检验统计量,RC列联表2检验步骤(同四格表),=254 = 22.81,512,( + +. -1 ),492,100145,100109,53,3、确定P值,作出推断,自由度v(行数-1)(列数-1)(3-1)(2-1)2 查X2界值表 X20.05,2=5.99 X222.815.99,故 P0.05,按0.05水准,拒绝H0,接受H1,差别有统计学意义。可认为三种治疗的有效率有差别。,2、多组样本构成比(比重或分布)的比较,例9-6 某研究人员收集

14、了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果如下表,问不同地区人群的血型分布是否不同?,三个样本构成比的比较,34表资料,1. 建立检验假设 ,确定检验水准 H0:不同地区人群血型分布总体构成比相同 H1:不同地区人群血型分布总体构成比不全相同 =0.05 2.计算检验统计量,= 297.38,3、确定P值,作出推断,自由度v(行数-1)(列数-1)(3-1)(4-1)6 查X2界值表 X20.05,6=12.59 X2297.3812.59,故 P0.05,按0.05水准,拒绝H0,接受H1,差别有统计学意义。 可认为不同地区的人群血型分布不全相同 。,例:9-5,多样本率间多重比

15、较,按照比较目的将RC列联表分解为多个四格表,并对每个四格表进行检验。 检验水准a进行调整:Bonferroni调整法 a=2a/k(k-1),行列表X2检验应用注意事项,(1)不宜有1/5以上格子理论频数大于1小于5、或有一个格子理论频数小于1。 理论频数太小的处理方法: A、增加样本含量-最好方法 B、删除频数太小的行和列 C、合理合并频数太小的行或列 (合并时要根据专业知识,将性质相近而且是相邻行或列进行合并,不能乱合并)第(2)和第(3)处理方法会损失信息。 D、采用RC的Fisher确切概率法。,(2)当三个及以上率(或构成比)比较,结论拒绝H0时,只能说总的有差别,但不能说明它们彼

16、此间都有差别,或某两者间有差别。 解决此问题方法:率的多重比较。 (3)RC表的X2检验与分类结果的排序无关。 而对于单向有序资料,如果是比较两组的疗效(治愈、显效、好转、无效)是否有差别,则需要用非参数检验(秩和检验)。,单向有序多分类(多组)资料,四格表资料的Fisher确切概率法 Fisher确切概率法可分三种: 1、完全随机设计四格表资料的确切概率法 应用条件:当n40或T1时,或其他检验方法所得的概率接近检验水准;,2、配对设计四格表资料确切概率法 应用条件:当b+c25时,应改用确切概率法。当b+c40时采用确切概率法进行检验要优于使用连续性校正公式检验。 3、行列表资料确切概率法 应用条件:行列表资料,当出现1/5以上格子理论频数大于1小于5,或有一个格子理论频数小于1时。,小 结,1、2检验的基本思想,(1)n40,且T5时,2检验基本公式和专用公式,(2)n 40,且1T5时,用2检验校正公式,(3)n40,或T1时,改用四格表确切概率法,2、四格表资料2检验:,3、配对四格表资料2检验:,b+c40 b+c40时,小 结,4、RC表(行列表) 有R个各分为C类的率/构成比,其基本数据有R行C 列,则称为RC表(包括四格表)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论