第六章 卡方检验_第1页
第六章 卡方检验_第2页
第六章 卡方检验_第3页
第六章 卡方检验_第4页
第六章 卡方检验_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章离散型分类计数资料的2检验,我们已学过连续型资料的t 检验和Z检验方法,本章介绍离散型资料2 检验。理论基础:连续型变量的2分布, 拟和优度检验。,用途: 比较两独立样本频率或多个独立样本频率的假设检验; 配对设计分类资料的假设检验; 检验两个分类指标是否有相关性; 检验某个样本是否服从某个分布的假设检验。,第一节 2分布和拟合优度的 2 检验一、 2分布: 若 互相独立, 则 的分布称为自由度为的2 分布(Chi-square distribution), 记为 。 性质: 若 互相独立, 则 服从 2 分布, ,二、关于拟合优度的2检验(大样本):,1建立检验假设: H0:样本来自某理论分布。 H1:样本并非来自该理论分布。 =0.12H0成立时, 大样本时,Pearson 2统计量:,2值:反映了实际频数与根据检验假设算得的理论频数的吻合程度。,*似然比统计量:,自由度: -计算 时利用样本资料估计的参数个数,3将观察值代入得当前值和相应的P值。若P 0.05,故不拒绝 ,可认为两总体心率失常阳性率相等。,二、四格表资料专用公式:,注:关于统计量* 四格表时,Z检验和 检验完全等价。,三、连续性校正的公式 :,四格表卡方检验的应用条件: (1)eij5,且n40时,用不校正公式计算值。 (2)1eij5,且n40时,用连续性校正检验。 (3)eij1或n40,用Fisher精确概率法。,第三节 22交叉分类资料的2检验(配对四格表),表6.3 22交叉分类资料表( 四格表类型之二),根据研究目的不同可进行两种不同的2检验: 独立性检验和两种处理概率相等的检验。,一、两种属性分布间独立性检验(或称关联性检验):,如果一种属性的概率分布与另一种属性的概率分布无关,则称这两种属性相互独立;否则称这两种属性之间存在关联性。 例6.2 有260份血清样品,每份样品一分为二,用二种不同的免疫学检测方法检验类风湿因子,其结果如表6.4所示。试问这两种免疫学检验的结果是否相互独立?,表6.4 两种血清免疫学检测结果,1建立检验假设: H0: 属性A和B互相独立。 H1: 属性A和B互相关联。 =0.05,两种属性分布间独立性检验与两独立样本资料频率相等的假设检验资料分析的计算方法相同,但设计和解释不同。 设计:一份样本;n=260 ;行和与列和事先是不定的;按两种属性交叉分类。,2计算统计量2 值 : 利用(6.8a)或(6.7a), = (2-1)(2-1) = 1,3确定P值及决策:据 ,查附表7,=1时, 10.83, P0.001,按=0.05,拒绝 ,可认为两种方法测定结果间有关联。,关联程度的大小关联系数表达。 r= (取值在 -1与+1之间) 其中符号由关联的方向决定,与 的符号相同。 上例中, 故:,二、两种处理概率相等的2检验( McNemer检验),常用于配对设计,数据结构同上。问题不同。 例6.2 问两种测定方法的阳性概率是否相等? * 这里不是问是否关联,故不能用上面的办法分析! * 这里的两份样本,接受方法A的个体与接受方法B的个体有关联,故不能用前一节两独立样本资料频率比较的办法分析!,两样本阳性率之差取决于观察值f12和f21 。 问题:f12和f21的差异是否是偶然的? 1建立检验假设: =0.05 2计算统计量2值:,连续性校正公式:当 时,,3确定P值及决策:查附表7,=1时, , 按 水准,不拒 绝 ,可以认为两种检测方法的总体阳 性率相等。,第四节 RC列联表资料的2检验,一、问题的提出: 前面我们已经学过用2检验进行两个率(比率)差异的比较。在医学研究中,常遇见多个率(比率)的比较。可否用同样的思路和方法去解决这类问题? 见表6.6的资料:,表6.6 不同疾病病人的血型分布,这是三个三分类构成比的比较。,表6.11 某病170例不同年龄患者的疗效统计,这是三个率的比较。,二、RC表资料的2检验:,我们可用同样的思路,利用2检验进行多个率(比率)差异的比较, 将资料整理成一个RC表, 可用RC表资料的2检验比较多个率或构成比的差异。,基本公式:,RC表简化公式:,例6.4 在血型与疾病关系的研究中,随机抽取胃溃疡病人、胃癌病人及对照人群的样本,根据ABO血型分类(本例中因AB血型的例数较少,故省略不计),观测结果列于表6.6。试探讨不同病种是否具有不同的血型分布。,表6.6 不同疾病病人的血型分布,1. 建立检验假设: H0:三种疾病的血型构成比相等。 H1:三种疾病的血型构成比不全相等。 =0.05 2. 计算2统计量: 思想:假设三个构成比相等,等于什么? 在没其他信息时,基于样本信息,最可靠的估计值是等于合计的构成比。每个格子的理论频数就等于各疾病的总人数乘以相应的合计构成比, 如胃溃疡组A型血的理论频数为: e11=17960.424=761.5,其余格子相同。,可用基本公式: 或RC表简化公式:,3. 确定P值及决策: 自由度=(31)(31)=4,查附表得 18.47,故P0.001,按=0.05,拒绝H0,即认为三种疾病的血型构成比不等或不全相等。,三、RC表资料的关联度测定:,对于交叉分类资料,用2检验拒绝了两有序分类特征变量间独立的零假设之后,可用Pearson列联系数来定量描述两有序分类特征变量的关联强度。 Pearson列联系数(rP):,例6.5 某病不同年龄患者的治疗效果资料列于表6.11中,进行独立性2检验得到=23.582,4,拒绝两种属性分类相互独立的零假设。 例6.5: 表6.11 某病170例不同年龄患者与疗效统计,现计算Pearson列联系数rP为:,注意: 列联系数的符号,当频数集中在正对角线的格子时,取正值,集中在负对角线的格子时,取负值。(本例为负值)。,四、注意事项:,1. 同四格表资料一样, 2分布是建立在大样本的假定上的,要求不能有1/5以上的格子理论频数小于5,且不能有一个格子的理论频数小于1。 解决办法:增大样本量; 合理地合并相邻的组别; 删除理论数太小的行列; 电脑进行精确概率计算。,2. 当多个样本率(或构成比)作2检验,结论为拒绝零假设时,只能认为各总体率(或总体构成比)之间总的有差别,不能说明两两之间有差别。两组间的比较可参考2分割的方法。,第五节 检验频数分布的2检验,利用2检验的性质,我们可以用于检验任意实际分布与某个理论分布的符合程度。 例如:某市成年男女的构成比 鼻咽癌在家族的分布 仪器测量误差的分布,例6.6 某地暴发流行细菌性痢疾。为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户。原始资料列于表6.12中第1及第2两列。 其步骤为: 表6.12 二项分布拟合优度计算表,1. 建立检验假设: H0:服从 = 0.18576的二项分布,即不存在家庭内传播。 H1:不服从二项分布,即存在家庭内传播。 = 0.052. 估计,计算P(x) 理论家庭数ex及2分量: 发病率 发病人数调查人数 本例(016715143)/2884 0.18576 不发病率10.81424。,发病人数为x的概率: 例如:P(x=0) (0.18576)0(0.81424)4 0.43955理论家庭数: 本例n=288为调查家庭总数。 e02880.43955126.59相应的2分量为: (167126.59)2126.5912.90 (条件:ex5),3. 计算2值: 4. 确定P值及决策: 自由度=4-1-1=2。查附表7,=2时, =5.99,故P0.05,拒绝H0,可认为本次调查的四口之家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。,* 第七节 四格表精确概率检验法,前以述及,由于2分布为连续性分布, 2检验是基于大样本假定,四格表时,如果总例数小于40或任意一格子理论数小于1,大样本假定不成立,则不能用2检验。,表6.14 栓塞性脉管炎两种治疗方法的结果,总例数n小于40,为小样本资料,不能用2检验。,1. 建立检验假设: H0:12 H1:12 =0.05 2. 计算各种可能组合的概率: 用a, b, c, d代替四个格子的频数。我们知道总的12个病人中有7人治愈,如治愈率与治疗方法无关时,可建立以下条件概率:,目前四格表资料的发生概率为:,统计检验的P值还应包括实际观察到的资料更为极端情况的概率。 四个格子的频数(a,b,c,d)所有可能出现的组合情况共6种,全部列出并计算概率:,P1=0.02651515 P 2=0.22095959 P 3=0.44191919,P4=0.28515152 P5 =0.04419192 P6 =0.0012626263,(1)如为单侧检验: 对立假设为H1:12。 只需考虑一侧更为极端的情形,即比目前观察资料a6更为极端的情形a7。 单侧概率: P(a6)0.044191920.001262630.0454545 P= P(a6) 0.0454545。即P0.05,故拒绝H0而接受H1,认为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论