




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2 检验(chi-square test) (3学时)吴成秋公共卫生学院卫生统计学教研室,2检验的应用,1.推断两个(多个)总体率或构成比之间是否有差别 2.多个样本率间的多重比较 3.两个分类变量之间有无关联性 4.频数分布拟合优度检验,一、2检验的基本思想,例7-1 某医生用两种疗法治疗前列腺癌,出院后随访3年,甲疗法治疗86例。乙疗法治疗95例,结果见下表。问两种疗法治疗前列腺癌病人的3年生存率是否有差别?,表10-7 甲乙两种疗法治疗前列腺癌的3年生存率 处 理 生存数 死亡数 合 计 生存率(%) 甲疗法 a52(46.09) b34(39.91) (a+b)86 60.47 乙疗法
2、 c45(50.91) d50(44.09) (c+d)95 47.37 合 计 (a+c)97 (b+d) 84 (n)181 53.59 表中 为基本数据,称为实际频数,用ar.c表示, 表中 是根据a计算得到的,称为理论频数, 用tr.c表示。该资料称为四格表资料。,若假设两种疗法治疗前列腺癌病人的3年生存率相同,即 h0: 1=2= 53.59%,则 t1.1=8697/181=46.09 t1.2=8684/181=39.91 t2.1=9597/181=50.91 t2.2=9584/181=44.09,tr.c =nrnc,n,2 =(at)2 = (r1)(c1) = (21)
3、(21)=1,t,假如h0: 1= 2成立,则a、t不会相差太大,那么2 会小;(a与t的差别是由抽样误差所致) 反之若检验假设h0不成立, 则a、t会相差很大,那么2会大;(抽样误差不能引起a与t如此大的差别) 判断结果,根据自由度的大小查2界值表 当2 2,时,p,拒绝h0,接受h1 当2 2,时,p ,不拒绝h0. 2反映了实际频数与理论频数的吻合程度,(一)、四格表的一般公式,二、一般四格表的2检验,2 =(at)2 = (r1)(c1),t,以例10-7为例做2检验 h0: 1=2 即两种疗法治疗前列腺癌的3年生存率相同 h1: 12 即两种疗法治疗前列腺癌的3年生存率不相同 =0.
4、05 t1.1=8697/181=46.09 t1.2=8684/181=39.91 t2.1=9597/181=50.91 t2.2=9584/181=44.09 2 =(at)2 =(52-46.09)2+(34-39.91)2+(45-50.91)2+(50-44.09)2=3.11 =(21) (21)=1 查2界值表得 20.05,1=3.84, 20.05。按=0.05的水准,不拒绝h0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。,t,44.09,50.91,39.91,46.09,(二)、四格表的专用公式,当n40,t5时,用 2 =,(adbc)2 n,(ab)(cd)
5、(ac)(bd),a、b、c、d 为四格表的实际频数 (ab), (cd), (ac), (bd)是四格表周边的合计数 n=abcd, 为总的样本含量 对例10-7的计算 2 = =3.11,(5250-3445)2181,(86959784),显然,计算结果与前相同,但该法避免了计算理论数的麻繁,(三)、四格表的校正公式,1.2检验的应用条件 (1)当n40且t5时,用2检验的基本公式或四格表的专用公式;当p时,改用四格表的确切概率法。 (2)当n40时但有1t5时,用四格表2的校正公式或用四格表的确切概率法 (3)当n40时,或t1时,用四格表的确切概率法 2.四格表2的校正公式,2 =(
6、at0.5)2,t,2 =,(adbcn/2)2 n,(ab)(cd)(ac)(bd),例7-2某医师用两种疗法治疗心绞痛,结果如表10-10,问两种疗法的疗效有无差别? 表10-10 两种疗法治疗心绞痛的效果率,h0: 1= 2 即两种疗法的疗效相等 h1: 1 2 即两种疗法的疗效不等 =0.05 t=299/59=4.42(计算行合计和列合计均为最小的理论数) c2 = =0.61 =1,查2界值表得, p0.05。按=0.05的水准不拒绝 h0, 尚不能认为两种两种疗法的疗效不等.,( 233627 59/2)259,2930509,三、配对四格表资料的2检验,配对四格表资料的2检验是
7、对配对设计研究所获得的资料为计数资料进行比较。,配对设计包括: 同一批样品用两种不同的处理方法 观察对象根据配对条件配成对子,同一对子内的不同个体分别接受不同的处理 在病因或危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。,观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况: a:甲+乙+ b:甲+乙- c:甲-乙+ d:甲-乙- 列成下面四格表,适用于配对设计的计数资料 配对资料的结果有 甲 乙 结果 a b c d,配对设计的计数资料,2 =(bc)2/(bc), =1, (bc) 40 c2 = ( bc 1)2/(bc), =1 (bc) 4
8、0,例 对120名确诊的乳腺癌病人,分别用甲乙两种方法来检测,甲方法检出阳性率为60%,乙方法检出阳性率为50%,甲乙一致检出阳性率为35%,问甲乙两方法检出阳性率有无差别?,表: 两种方法的检测结果,h0:b=c (1= 2) h1:b c (1 2) =0.05,bc= 3018=4840 2 =(3018)2/(3018)=3.0 =1,查 2界值表得 p0.05 。按=0.05水准,不拒绝h0 ,还不能认为两种方法的检验结果不同。,配对四格表资料的关联性检验(p761),h0:两种方法无关(无一致性) h1:两种方法有关(有一致性) =0.05 2 两种方法检测结果的相关系数r r必定
9、等于kappa检验的kappa值,k0.75 一致性好 0.40k 0.75 一致性较好 k0.40 一致性差,例73 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表73。问两种方法的检验结果有无差别? 表73 两种方法的检测结果,h0:b=c h1:b=c =0.05,bc=124=1440 c2 =( 122 1)2/(122)=5.79 =1,查2界值表得 0.01p0.025 。按=0.05水准拒绝h0 ,接受h1, 认为两种方法的检验结果不同,免疫荧光法的阳性检出率较高。,四、行列表资料的2检验,可以用于多个率及多个构成比资料的比较和双向
10、无序分类资料关联性检验。其基本数据有三种情况: 1、多个样本率比较。有r行2列,称为r2表 2、两个样本的构成比比较,有2行c列,称为2c表 3、多个样本的构成比比较,以及双向无序分类资料关联性检验,有r行c列,称为rc表,行列表检验的专用公式 2=n(a2/nrnc1) = (r1)(c1),(一)多个样本率的比较,例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别? 表7-8 三种疗法有效率的比较,h0 :1=2= 3,即三种疗法的有效率相等 h1 :三种疗法的有效率不全相等 =0.05 2 =532(1992/2
11、0648172/20651262/144511) =21.04 = ( 31)( 21) = 2 查2界值表:得p0.005.按 =0.05 拒绝 h0,接受h1,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,(二)样本构成比的比较 例7-7 某医师在研究血管紧张素转化酶(ace)基因i/d多态与2型糖尿病肾病(dn)的关系时,将249例型糖尿病患肾病分为两组,资料见表79。问两组型糖尿病患者的ace基因型总体分布有无差别? 表7-9 dn组与无dn组型糖尿病患者ace基因型分布,h0 :两组2型糖尿病患者ace基因型的总体构成比相同 h1 :两组2型糖尿病患者ace基因型的总体构成比
12、不同 =0.05 按公式(710)计算 2=249(422/11172482/111120362/138571) =7.91 = (21) (31)=2 查2界值表得0.01p0.025。按=0.05拒绝h0, 接受h1,认为dn与无dn的2型糖尿病患者的ace基因型分布不同。,(三)双向无序分类资料的关联性检验,例7-8 测得某地5801人的abo血型和mn血型结果如表7-10,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型,h0:两种血型系统间无关联 h1:两种血型系统间有关联 =0.05 2=58014322/(18231451)4902/(18231666) 322/
13、(3482684)1=213.16 = (41)(31)=6 查2界值表得p0.005。按=0.05拒绝h0 ,接受h1,认为两种血型系统间有关联。,若需进一步分析关系的密切程度时,可计算pearson列联系数c c取值范围在01之间。 0 表示独立: 1 表示完全相关; 愈接近于0,关系愈不密切, 愈接近于1,关系愈密切。,(四)、行列表资料检验的注意事项,1、理论频数t不应太小; 不宜有1/5以上的格子1t5; 不宜有一个格子的t1 若出现上述情况,处理的方法有: (1)最好是增加样本的含量(继续观察),使t增加 (2)根据专业知识,考虑能否删去t太小的行或列,或t太小的行间或列间,进行合
14、理的合并,(3)改用双向无序表的确切概率法 2、多个率比较,若所得统计推断为拒绝 h0,接受h1时,只能认为各总体率之间总的来说有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。 3、对于有序的rc表资料不宜用 2检验(见后),(五)rc表的分类及其检验方法的选择,1、双向无序rc表: rc表中两个分类变量皆为无序分类变量,如表7-8、7-9、7-10。对于该类资料: 若研究目的为多个样本率(或构成比)的比较,可用r2表资料的2检验 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用rc表资料的2检验以及pearson列联系数进行分析。,2、单向有序
15、rc表: 有两种形式 rc表中的分组变量是有序的(如年龄),而指标变量是无序的(如传染病的类型),其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序rc表资料可用行列资料的2检验。 rc表中的分组变量为无序的(如疗法),而指标变量是有序的(如疗效按等级分组),其研究目的为比较不同方法的疗效,此种单向有序rc表资料宜用秩和检验进行分析。,3、双向有序属性相同的rc表: rc表中的两分类变量皆为有序且属性相同。实际上是22配对设计的扩展,即水平数3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检验方法的一致性,此时宜用一致性检验(kappa检
16、验),,4、双向有序属性不同的rc表: rc表中两分类变量皆为有序的,但属性不同,如表7-13。 若目的为分析不同年龄组的疗效有无差别时,可把它视为单向有序rc表资料,选用秩和检验 , 若目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析或积矩相关分析或pearson积矩相关分析 若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。,方法: 1. 2分割法(partitions of 2 method) 2. scheffe可信区间法 3. snk法,五、多个样本率间的多重比较,( 一) 2分割法,1 、基本思想 多个样本率比较若结论为拒绝h0,接受
17、h1时,需进一步做多重比较,即做两两之间的比较,说明每两个总体率之间是否有差异。 方法:把r2表直接分割成多个独立的四格表,进行两两比较的2检验,但必须重新规定检验水准,其目的是保证检验假设中的型错误的概率不变。,表7-12 :表7-8三个有效率的比较可分割成3个四格表,2、的调整方法 多个率之间的每两两之间的比较:k个样本率每两两之间进行比较,共有 次独立的四格表2检验,加上总的行列表的2检验,共作了 1次检验。故其检验水准,各实验组与对照组比较: (k-1) 个实验组与对照组,其检验水准,3、多个率之间的每两两之间的比较,例7-9 对例7-6资料进行两两比较,以推断任何两种疗法治疗周围性面
18、神经麻痹的有效率是否有差异? h0:a= b 即任何两种疗法的疗效相等 h1:ab 即任何两种疗法的疗效不等 =0.05 本题为3个率的比较,k=3,,计算2值见表7-12,查表7-11界值表,确定p值, 按=0.0125水准,可认为物理疗法与药物疗法及外用膏药疗法的疗效有差异,还不能认为药物疗法与外用膏药疗法的疗效有差异,4.各实验组与对照组比较,例7-10 对例7-6资料中以药物疗法为对照组,物理疗法和外用膏药疗法为实验组,试分析实验组的总体有效率与对照疗法是否有差异?h0:t= c 即各实验组与对照组的总体有效率相等h1:tc 即各实验组与对照组的总体有效率不等 =0.05 k=3, =
19、0.0125 可认为物理疗法与药物疗法的疗效有差异,还不能认为外用膏药疗法与疗药物法的疗效有差异.,四格表资料 fisher确切概率法,(2学时)吴成秋公共卫生学院卫生学教研室,一、基本思想 例7-4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染hbv的效果,将33例hbsag阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的hbv总体感染率有无差别? 表 7-4 两组新生儿的感染率,在四格表周边合计数固定不变的条件下表内4个实际频数变动的情况如下:变动组合数=周边合计中最小数+1 ( 1) (2 ) (3) (4) (5),adbc=-198 adbc=-165 adbc=-
20、132 adbc=-99 adbc=-66,(6 ) (7) (8) (9) (10),abbc=-33 adbc= 0 adbc=33 adbc=66 adbc=99,(ab) !(cd) !(ac) !(bd) !,a! b! c! d!n!,pi=,1、计算各组合的概率 pi服从超几何分布,其和为1,2、计算累计概率p: 设现有样本四格表中的交叉积差a* d*b* c*=d*,其概率为p*,其余情况下的组合四格表的交叉积差记为di,概率记为 pi (1)单侧检验 若现有样本四格表中d*0,须计算满足did*和pip*条件的各种组合下四格表的累计概率。 若d*0,则计算满足did*和pip
21、*条件的各种组合下四格表的累计概率。,(2)双侧检验 计算满足did*和pip*条件的各种组合下四格表的累计概率。 若ab=cd 或 ac=bd 时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,乘以2即得双侧累计概率。,确定p值和作出结论 p值是指由h0规定的总体中作随机抽样,获得等于及大于(和/或等于及小于)现有样本检验统计量值的概率。 t(u)t,(u) p t(u)=t,(u) p=,-t, -t 0 t +t,/2,/2,p/2,二、检验步骤 1、计算现有样本的d*和p*及各组合下四格表的di2、计算满足did*条件的各组合下四格表的累计概率pi3、计算同时满足di66和pip*条件的四格表的累计概率 p=p1p2p3p4p5p10 0.1210,表7-5 例7-4的fisher确切概率法,例7-5 某单位研究胆囊线癌、线瘤的p53基因表达,对同期手术切除的胆囊线癌、线瘤标本各10份,用免疫组化法检测p53基因,资料见表7-6。问胆囊线癌和胆囊线瘤的p53基因表达阳性率有无差别? 表7-6 胆囊线癌和胆囊线瘤的p53基因表达,h0: 1= 2 h
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年老年教育课程内容创新与探究式学习方法应用报告
- 街道消防经费保障方案(3篇)
- 同城达人管理办法
- 后厨长效管理办法
- 员工假期管理办法
- 商业路演管理办法
- 商品入驻管理办法
- 商城管理暂行办法
- 商洛文物管理办法
- 喷码规则管理办法
- 风力发电项目投资计划书
- 2025年度食堂餐具设备升级改造采购合同
- 河北公物拍卖管理办法
- 2025年企业首席质量官培训考核试题(含答案)
- (高清版)DB46∕T 707-2025 榴莲栽培技术规程
- Q-CSG1211016-2025 光伏发电站接入电网技术规范
- 26个英文字母(课堂PPT)
- 小组合作下的班级文化建设
- 监理平行检验记录完整范本
- 门店安全检查表(一)
- JJF 1809-2020 逆反射测量仪校准规范(高清版)
评论
0/150
提交评论