中国医科大学研究生医学统计学第五讲计数资料及卡方检验2_第1页
中国医科大学研究生医学统计学第五讲计数资料及卡方检验2_第2页
中国医科大学研究生医学统计学第五讲计数资料及卡方检验2_第3页
中国医科大学研究生医学统计学第五讲计数资料及卡方检验2_第4页
中国医科大学研究生医学统计学第五讲计数资料及卡方检验2_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五讲 分类资料的统计描述与2检验,计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。,绝对数:只能表示某事物在某时、某地 发生的实际水平。 相对数:便于相互比较与分析。,例:甲、乙两地麻疹流行, 甲地发病300人 绝对数 乙地发病250人 甲乙 但不能据此确定甲地麻疹流行较为严重,需考虑易感人数。若甲地易感人数3000人 乙地易感人数1000人 则甲地麻疹发病率=300/3000=10% 乙地麻疹发病率=250/1000=25% 相对数 乙甲,常用的相对数指标有比、比例和率三种。 1.两个有关指标之比称为比(ratio),或称相对比; 2. 当比的分子是分母的一部分时,称为比例(proportion),或称结构相对数。 3. 当比例与时间有关系时称为率(rate),或称为强度相对数。,第一节 常用相对数,一、率(强度相对数 ) 率(rate)是表示某种现象发生的频率和强度,常以百分率(%),千分率(),万分率(1/万),十万分率(110万)等表示,计算公式为:,例1某企业2003年有2839名职工,该企业每年都对职工进行体检,这一年新发生高血压患者5例,高血压发病率为: 528391000=1.76。 比例基数的选择 主要依据习惯用法或使计算结果保留一位或二位整数,以便阅读。,二、构成比(结构相对数 ) 构成比(Constituent ratio)表示事物内部各个组成部分所占整体的比重,通常以100为比例基数,以百分比表示,计算公式如下 :,例2 某医院1990年和1998年住院病人死于五种疾病的人数见下表。,特点:(1)同一事物的各个组成部分的构成比之和应为100%。(2)事物内部各组成部分之间呈此消彼长的关系。,三、相对比 相对比(ratio),是两个有关的指标之比,用以描述两者的对比水平。两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。,(一)结构相对数不能代替强度相对数 构成比只能说明某事物内部各组成部分的比重和分布,不能说明这事物某一部分发生的强度与频率。,第二节 应用相对数的注意事项,(二) 计算相对数应有足够数量 分母过小时相对数不稳定。在观察例数较小时,直接用绝对数表示。如“5例中4例有效”,而不要写有效率为80%,以免引起误解。,(三)正确计算合计率 不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。例如用某疗法治疗肝炎,甲医院治疗150人,治愈30人,治愈率为20;乙医院治疗100人,治愈30人,治愈率为30。两个医院合计治愈率应该是(30+30)(150+100)100=24。若算为20+30。50或(20+30)2=25,则是错的。,(四)注意资料的可比性 用以比较的资料应是同质的,除了要比较的处理因素外,其它条件应基本相同。对于不同时期、地区、条件下的资料应注意是否齐同。,(五)对比不同时期资料应注意客观条件是否相同 例如,疾病报告制度完善和资料完整的地区或年份,发病率可以“升高”;居民因医疗普及,就诊机会增加,或诊断技术提高,也会引起发病率“升高”。因此在分析讨论时,应根据各方面情形全面考虑,慎重对待。,(六)样本率(或构成比)的抽样误差 不能仅凭数字表面相差大小下结论,而应进行样本率(或构成比)差别的假设检验。,2检验,2检验在分类资料中的应用:(1)推断两个(或多个)总体率或构成比之间有无差别(2)多个样本率间多重比较 (3)两个分类变量之间有无关联性(4)多维列联表的分析(5)频数分布拟合优度的2检验,第一节 四格表资料的2检验,2检验的基本思想:是检验实际频数和理论频数的差别是否由抽样误差所引起的。,一、2检验的统计量基本公式为: 应用条件:n40,且T 5, 其中,表7-1两组降低颅内压有效率的比较,2值的含义:反映了实际频数与理论频数的吻合程度。 2值理论上是非负值。(即20)2检验判别准则: 若20.05,不拒绝无效假设H0; 若220.05() ,则P0.05,拒绝无效假设H0,接受H1 。,表1 常用2值界值表,2分布的参数:自由度。其计算公式为:=(行数-1)(列数-1) =(R-1)(C-1),例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?,表7-1 两组降低颅内压有效率的比较,H0:1=2 =pc= (a+c)/n,p1=a/(a+b)=99/104,p2=c/(c+d)=75/96,pc=(a+c)/n=174/200,T11=(a+b)(a+c)/n=(a+b) pc =104174/200,T21= (c+d)(a+c)/n=(c+d) pc =96174/200,表7-1内只有4个数 是该表的基本数据,其余数据都是由这4个基本数据推算出来的,称为四格表(fourfold table)资料。,2检验的检验步骤H0:1=2H1:12 =0.05;,以=1查2界值表得P0.05。按=0.05检验水准拒绝Ho,接受H1,可以认为两组降低颅内压总体有效率不等。,二、 四格表资料2检验专用公式: (n40且所有的T5) l,三、四格表资料2检验的连续性校正: (n40 且某一个理论数1T5) 校正公式分别为:,例如:例7-2就是利用此公式进行的计算,例7-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?,表7-2 两种药物治疗脑血管疾病有效率的比较,H0:1=2H1:12= 0.05n=78,但有一个格子的理论频数为4.67,可用四格表资料X2检验的校正公式(7-5)或公式(7-6)。本例用公式(7-6)计算校正X2值,=1,查X2界值表得0.05P0.10。按= 0.05检验水准不拒绝Ho,尚不能认为两种药物治疗脑血管疾病的有效率不等。本资料若不校正时,X2=4.35,P0.05,结论与之相反。,最小理论频数TRC的判断:R行与C列中,行合计数中的最小值与列合计数中的最小值所对应格子的理论频数最小。如本例,第2行与第2列所对应的格子理论频数最小(4.67)。,第二节 配对设计的四格表资料的2检验,(一)配对四格表形式 B A乙种属性 甲种属性 + - 合计 + a b a+b - c d c+d 合计 a+c b+d n=a+b+c+d,a, d: 两法观察结果一致的两种情况,b, c: 两法观察结果不一致的两种情况。,若两种处理方法无差别, 总体: B = C。因抽样误差不可避免, 样本往往bc,需进行假设检验 ( McNemar test ),检验统计量为 。,例7-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?,表7-3 两种方法的检测结果,(二)计算公式 1. b+c40 时 2. b+c40时,H0:总体B = C = (b+c)/2H1:总体BC,= +,b- (b+c)/22 (b+c)/2,c- (b+c)/22 (b+c)/2,= +, (b-c)/22 (b+c)/2,(c- b)/22 (b+c)/2,=,(b-c)2/2 (b+c)/2,H0:总体B = CH1:总体BC= 0.05b + c = 12 + 2 = 14 40。,=1, 查 界值表得P0.05。按= 0.05检验水准, 拒绝H0 , 接受H1 , 可以认为两种方法的检测结果不同。,第三节 四格表的Fisher确切概率法,R.A.Fisher提出直接计算有利于拒绝H0的概率,以作出检验判断。 Fisher确切概率法并非2检验的范畴。但在实际应用中常用它作为四格表资料假设检验的补充 2.适用条件:(1)n40 (2)T1 (3)P,第四节 行列表资料的2检验,行列表资料的2检验用于:多个样本率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验,一、多个样本率的比较(例7-6)二、两个或多个构成比的比较(例7-7)三、双向无序分类资料的关联性检验 (例7-8) 对一个样本(或称一组观察对象)按照两种分类变量的取值,排列成二维的表,2检验可用于分析两分类变量的关系。,一、多个样本率的比较例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?,表7-8 三种疗法有效率的比较,H0:1=2=3, 即三种疗法治疗周围性面神经麻痹的有效率相等H1: 三种疗法治疗周围性面神经麻痹的有效率不全相等= 0.05 =21.04, =2, 查 界值表得P0.005。按=0.05 水准, 拒绝H0, 接受H1, 可认为三种疗法治疗周围性面神经麻痹的有效率有差别。,二、样本构成比的比较例7-7 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN) 的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9, 问两组2型糖尿病患者的ACE基因型总体分布有无差别?,表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较,H0:两组2型糖尿病患者ACE基因型的总体构成比相同H1:两组2型糖尿病患者ACE基因型的总体构成比不同= 0.05,查 界值表得0.01P 0.025。按=0.05水准, 拒绝H0,接受H1,可认为DN组与无DN组的2型糖尿病患者的ACE基因型分布不同。,三、双向无序分类资料的关联性检验 两个无序分类变量的行列表资料, 称双向无序RC表资料。行列表资料 检验:推断两个无序分类变量之间有无关系/关联。若有关系,想进一步分析关系的密切程度,可计算Pearson列联系数C。,表7-10 某地5801人的血型,:行列表资料的 值 n:样本含量Pearson列联系数 C : 010 完全独立;1 完全相关;愈接近 0,关系愈不密切;愈接近 1,关系愈密切。,例7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?H0:两种血型系统间无关联H1:两种血型系统间有关联= 0.05,查 界值表得P 0.005。按= 0.05水准,拒绝H0, 接受H1, 可以认为两种血型系统间有关联,可进一步计算Pearson列联系数,以分析其关系密切程度。,可见,两种血型系统间虽然有关联性,但列联系数C 数值较小,虽然有统计学意义,可认为关系不太密切。,行列表2检验时的注意事项1.不宜有1/5以上的理论频数小于5或有1个格子的理论频数小于1。解决的办法有三种: (1)增加样本量。 (2)性质相近邻行或邻列合或删去理论数太小的行或列。 (3)改用双向无序RC表的Fisher确切概率法。,2.当多个样本率(或构成比)比较的2检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明任两个总体率之间皆有差别。3. 在实际应用中,对于RC表的资料要根据其分类类型和研究目的选用恰当的检验方法。,RC表的分类及其检验方法的选择,1双向无序RC表资料 RC表中两个分类变量皆为无序分类变量 对于该类资料:若研究目的为多个样本率(或构成比)的比较,可用行列表资料的2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行列表资料的2检验以及Pearson列联系数进行分析。,2. 单向有序RC表资料:(1)效应在构成比上有无差异:2检验 。 (2)效应有无差异:秩和检验3.双向有序属性相同的RC表资料 一致性检验(计算Kappa值),也可用特殊模型分析方法,4. 双向有序属性不同RC表资料若研究目的为分析不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论