计数资料的统计分析.ppt_第1页
计数资料的统计分析.ppt_第2页
计数资料的统计分析.ppt_第3页
计数资料的统计分析.ppt_第4页
计数资料的统计分析.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计数资料的统计分析,实例,例1 两组雌鼠,伺以高蛋白和低蛋白饲料,8周后记录各鼠的体重增加量(克),数据如下:,例2 某种基因型在糖尿病病人和非病人分布如下表,例3 研究两种药物治疗中风病的疗效,将病人随机分配到丹参组和血塞通组。数据如下:,计数资料:将观察单位按某种属性或类别分组计数。 统计分析:构成比、率、 检验 等级资料:将观察单位按某种属性的不同程度分组计数,得到各组观察单位数称为等级资料或半计量资料。 统计分析:构成比、率、秩和检验。 计量资料:测定每个观察单位某项指标量的大小。 统计分析:平均数、标准差、t检验、方差分析、相关与回归等。,一 相对数(relative number),是两个有联系的指标之比。 1.构成比 2.率 3.相对比 门诊人次数/床位数 人口密度 =人口数/土地面积,应用相对数时的注意事项,计算率时分母不宜过小。 不能以比代率。如某地某年肿瘤普查资料如下: 比较的可比性。其它对观察结果有影响的因素在比较的两个群体中构成比是否相同 。对于内部构成不同的两个率,应将率进行标准化,标准化后的率称为标准化率。 对样本率(或构成比)比较时应随机抽样并做假设检验。,如果在各年龄组的病死率存在交叉,如低年龄组死亡率高于乙县,而高年龄组,乙县高于甲县,此时不宜进行标准化,而进行分年龄组的死亡率的比较。,二 总体率的估计,点估计 方法简单,但未考虑抽样误差的大小。 区间估计(P181):按一定的概率估计总体均数所在的范围 (1)正态分布法 样本含量n较大,P和1-P均不太小,np和n(1-P)5,P的抽样分布服从正态分布 (2)查表法,三 率的假设检验,1.两样本率比较(P182-P184) 组别 有效 无效 合计 有效率 A组 a b nr1=a+b p11=a/(a+b) B组 c d nr2=c+d p21=c/(c+d) 合计 nc1=a+c nc2=b+d n=a+b+c+d p1=(a+c)/n 卡方检验 O 实际观察到的频数 理论频数:,例10.5 中西药治疗慢性肾炎观察资料,四格表专用公式 对例10.5则有:,卡方的校正,原因:2分布是一个连续型的分布, 而计数资料中的频数是间断性的,使用的2检验与真正的2分布有一定的误差, 特别当有理论频数5但大于1时,误差较大,使得所得概率值偏小,必须进行校正,称为连续性校正。 校正2 = 或校正2 =(|ad-bc|-n/2)2n/(a+b)(c+d)(a+c)(b+d),四格表卡方应用的条件:,当n40且所有的T5时,用普通的2检验。若所得的P值,改用四格表确切概率法。 当n40,但有1T5时,用校正的2检验。 当n40, 或有T1时,不能用2检验,改用四格表确切概率法。,2、U检验,当n较大,p与(1-p)均不太小时(一般地,当n1p1、n1(1-p1)、n2p2、n2(1-p2)均大于5 ),样本率的分布近似正态分布,根据独立的两个正态分布变量之差也服从正态分布的性质,可以考虑用正态近似的方法进行统计学检验。 u值的计算,对例10.5 对于未校正的2来说, 2=1.192=u2=1.0922,2.多个样本率的比较 例10.6(P184) H0:3种疗法的有效率相同 H1:3种疗法的有效率不相同或不全相同 2=8.143 =2 20.01=9.21 20.05=5.99,RC列联表的统计分析,不同形式的资料,适用于不同的统计分析方法: 1.行、列变量均无序2检验 检验多个率或构成比之间的差别有 无统计学意义 2.行、列变量之一有序Kruskal-Wallis 3.行、列变量皆有序Jonckheere-Terpstra 对于2和3的两种情况,如果使用2检验,则检验的是各行的构成比是否不同,反映的行列变量之间有无关系,并不能检验出行列变量之间是否存在某种趋势。,行列均无序的RC列联表: P186,例10.7 H0:3个民族血型构成比相同。 H1: 3个民族血型构成比不同或不全相同。 =0.05 2检验: 按=0.05水准,拒绝H0,接受H1。认为三个民族血型构成比不同,类似地,如果1/5以上格子的理论频数小于5,或有1格理论频数小于1,则卡方检验不是一个有效的检验。 解决方法: (1)增加例数 (2)合理地合并相邻的行或列 (3)用确切概率计算,RC表资料的分割,当RC的卡方检验拒绝H0时,研究者常需进一步了解哪两组之间的差异有显著性。有两种方法。 1. 各组间两两比较-解成多个2 K表作卡方检验。 为了使犯假阳性错误的概率不增大,需对每次检验的显著性水平重新规定,即令: = /(2C) (为单侧概率) C为比较的总次数,C=K(K-1)/2 例如:4组治愈率的差异有统计学意义,再作两两比较,总的=0.05, 则两两比较的=0.05/12=0.0043 (K=4,C=4 (4-1)/2=6),2. 2分割法 把最接近的两组作显著性检验,显著性水平不变, 如其差异无统计学意义,可以合并,再与其他最接 近的组比较,如其差异无统计学意义,可以再合并, 这样一直进行下去,直到其差异有统计学意义而不 能再合并为止。,行、列之一有序的RC列联表:,K-W 检验的计算步骤: 1.计算各列的平均秩次(rank mean)。 (n1+1)/2 (j=1) (j=2,3,) 2.计算各行之秩和(rank sum) RSi= 3.,Rmi=,4.计算相等秩次的修正因子(correction Facter): 5.计算统计量KW: KW=H/CF 大样本时,KW 服从df=R-1的 分布,故 可根据 界值表作出统计推断。,确切概率法,基本思想:在周边合计不变的条件下,直接计算RC表内数据的各种组合的概率,将小于等于原始表组合的概率累加在一起作为检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论