定性资料的统计分析参考PPT_第1页
定性资料的统计分析参考PPT_第2页
定性资料的统计分析参考PPT_第3页
定性资料的统计分析参考PPT_第4页
定性资料的统计分析参考PPT_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、定性资料的统计分析,定性资料的统计描述,一、统计学指标 绝对数:反应实际水平 相对数-两个数值的比,包括: 率 构成比 相对比,(一)率 又称频率指标或强度指标,说明某现象或某事物在它可能发生的范围内实际发生的频率或强度。 常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)等表示,计算公式为,疾病及死亡评价的常用指标 (P345),发病率(incidence rate) 罹患率(attack rate) 患病率(prevalence rate) 感染率 ( infection rate) 续发率 ( secondary attack rate) 死亡率(mortality

2、rate) 病死率(fatality rate),(二)构成比 构成比:表示事物内部某一部分观察单位数与该事物内部各部分观察单位的总数之比,用来说明各构成部分在总体中所占的比重。 通常以100%为比例基数。其计算公式为:,构成比有两个特点: 同一事物的各个构成比的总和应等于100%,即各个分子的总和等于分母。 各构成部分之间是相互影响的,呈此消彼长的关系。,(三)相对比 简称比,是两个有关指标之比,说明两指标间的比例关系。计算公式:,公式中两指标可以是绝对数、相对数或平均数 两指标可以量纲不同 两指标可以是性质相同,如不同时期死亡率之比;也可以性质不同,如医院的医护人员数与病床数之比。 相对危

3、险度:两个率之比,流行病研究常用指标。,率的比较,两样本率的z检验 检验,两样本率的比较,目的在于对相应的两总体率进行统计推断。 设两样本率分别为p1和p2,当n1与n2均较大,且p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5时,可利用样本率的分布近似正态分布,可采用正态近似法对两总体率作统计推断。,两样本率的比较,检验统计量u/z的计算公式为:,例7-1 为研究某职业人群颈椎病发病的性别差异,今随机抽查了该职业人群男性120人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病。问该职业人群颈椎病的发病是否有性别差异

4、?。,记该职业人群颈椎病的患病率男性为1,女性为2,其检验假设为 H0:1=2 H1:12 a =0.05,本例 n1=120, X1=36, p1=X1/n1=36/120=0.30; n2=110, X2=22, p2=X2/n2=22/110=0.20,查z界值表得0.05P0.10。按 =0.05水准,不拒绝H0,即尚不能认为该职业人群颈椎病的发病有性别差异。,检验,四格表资料的 检验,目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量: 应用:计数资料,1 检验的基本思想,

5、例 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?,表7-1 两组降低颅内压有效率的比较,本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。,图7-2 四格表资料的基本形式,表7-2 两组降低颅内压有效率的比较,实际频数,理论频数,理论频数由下式求得:,式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,理论频数 是根据检

6、验假设 ,且用合 并率来估计 而定的。 无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。那么理论上,试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为96(26/200)=12.48。,若检验假设H0:1=2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。如果上述统计量值很大,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12 。 这个统计量就称为卡方统计

7、量。,反映实际频数与理论频数的吻合程度可用统计量 来表示,卡方分布: 若k个随机变量,z1,z2,zk,相互独立且服从标准正态分布,则随机变量x=z12+z22+zK2被称为服从自由度为k的卡方分布,记作:,可通过 检验的基本公式来理解。,式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。,值的大小还取决于 个数的多少(严格地说是自由度的大小)。自由度愈大, 值也会愈大;所以只有考虑了自由度的影响, 值才能正确地反映实际频数A和理论频数T 的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有

8、两行两列, =1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。,分布图形,(1) 建立检验假设,确定检验水平。 H0:1=2 即试验组与对照组降低颅内压的总体有效率相等 H1:12 即试验组与对照组降低颅内压的总体有效率不相等 =0.05。,2. 假设检验步骤,(2)求检验统计量值,3. 四格表资料检验的专用公式,四格表资料 检验方法选择条件:,,卡方检验; ,卡方校正检验; ,Fisher确切概率法。,连续性校正仅用于 的四格表资料,当 时,一般不作校正。,4. 四格表资料检验的校正公式,例7-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病

9、患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?,表7-2 两种药物治疗脑血管疾病有效率的比较,本例 ,故用四格表资料 检验的校正公式,,查 界值表得 P0.05 。按 检验水准不拒绝 ,尚不能认为两种药物治疗脑血管疾病的有效率不等。,本资料若不校正时, 结论与之相反。,配对四格表资料的 检验,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,例7-3 比较甲乙两种方法诊断肝癌的差别,共273例肝癌患者。问两种方法肝癌检出率有无差别?,甲乙两种方法273肝癌诊

10、断结果,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为 阴性数(b); 乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。,检验统计量: 基本公式 (b+c40),校正公式 (b+c或=40),47,本例检验步骤如下:,(1)建立检验假设 H0:总体B=C,即两种方法肝癌检出率相同 H1:总体BC,即两种方法肝癌检出率不等 =0.05,(2)计算2值 本例b=17,c=66,b+c40,(3)确定P值及推断结论 P0.05,在=0.05的水准上,拒绝H0,接收H1,差异有统计学意义

11、,可以认为两种方法检测结果不同,检验统计量为,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,52,行列表资料的 检验,53,行列表资料,多个样本率比较时,有R行2列,称为R 2表; 两个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,称为R C表。,54,检验统计量,一、多个样本率的比较,案例7-4 135例尿

12、路感染患者随机分为3组,每组45例,甲乙丙三种方法。问甲乙丙三种方法阴性转化率有无差别。,三种疗法对尿路感染的治疗效果,58,假设检验步骤:,2. 计算检验统计量, =(31)(21)=2,3.确定P值,做出推断结论 查附表7,可得P0.005,按照a=0.05的水准,拒绝H0,接受H1,差异有统计学意义,可以认为三种疗法治疗尿路感染患者的总体阴转率不等或不全相等,二、样本构成比的比较,62,案例7-5 为了解血型分布与胃癌及消化性溃疡病的关系,某单位进行了调查,试比较各组血型构成有无差别?,63,64,假设检验步骤,1建立检验假设,确定检验水准 H0 :胃癌、溃疡和对照三个组的血型总体构成比

13、相同 H1 :胃癌、溃疡和对照三个组的血型总体构成比相不同或不全相同 =0.05,65,计算检验统计量,66,确定P值,作出推断结论 根据 = 6 查 2 界值表,得P 0.05,按=0.05的检验水准,拒绝H0,接受H 。差异有统计学意义,可以认为胃癌、溃疡和对照三个组的血型总体构成有差异。,R*C表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 R*C表资料。,三、双向无序分类资料的关联性检验,例 7-6 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?,表7-6 某地5801人的血型,表7-6资料,可用行列表资料 检验来推断两个分类变

14、量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:,列联系数C取值范围在01之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。,检验步骤,由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,四、行列表资料 检验的注意事项,73,1样本量 40,行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,增大样本含量以达到增大理论频数的目的,属首选方法,根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。 改用双向无序RC表的Fisher确切概率法,2. 多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。,行列表资料两两比较,R*C或R*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论