定性资料的统计描述_第1页
定性资料的统计描述_第2页
定性资料的统计描述_第3页
定性资料的统计描述_第4页
定性资料的统计描述_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 定性资料的统计描述 在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。如性别、HIV感染情况、病情轻重等都属于分类资料。对于这类资料,其绝对数往往不便于进行相互比较。例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。第一节 常用相对数及其应用相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。一、率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,

2、用以说明该现象发生的频率或强度。根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在01之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。其计算公式可表达为: (5.1)式中,K为比例基数,可以是100%、1000、100000/10万等。比例基数的选择主要根据习惯用法或使计算结果保留12位整数,以便阅读。例5.1 为研究吸烟与肺癌的关系,某医生收集了20032005年286例住院肺癌患者的吸烟史,吸烟的肺癌患

3、者有166例,而同时期同年龄段的1855名非肺癌患者中,吸烟的有407例。试计算该资料中肺癌患者与非肺癌患者的吸烟率。由式(5.1),肺癌患者的吸烟率,非肺癌患者吸烟率,肺癌患者的吸烟率比非肺癌患者的吸烟率高36.1%。速率(rate)是带有时间因素的频率,根据数理统计的定义是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生频率之意。如肿瘤患者的5年生存率;根据追踪随访资料计算的死亡率;年(月、季)发病率等指标,都包含有时间因素,在流行病学中也称为发生密度。速率具有量纲,取值范围是),其计算公式可表达为: (5.2)式中的比例基数K与式(5.1)相同。例5.2 在一项随访研究中,对1

4、25人追踪随访了2年,结果有2人发生了死亡,则由式(5.2)可得,二、构成比 构成比(proportion)即比例,是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的比重,常用百分数表示。计算公式为: (5.3)例5.3 某医院2003年各科室收治住院患者的构成情况如表5.1所示。外科患者的构成比为1133/2826×100% = 40.09%,在各科室中所占比重最大;其次是内科患者,其构成比为850/2826×100% = 30.08%;接下来依次是妇科和儿科,分别占了15.04%和14.79%,各科室合计构成比为1

5、00%。表5.1 某医院2003年各科室收治住院患者的构成情况科 别病例数构成比(%)内 科85030.08外 科113340.09妇 科42515.04儿 科41814.79合 计2826100.00构成比具有以下特点: 分子是分母的一部分,各组成部分构成比数值在01之间波动,各组成部分的构成比数值之和等于1或100%。 事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数值增大,其他组成部分构成比数值必然会减少。例如在一定数量的人口性别构成中,若男性比例增加,则女性比例减少。三、相对比相对比简称比(ratio),是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几

6、。如前面讲到的变异系数、流行病学中常用的相对危险度、人口学研究中常用到的性别比等都属于相对比。相对比的分子和分母可以是绝对数、相对数或平均数,计算公式为: (5.4)根据其分子与分母的关系,相对比也可取分为: 关系指标:指两个有关的非同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。对比指标:指同类事物的两个指标之比,以达到比较的目的。如2000年我国出生性别比为116.9,说明2000年我国男性出生人数比女性高,男、女性别比有所失衡。又如同时期不同人群的某病发病率之比,以说明该时期不同人群的发病情况。例5.4 为了解新生儿的锌的营养状况,分别测量某医院足月儿以及早产儿的脐血血清

7、锌含量,结果显示足月儿及早产儿的脐血血清锌含量的均数分别为1.85 mg/L和1.41 mg/L,则该医院足月儿与早产儿的脐血血清锌含量之比为1.85/1.41=1.31,即该医院足月儿脐血血清锌含量是早产儿的1.31倍。在流行病学研究中,常用的相对危险度(RR)和比值比(OR)都属于相对比指标。相对危险度(relative risk, RR) 是指暴露于某种危险因素的观察对象的发病危险度与低暴露或非暴露的观察对象的发病危险度之间的比值。相对危险度常用于流行病学队列研究中,用来度量暴露的危险性大小。其计算可用暴露与低暴露(或非暴露)于危险因素的累积发病率或发病密度估计: (5.5)例5.5 某

8、锡矿为了解一线作业对工人健康的影响,对1000名新参加工作的工人进行了20年的追踪随访,结果发现从事一线作业的680名工人有5人发生了肺癌,而从事非一线作业的320名工人仅1人发生了肺癌。试估计该锡矿一线作业对肺癌的相对危险度。一线作业工人肺癌的发病率;非一线作业工人肺癌的发病率。可见,该锡矿一线作业工人发生肺癌的危险是非一线作业工人的2.35倍。比值比(odds ratio, OR),又称优势比,是指病例组有无暴露于某危险因素的比值与对照组有无暴露于同一危险因素的比值之比,常用于流行病学病例对照研究中,以度量暴露的危险性。计算公式: (5.6) 式中,a为病例组中暴露的人数;b为对照组中暴露

9、的人数;c为病例组中未暴露的人数;d为对照组中未暴露的人数。例5.6 某中学发生一起因饮水引起的甲型肝炎(甲肝)爆发,经调查发现,该校部分学生有生饮自来水的习惯,34名甲肝患者中有22人生饮自来水;而1449名健康学生中,生饮自来水的有255人,结果见表5.2。试估计该中学甲肝发病与生饮自来水的比值比。表5.2 甲肝与生饮自来水的病例对照研究结果暴露或特征病例组对照组合计生饮自来水22(a)255(b)277(a+b)未生饮自来水12(c)1194(d)1206(c+d)合计34(a+c)1449(b+d)1483(N)由此可见,甲肝患者生饮自来水与未生饮自来水的比值是健康学生的8.58倍。第

10、二节 应用相对数的注意事项一、计算相对数应有足够的观察单位数计算相对数时,应注意观察的单位数不能太小。必须要有足够的观察单位数作为分母,计算的率才是稳定的。例如临床试验中用某种疗法治疗2例患者,1例有效,则认为有效率是50%;如果2例都有效,则有效率是100%,可见相差1例其有效率波动非常大。因此,观察单位数少时,建议采用绝对数表示结果,如果必须要用相对数表示,应同时列出率的置信区间。但通常认为,在设计周密、质量控制严格的动物实验中,观察数量相对较少时所得的相对数指标也较为稳定。二、分析时不能以构成比代替率构成比说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。在实际应用中

11、,错误地将构成比当成率来应用,常导致一些不合理的推论。例如在对某月交通事故的数据进行分析后发现,在发生交通事故的车辆中,高速行驶的占31%,中速行驶的占56%,低速行驶的占13%。据此认为,中速行驶的车辆最容易发生交通事故,这明显与常识不符。产生此错误的原因是将发生交通事故的车辆的不同速度构成当成不同速度行驶车辆的事故发生率,由于实际生活中以中速行驶的车辆较多,所以中速行驶车辆的事故发生数构成比较大。车辆事故发生率应该是事故发生数与行驶的车辆数之比。在医学研究中这种情况也常出现,常见的错误是采用门诊患者或住院患者的资料来分析疾病与年龄、性别、职业等的关系,这种资料所计算的相对数指标通常是构成比

12、,不能当作率来分析。例如,某医师根据门诊资料分析慢性支气管炎与年龄的关系,如表5.3所示:表5.3 门诊慢性支气管炎患者的年龄构成年龄组(岁)患者人数患者构成比(%) 04819.4207429.8408735.1603915.7合计248100.0表中“患者构成比”一栏,仅说明各年龄组患者所占的比重,只能计算构成比指标,不能反映各年龄组的患病水平,不能由4059岁组构成比最高而得出该年龄组最容易患慢性支气管炎的结论。因为各年龄组的人口数、就诊机会等因素都会影响门诊患者的年龄构成,若要分析慢性支气管炎患病率与年龄的关系,只能通过对一般人群的调查才能了解各年龄组患病率的情况。在构成比指标中,某一

13、组成部分构成比的增减会影响到其他组成部分构成比的变化。某地2000年和2005年慢性疾病的发病情况如表5.4所示:表5.4 某地2000年和2005年慢性疾病的发病情况疾 病2000年2005年病例数构成比(%)病例数构成比(%)呼吸系统疾病168530.24257728.88循环系统疾病143325.71267129.93恶性肿瘤91516.42171119.18其他154027.63196422.01合 计5573100.008923100.002005年与2000年相比,呼吸系统疾病的构成比明显下降,而循环系统疾病、恶性肿瘤的构成比均有所上升。如果据此作出呼吸系统疾病发病下降,循环系统疾

14、病、恶性肿瘤发病上升的结论,就犯了以构成比的动态分析代替率的动态分析的错误。因为2005年与2000年相比,各类型慢性疾病发病的人数都在增加,若要反映各类型慢性疾病发病强度的变化,应对2000年和2005年各类型慢性疾病的发病率进行比较。三、应分别将分子和分母合计求合计率对分组资料计算合计率时,不能简单地把各组率取平均数,而应分别将分子和分母合计,再求出合计率。例如,某医院消化内科上半年收治250例胃溃疡患者,治愈200例,治愈率为80.0%;下半年收治280例胃溃疡患者,治愈238例,治愈率为85.0%。则该消化内科全年对胃溃疡的治愈率应该是而不是(80%+85%)/2=82.5%。四、相对

15、数的比较应注意其可比性影响相对数高低的因素较多,在比较相对数时,除了欲对比的因素之外,其余的影响因素应尽可能相同或相近。例如比较各组患者的年龄、性别、病情轻重等构成是否相同,若构成不同,则应考虑进行分层(分年龄、性别、病情轻重)比较,或者对合计率进行标准化后再作比较。例如,两种疗法治疗某病的病死率如表5.5所示:表5.5 两种疗法治疗某病的病死率病型新疗法一般疗法治疗人数死亡人数病死率(%)治疗人数死亡人数病死率(%)普通型75 1520.025520.0重型合 计35 1440.0652640.0110 2926.4903134.4如果只比较合计病死率,似乎新疗法优于一般疗法,但当分别考察普

16、通型病例和重型病例时,两种疗法的病死率是相同的。其原因在于:两种疗法治疗对象的病型构成不同,新疗法组普通型病例多而重型病例少,一般疗法组却是普通型病例少而重型病例多。因此要正确比较两种疗法的病死率,可按病情轻重分层分析,或通过计算标准化病死率进行比较。五、样本率或样本构成比的比较应作假设检验由于样本率或样本构成比存在抽样误差,如果通过样本推断总体率或总体构成比有无差异,不能凭样本率或样本构成的差别作结论,而须进行差别的假设检验。第三节 动态数列及其应用动态数列(dynamic series)是一系列按照时间顺序排列的统计指标(包括绝对数、相对数或平均数),用以反映事物或现象在时间上的变化和发展

17、趋势。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。例5.7 表5.6是某地区19992002年住院患者数的统计数据,试计算动态数列的分析指标。表5.6 某地区19992002年住院患者数发展动态年份符号患者数绝对增长量发展速度增长速度累计逐年定基比环比定基比环比(1)(2)(3)(4)(5)(6)(7)(8)(9)1999a0266942000a15017523481234811.881.880.880.882001a25060023906 4251.901.010.900.012002a35471328019 41132.051.081.050.08

18、一、绝对增长量绝对增长量是指事物现象在一定时期增长的绝对值,可分为两种:(一) 累计增长量累计增长量(cumulative quantity of increase) 是指报告期的指标值与某一固定期(基期)指标值的差值,其计算公式为: (5.7)本例中,该地区2002年患者数的累计增长量人,见表5.6第(4)栏。 (二) 逐年增长量 指报告期的指标值与相邻的前期指标值之差,其计算公式为: (5.8)本例中,该地区2002年较2001年患者数的逐年增长量人,见表5.6第(5)栏。二、发展速度与增长速度发展速度(speed of development)与增长速度(speed of increas

19、e)都是相对比指标,用以说明事物现象在一定时期的速度变化。发展速度说明报告期指标值水平与某一固定期指标值相比或与相邻的前期指标值相比,是其多少倍。根据其比较对象的不同,分为定基比发展速度和环比发展速度。定基比发展速度:指报告期的指标值与某一固定期(基期)指标值之比,可表达为,。为某一固定期(基期)指标值,为报告期指标值。 本例中,该地区2000年住院患者数的定基比发展速度,2001年住院患者数的定基比发展速度,以此类推,见表5.6第(6)栏。环比发展速度:指报告期指标值与相邻前期指标值之比,可表达为,。本例中,该地区2000年住院患者数的环比发展速度,2001年住院患者数的环比发展速度,以此类

20、推,见表5.6第(7)栏。增长速度是发展速度的净增长量,增长速度=发展速度1,以说明报告期指标值与某一固定期指标值相比或与相邻的前期指标值相比,增长了多少倍。本例中,该地2001年住院患者数的定基比增长速度,见表5.6第(8)栏;同年住院患者数的环比增长速度,见表5.6第(9)栏。二、平均发展速度与平均增长速度平均发展速度(average speed of development)是指一定时期内各环比发展速度的平均值,用以说明事物现象在一定时期内逐年的平均发展程度,常用几何平均数来计算平均发展速度。计算公式为:平均发展速度= (5.9) 式中,为某一固定期(基期)指标值,为报告期指标值。平均增

21、长速度(average speed of increase )是说明某事物在一定时期内逐年的平均增长程度。计算公式为:平均增长速度=平均发展速度1 (5.10)根据表5.6的资料,该地区1999年有住院患者26694人,到2002年增加到54713人,相当于1999年的2.05倍,3年间共增加患者28019人,增加了1.05倍。19992002年的平均发展速度为倍,平均增长速度倍,住院患者数总体呈增长趋势。从环比增长速度看,2000年增长较快,增长了0.88倍,但2000年后增长速度明显放缓。动态数列不仅可以分析过去一段时间的变化规律,也可根据其过去的变化规律预测未来发生情况,计算未来几年后指

22、标所达到的水平。如根据表5.6资料,可预测到2004年该地区住院患者数规模,相当于按式(5.9)计算:即根据某地区19992002年住院患者数的平均发展速度,预计到2004年该地区的住院患者数将达到88193人。第四节 率的标准化一、标准化法的意义 在本章第二节中曾提到,当所比较的各组观察对象内部构成不同时,应考虑进行分层比较,或者对合计率进行标准化后再作比较。 以表5.5资料为例,要比较新疗法和一般疗法的病死率,如果仅比较合计率,一般疗法的合计病死率是34.4%,而新疗法的合计病死率是26.4%,显然一般疗法比新疗法的病死率高。但当我们分别考察普通型病例和重型病例两组人群时,两种疗法的病死率

23、均相同,普通型病例的病死率都是20%,而重型病例的病死率都是40%。那么,为什么一般疗法的合计病死率就比新疗法高呢?其原因就是:两种疗法治疗对象的病型构成不同,新疗法组普通型病例多而重型病例少,一般疗法组却是普通型病例少而重型病例多。要消除这种假象,可以采用率的标准化法进行比较。标准化法(standardization)的基本思想就是采用统一的标准构成,以消除年龄、性别、病情轻重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率(standardized rate)具有可比性。标准化法的思想也可用于平均数的比较,如比较两个医院平均住院天数,需考虑不同科室住院患者的构成对

24、平均住院天数的影响。总之,标准化的目的在于消除年龄、性别、病情轻重等混杂因素对研究结果的影响。在医学研究中,混杂因素(confounding factor)通常指与研究因素有关并对研究结果产生影响的非研究因素。在资料分析阶段有许多控制混杂因素的方法,标准化法是其中之一。二、标准化率的计算计算标准化率的常用方法有直接法和间接法两种。以表5.7为例说明两组观察对象的年龄构成不同时,其标准化死亡率的计算方法和计算公式。其它标准化率的计算与之类似。表5.7 计算标准化率的数据符号年龄组标准组被标化组人口数死亡数死亡率人口数死亡数死亡率12合计 (一) 直接法当已知被标化组的年龄别死亡率时,宜采用直接法

25、计算标准化率,这里又分两种情况:1. 已知标准组年龄别人口数时, (5.11)式中,为标准化率;为各年龄组的预期死亡数,是指用被标化组的年龄别死亡率去预测在标准人口中,可能会有多少人发生死亡。总的预期死亡数除以标准组总人口数N就得到标准化率。2. 已知标准组年龄别人口构成比时, (5.12)式中,标准组的年龄构成比乘以被标化组的年龄别死亡率称为分配死亡率,分配死亡率的累计就是标准化率。如果采用相同的标准组,式(5.11)和式(5.12)计算的结果是完全一致的。(二) 间接法当被标化组的年龄别死亡率未知,只有年龄别人口数和死亡总数r时,可采用间接法。间接法必须有标准组的年龄别死亡率,计算公式为:

26、 (5.13)式中,P为标准组的合计死亡率,是被标化组的预期死亡人数,是被标化组的实际死亡数与预期死亡数之比,称为标准化死亡率比 (standardized mortality ratio, SMR)。若,表示被标化组的死亡数高于标准组;若,表示被标化组死亡数低于标准组。用标准化死亡比(SMR)乘以标准组的合计死亡率P,即得到间接法标准化死亡率。(三) 标准化率的计算步骤1根据被标化组的数据条件选择直接法或间接法 如对死亡率的年龄构成标准化,如果已知被标化组的年龄别死亡率,宜采用直接法计算标准化率;如果没有被标化组的年龄别死亡率,只有年龄别人口数和死亡总数,应采用间接法计算标准化率。2选择标准

27、组 根据研究目的选择有代表性的、较稳定的、数量较大的人群,例如全国的、全省的或本地区的数据;也可将欲比较的两地或两组的人口数合并作为标准组,或选择其中一组人口作为标准。3选择公式计算标准化率 根据所选方法和数据条件选择相应的公式。现以表5.5为例,具体说明标准化率的计算,此处是对病死率进行标准化。 (1) 已知新疗法和一般疗法分别治疗普通型病例和重型病例的病死率,采用直接法计算标准化病死率。(2) 选择新疗法和一般疗法两组的合并治疗例数作为标准人口数,见表5.8第(2)栏。(3) 按式(5.11)计算新疗法组和一般疗法组的标准化病死率。表5.8 直接法计算两种疗法的标准化病死率(%)病型标准人

28、口数新疗法一般疗法(1)(2)病死率(3)预期病死数(4)=(2) (3)病死率(5) 预期病死数(6)=(2) (5)普通型10020.02020.020重型10040.04040.040合 计 新疗法组的标准化病死率 一般疗法组的标准化病死率 可见,经标准化以后,新疗法和一般疗法两组的病死率是相同的,与分病型比较的结果一致。标准化法解决了由于患者病型构成不同而导致的合计病死率与分病型比较相矛盾的问题。本例也可用式(5.12)计算标准化病死率,计算结果与式(5.11)完全一致,见表5.9。表5.9 利用标准患者病型构成比计算两种疗法的标准化病死率(%)病 型(1)标准患者病型构成比(2)新疗

29、法一般疗法原病死率(3)分配病死率(4)=(2) (3)原病死率(5) 分配病死率(6)=(2) (5)普通型0.520.010.020.010.0重型0.540.020.040.020.0合 计例5.8 已知某地2000年恶性肿瘤死亡总数23人,该地2000年各年龄组的平均人口数见表5.10第(3)栏。试问该地恶性肿瘤死亡率是否高于全国平均水平?(1) 由于知道该地恶性肿瘤死亡总数r和各年龄组人口数,未知该地各年龄组恶性肿瘤死亡率,故选用间接法计算标准化死亡率。(2) 选择全国同期各年龄组恶性肿瘤死亡率作为标准,见表5.10第(2)栏。(3) 按式(5.13)计算该地的恶性肿瘤标准化死亡率。表5.10 间接法计算某地2000年恶性肿瘤标准化死亡率(1/10万)年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论