卫生统计学 第二章 资料的统计描述.ppt_第1页
卫生统计学 第二章 资料的统计描述.ppt_第2页
卫生统计学 第二章 资料的统计描述.ppt_第3页
卫生统计学 第二章 资料的统计描述.ppt_第4页
卫生统计学 第二章 资料的统计描述.ppt_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/8/7,第二章 医学资料的统计描述,统计描述用适当的统计图(表)和统计指标(如均数、标准差、有效率、治愈率等)来描述资料的分布规律(图表)和数量特征(统计指标)。,目的:用直观的、简单的形式来表达数据资料所蕴藏的信息。,2020/8/7,第一节 频数分布表和频数分布图,资料的类型,定量资料,定性资料,等级资料,举例:,身高体重,治疗人数:100 有效人数: 85,化验结果: :15人 +:35人 +:46人 +:25人,不同的资料类型,要用不同的统计方法和指标,2020/8/7,某省人均卫生事业费在全国位次(1998年),第一节 频数分布表和频数分布图,2020/8/7,1999年中

2、国农村死亡原因构成 (%),第一节 频数分布表和频数分布图,2020/8/7,第一节 频数分布表和频数分布图,一、频数分布表,资料,按某种标准或标志分组,统计不同组别的观察值个数,A 8个,B 11个,C 15个,依次类推,称为频数,A B C ,原始数据较大时,很难得出概括的印象。必须对原始数据进行整理:按数量分组或按属性或类别分组,然后统计各组的人数(频数)。,2020/8/7,原始资料分组,定量资料频数分布表,定性资料频数分布表,按数量分组,按类别或属性分组,第一节 频数分布表和频数分布图,2020/8/7,(一)定性资料频数分布表,定性资料的频数分布表:按事物的属性特征进行归类后统计各

3、类别观察单位所得的统计表。(),第一节 频数分布表和频数分布图,2020/8/7,例 2-1,第一节 频数分布表和频数分布图,2020/8/7,下表是甲、乙两医院治疗同一种疾病的情况,比较甲、 乙两医院的总治愈率有无差别。 甲医院乙医院 病情治疗人数治愈人数治愈率()治疗人数治愈人数治愈率() 轻 100 80 80.0 300 210 70.0 重 300 180 60.0 100 50 50.0 合计 400 260 65.0 400 260 65.0,甲、 乙两医院某病治愈率比较,第一节 频数分布表和频数分布图,2020/8/7,(二)定量资料频数分布表,最小值,最大值,长度,分段,按数

4、量大小分组,然后统计各组(段)的频数(人数),第一节 频数分布表和频数分布图,2020/8/7,计量资料,离散型资料,连续型资料,变量取值可以一一列举,变量取值为一定范围内的取值,每一育龄妇女现有的子女数;每分钟的脉搏数,身高(cm)、体重(kg)、总胆固醇(mmol/L),结果为整数,结果有度量衡单位,2020/8/7,以变量取值为标志分组,列出各组别的频数,(一)离散型计量资料的频数表,啊,2020/8/7,某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。 潜伏期(小时) 12- 24- 36- 48- 60- 72- 84- 96- 108-120 合计 病例数 1 10 18 14

5、 5 4 4 2 2 60,分组标志,频数列,连续型计量资料的频数表,问题:,2020/8/7,最小值,最大值,长度,分段,按数量大小分组,然后统计各组(段)的频数(人数),、定量资料的频数表的编制,步骤:,(1)计算极差(range),(2)确定组距和组段,(3)采用划记法,统计各组段频数,(4)列表,第一节 频数分布表和频数分布图,2020/8/7,2020/8/7,(1)求极差(全距) 最大值最小值 4.2-2.51.7 (kg),例 2-2 150名男婴出生体重。,第一节 频数分布表和频数分布图,2020/8/7,(2)确定组距和组段,求组距(i): i极差/组数28.7/102.87

6、3,确定组数 原则:n50, 9-15组。实际应用时,应根据研究目的和分析要求,灵活确定组数。一般以能反映频数分布的特征为原则。,确定各组段的上下限 原则:第一组段包括最小值,最后组段包括最大值。 每一组段都有上限和下限 下限:组段的起点(最小值) 上限:组段的终点(最大值),一般只列出下限!,2020/8/7,划记,第一节 频数分布表和频数分布图,2020/8/7,频数分布的特征 1、集中趋势:数据向某一数值集中的倾向 2、离散趋势:数据的数值大小不等的倾向,第一节 频数分布表和频数分布图,2020/8/7,二、频数分布图,以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图。可直观地反映频

7、数分布的特征。,2020/8/7,频数分布的类型 正态分布、对称分布 偏态分布,正偏态,负偏态,2020/8/7,1、对称分布:集中位置(高峰)居中,左右两侧频数分布大体对称,其中的正态分布是重要的分布形式。 2、偏态分布:集中位置(高峰)不居中,偏向某一侧。 (1)正偏态:集中位置(高峰)偏向数值较小的一侧。 (2)负偏态:集中位置(高峰)偏向数值较大的一侧。,第一节 频数分布表和频数分布图,2020/8/7,对称分布示意图,正态分布示意图,可以是多峰,只要左右对称,只能是单峰,2020/8/7,三、频数表的用途: 1、揭示资料分布的特征 2、揭示资料分布的类型 3、便于进一步计算指标和统计

8、分析 4、便于发现特大或特小的可疑值,2020/8/7,第二节 集中趋势的描述,描述定量资料分布特征的指标,集中趋势指标,离散趋势指标,平均数,R、Q、S、CV,2020/8/7,常用平均数的种类: 1、算术均数(arithmetic mean)(简称均数) 2、几何均数(geometric mean,G) 3、中位数(median),平均数(average)是描述一组定量资料集中趋势的统计指标,常用于说明该组数据的平均水平。,第二节 集中趋势的描述,2020/8/7,一、算术均数(均数) 样本均数用 表示,总体均数用表示 1、适用范围 对称分布,尤其是正态分布的资料,2020/8/7,2、计

9、算方法:,(1)直接法,(2)加权法 适用于频数表资料,其中: X组中值(上限下限)/ 2, f频数,第二节 集中趋势的描述,2020/8/7,身高(cm) 频数(f) 组中值(x) f x f x2 95- 1 96.5 96.5 9312.25 98- 7 99.5 696.5 69301.75 101- 10 102.5 104- 18 105.5 107- 25 108.5 110- 21 111.5 113- 15 114.5 116- 15 117.5 119- 7 120.5 122-125 1 123.5 合计 120(f ) 13218(fx) 1460046 (fx2),3

10、.8,509.2,1743.76,2020/8/7,3、均数的应用 反映一组观察值的平均水平 描述正态分布特征的重要参数,均数两个重要特征 、各离均差(各观察值X与均数之差)的总和等于零; 、离均差的平方和小于各观察值X与任何数a之差的平方和。 说明均数是一组观察值最好的代表值。,第二节 集中趋势的描述,2020/8/7,原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布,二、几何均数(geometric mean, 简记为G),1、适用资料: (1)等比级数资料 (2)对数正态分布资料 (微量元素资料),(血清抗体滴度资料),第二节 集中趋势的描述,2020/8/7,2、计算方法: (

11、1)直接法,例 2-5 求平均抗体滴度,X 为抗体滴度的倒数,G=40,平均抗体滴度为1:40。,第二节 集中趋势的描述,2020/8/7,(2)加权法,Glog -1,X不用组中值计算,例2-6,第二节 集中趋势的描述,2020/8/7,3、应用几何均数注意事项: (1)观察值不能有0; (2)观察值不能同时有正负值; (3)同一资料求得的G,第二节 集中趋势的描述,2020/8/7,三、中位数(M)和百分位数(Px),1、定义,中位数: 将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数。 在全部观察值中,大于和小于中位数的观察值的个数相等。,2020/8/7,百分位数:将一组观察

12、值从小到大按顺序排列, 一个百分位数将全部观察值分为两部分,理论上有x的观察值比它小,有(100-x)的观察值比它大。P50分位数也就是中位数。,第二节 集中趋势的描述,2020/8/7,2、中位数和百分位数的适用范围: (1)偏态分布资料 (2)分布不明资料 (3)分布末端无确定值资料(开口资料) 理论上,中位数和百分位数可用于任何分布的计量资料, 但实际应用中常用于偏态分布,特别是开口资料。,2020/8/7,某市238名健康人发汞含量 发汞值(g/g) 人数 0.3 3 0.3 17 0.7 66 1.1 60 1.5 48 1.9 18 2.3 16 2.7 6 3.1 1 3.5 1

13、 3.9 2 合计 238,偏态分布资料,开口资料,2020/8/7,总胆红素 人数 (mol/L) 一般组 重症组 17 4 0 17 10 0 80 15 3 160 1 9 240 0 2 320 0 4 400 0 4 合计 30 22,两组肝炎婴儿的血清总胆红素测定结果,2020/8/7,3、计算方法: (1)直接法:适用于观察数少资料 (中位数),n为奇数时,,M,3, 4, 6, 7, 9, 10,26,x1 x2 x3 x4 x5 x6 x7,M,2020/8/7,n为偶数时,,M,x1 x2 x3 x4 x5 x6 x7 x8,3 5 7 8 9 10 13 27,M,第二节

14、 集中趋势的描述,2020/8/7,百分位数(PX),Px=(X int(nx%)+ X int(nx%)+1)/2,当 nx%=int(nx%) 时:,注:式中 int(nx%) 为n与x%乘积的整数部分,第二节 集中趋势的描述,2020/8/7,当 nx%int(nx%) 时:,Px= X int(nx%)+1,注:式中 int(nx%) 为n与x%乘积的整数部分,nx%=15020%=37.5int(nx%), 即 P25=X38=3.1,例2-9 根据例2-1资料,求P25 、P75 、P90,nx%=15075%=112.5int(nx%), 即 P80=X113=3.6,nx%=1

15、5090%=135=int(nx%), 即 P80=(X135+X136)/2 =(3.8+3.8)/2=3.8,第二节 集中趋势的描述,2020/8/7,(2)频数表法:适用于频数表资料 步骤: 从小到大计算累计频数和累计频数; 确定百分位数和中位数所在组段; 计算百分位数Px和中位数M,第二节 集中趋势的描述,2020/8/7,Px,MP50,LPx或M所在组段的下限 iPx或M所在组段的组距 fxPx或M所在组段的频数 小于L各组段的累计频数,2020/8/7,Px,起点,平均每例的组距,从起点到Px的例数,L(起点),Px,2020/8/7,例2-10,第二节 集中趋势的描述,2020

16、/8/7,4、中位数和百分位数的用途: (1)中位数描述一组偏态资料的集中趋势; 百分位数描述一组资料在某百分位置的水平 在对称分布资料中,M (2)百分位数用于确定医学参考值范围。,2020/8/7,集中趋势指标的选择判断步骤:,资料 抗体滴度 G 否 偏态、开口 M 否 X,是,是,2020/8/7,甲组 26, 28, 30, 32, 34. 30 乙组 24, 27, 30, 33, 36. 30 丙组 26, 29, 30, 31, 34. 30,例:,第三节 定量资料的离散趋势指标,2020/8/7,反映离散程度的常用指标: 1、极差 2、四分位数间距 3、方差 4、标准差 5、变

17、异系数,第三节 定量资料的离散趋势指标,2020/8/7,一、极差(range)(全距)R 1、计算公式:R最大值最小值 2、意义:R愈大,离散度愈大 R愈小,离散度愈小 3、优点:计算简单,意义明了 4、缺点:(1)不能反映每一个观察值的变异 (2)样本例数越大,R可能越大 (3)R抽样误差大,不稳定,第三节 定量资料的离散趋势指标,2020/8/7,二、四分位数间距(quartile range)(简记QR) 1、计算公式: 四分位数间距QQUQL P25:下四分位数,简记QL P75:上四分位数,简记QU 2、意义:中间一半观察值的极差,意义与R相似。 3、特点:(1) 比R稳定,但仍未

18、考虑每一个观察 值的变异; (2) 常用于描述偏态资料的离散度。,2020/8/7,三、方差(总体方差简记 ,样本方差简记 ),一组观察值的离均差平方和,取其均数,即方差。,(XX)0 (离均差和),(XX)20 (离均差平方和),缺点:与例数多少有关,(variance),2020/8/7,1、计算公式:,第三节 定量资料的离散趋势指标,2020/8/7,2、意义:方差越大,离散度越大; 方差越小,离散度越小。,3、缺点:单位被平方,不便于使用,第三节 定量资料的离散趋势指标,2020/8/7,四、标准差(总体标准差简记,样本标准差简记S),方差的开方,即标准差。,1、计算公式:,2、意义:

19、与方差的意义相同 (注:n-1为自由度),(standard deviation),2020/8/7,3、计算方法: (1)直接法:,2020/8/7,(2)加权法:,X为组中值,X为组中值,2020/8/7,身高(cm) 频数(f) 组中值(x) f x f x2 95- 1 96.5 96.5 9312.25 98- 7 99.5 696.5 69301.75 101- 10 102.5 104- 18 105.5 107- 25 108.5 110- 21 111.5 113- 15 114.5 116- 15 117.5 119- 7 120.5 122-125 1 123.5 合计

20、120(f ) 13218(fx) 1460046 (fx2),3.8,509.2,1743.76,2020/8/7,4、用途: (1)用于表示正态或近似正态分布资料的离散度; (2)结合均数描述正态分布的特征; (3)计算标准误。,标准差,第三节 定量资料的离散趋势指标,2020/8/7,五、变异系数(简记CV),1、计算公式: CV,2、用途: (1)比较度量衡单位不同的多组资料的变异度(离散度) (2)比较均数相差悬殊的多组资料的变异度(离散度),(Coefficient of variation),2020/8/7,第三节 定量资料的离散趋势指标,3、特点:CV没有单位,是相对数,便于

21、资料间的比较。,变异系数,2020/8/7,第三节 定量资料的离散趋势指标,集中趋势指标,资料 抗体滴度 G、S 否 偏态、开口 M、Q 否 X、S,是,是,选择判断的步骤:,离散趋势指标,单位不同,均数相差悬殊,CV,2020/8/7,第四节 分类资料的统计描述,2020/8/7,一、常用的相对数,分类资料常采用相对数进行描述。,收集到的分类资料,表现为绝对数。绝对数说明事物发生的实际水平,是进行统计分析的基础,但不便于事物进行深入地分析比较。,第四节 分类资料的统计描述,2020/8/7,例如:某年甲乙两村发病情况如下: 甲村:发病人数 100 人。 乙村:发病人数 300 人。,发病情况

22、乙村比甲村严重?,第四节 分类资料的统计描述,2020/8/7,甲村:人口数:1000人 发病人数:100 人 发病率:10.0%。,乙村:人口数:5000人 发病人数:300 人 发病率:6.0% 。,甲村比乙村严重!,第四节 分类资料的统计描述,2020/8/7,相对数:是两个有联系指标之比,说明事物发生的相对水平,便于对分类资料进行分析和比较。 常用的相对数:率、构成比、相对数,第四节 分类资料的统计描述,2020/8/7,率(Rate)又称频率指标,是指在一定时间内发生某现象的观察单位数与可能发生该现象的总观察单位数之比。它说明某现象发生的频率或强度。,(一)率(Rate),第四节 分

23、类资料的统计描述,2020/8/7,K为比例基数,可以是百分率(%)、千分率()、万分率(1/万)或十万分率(1/10万),可根据习惯或使计算出的率保持一、二位整数。,第四节 分类资料的统计描述,2020/8/7,人口出生率、死亡率、自然增长率、婴儿死亡率等采用千分率; 肿瘤的死亡率采用十万分率。,习惯用法:,第四节 分类资料的统计描述,2020/8/7,分母:只有可能发生某事件的观察单位才能做分母。 时间:一般以年为间期,也有月、周等。由些指标分子有累积作用,分母没有。比较时要注意。,注意:计算率时,注意分母和时间。,第四节 分类资料的统计描述,2020/8/7,例如:,麻疹发病率 = 10

24、00 ,某年新发麻疹病例数,同年麻疹易感儿总数,不应该是儿童总数,第四节 分类资料的统计描述,2020/8/7,例如:,麻疹发病率 = 1000 ,某年新发麻疹病例数,同年麻疹易感儿总数,分子、分母都有累积。,第四节 分类资料的统计描述,2020/8/7,例:,分子有累积、分母无累积。,第四节 分类资料的统计描述,2020/8/7,常见的两种率:,发病率与患病率,第四节 分类资料的统计描述,2020/8/7,新发病例 在观察期内发病,如下图的A、B 现患病例 在观察期前已发病, 如下图的C,A1,A2,B1,B2,C1,C2,C3,期初 期末,第四节 分类资料的统计描述,2020/8/7,该期

25、间新发生的某病病例数 发病率 K 一定时期内可能发生某病的平均人口数,(2)特点: 发病率可大于100; 高低还与时间长短有关:因为分子有累积作用, 半年的发病率不能与一年的发病率比较。 (3)用途: 多用于反映急性病在一定人群中发生 的频率或水平; 多用于研究疾病发生的因果和评价防治措施的效果;,1、发病率 表示一定时期内,在可能发生某病的一定人群中,新发生的病例数。 (1)计算公式,第四节 分类资料的统计描述,2020/8/7,2、患病率 指在某时点检查时可能发生某病的一定人群中现患的病人总数。 (1)公式: 检查时发现某病现患病例总数 时点患病率 K 该时点受检人口数 某观察期间发现某病

26、现患病例总数 期间患病率= K 同期的平均人口数 K=100%,1000,10000/万,100000/10万,第四节 分类资料的统计描述,2020/8/7,患病率可分为“点”患病率和“期间”患病率。“点”患病率在理论上是无长度的,实际调查不可能无长度,但要尽可能缩短观察时间,一般以不超出一个月为宜。“期间”患病率是按一段时间计算患病率,通常以一年为观察期。 (2)用途 患病率的统计对病程短的疾病价值不大,一般用于病程长的慢性病,如心血管疾病、肿瘤。,第四节 分类资料的统计描述,2020/8/7,(3)影响患病率升高、降低的原因 A影响患病率升高的原因: 病程延长 未治愈者的寿命延长 新病例增

27、加(即发病率增高) 病例迁入 健康者迁出 诊断水平提高 报告率提高,第四节 分类资料的统计描述,2020/8/7,B影响患病率降低的原因: 病死率高 新病例减少(即发病率下降) 健康者迁入 病例迁出,第四节 分类资料的统计描述,2020/8/7,(4)患病率与发病率、病程的关系 发病率的高低和病程的长短都对患病率水平产生影响。三者的关系可近似地表达为: 患病率=发病率病程 例如,在致死疾病中,即使发病率不变,随着医疗水平提高或诊断水平提高,病人存活时间延长(病程长),患病率也可能上升。这时,患病率高是好事。,第四节 分类资料的统计描述,2020/8/7,在非致死疾病中,假如发病率不变,随着医疗

28、水平提高或诊断水平提高,病人治愈所需的时间缩短(病程缩短),患病率降低。这时,患病率低是好事。如肺结核病,在相同发病率水平情况下,能否得到彻底治疗会影响患病率的高低。 思考题:发病率与患病率有何区别?,第四节 分类资料的统计描述,2020/8/7,构成比(Proportion)又称构成指标,说明一事物内部各个组成部分所占的比重或分布,常以百分数表示,又称百分比。,(二)构成比,第四节 分类资料的统计描述,2020/8/7,某地2000年5种慢性疾病的构成,第四节 分类资料的统计描述,2020/8/7,1999年中国农村死亡原因构成 (%),第四节 分类资料的统计描述,2020/8/7,构成比两

29、个特点: 1)一组构成比之和等于或; 2)某部分构成增加或减少,则其它部分构成就相应减少或增加。,第四节 分类资料的统计描述,2020/8/7,某医院1980年与1982年各科病床情况 科别 1980年 1982年 病床数 构成比 病床数 构成比 内科 200 50.0 300 60.0 外科 100 25.0 100 20.0 儿科 100 25.0 100 20.0 合计 400 100.0 500 100.0,2020/8/7,(三)相对比(Ratio) 相对比是A、B两个有关指标之比,说明A是B的多少倍或百分之几。 A与B的性质可以相同,也可以不同。可以是绝对数也可以是相对数或平均数。

30、 人口密度、性比例、医护比,医技比,2020/8/7,第四节 分类资料的统计描述,2020/8/7,1、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳定,不可靠,容易产生误解。,临床资料至少30例才好计算率 动物实验10例也可以计算率!,(四)应用相对数的注意事项,2020/8/7,2、构成比不能代替率(分析时不能以比代率 ),在实际应用中经常出现以构成比代替率进行分析的错误。,有下表资料,年龄(岁)0 102030405060 70 合计 沙眼人数 47 198 330 198 128 80 38 8 1027 % 4.6 19.3 32.1 19.3 12.4 3.7 7.8 0

31、.8 100.0,第四节 分类资料的统计描述,2020/8/7,犯了以比代率的错误,某文章作者根据上述资料认为,沙眼在20组的患病率最高,以后随年龄增大而减少。,要想得到这一结论,应如何做?,第四节 分类资料的统计描述,2020/8/7,3、正确计算合计率(总率) 对观察单位数不等的几个率,不能直接相加求平均率 正确的方法:总的发生数除以总的观察单位数。,第四节 分类资料的统计描述,2020/8/7,某医院各科的病死率 科别 患者数 死亡数 病死率(%) 外 科 1500 180 12.0 内 科 500 20 4.0 传染科 400 24 6.0 合计 2400 224 7.3 (12.0+

32、4.0+6.0)/3100%=7.3%,平均率=224/2400100%=9.3%,2020/8/7,决定率(或构成比)大小的因素很多,除所研究的因素外,尚有许多重要的影响因素;两个或两个以上的率(构成比)相比较时,其他重要的影响因素要相同或相近(即所谓的具有可比性),否则就不能直接对率进行比较。一般的,两个地方的出生率、死亡率、发病率,不同级别医院某病的治愈率等不能直接比较。,4、注意资料的可比性,2020/8/7,率(或构成比)的比较是否具有可比性,通常注意以下两个方面: (1)观察对象同质,研究方法相同,观察时间相等,以及研究对象所处的地区、民族、职业、生活条件和习惯要一致;影响率的其它

33、因素在各对比组的内部构成是否相同。 (2)同一地区不同时期资料的相对数比较,应注意条件有无变化。,第四节 分类资料的统计描述,2020/8/7,甲乙两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 三甲医院 二甲医院 结转移 病例数 构成 生存数 生存率 病例数 构成 生存数 生存率 无 45 6.0 35 77.77 300 16.3 215 71.67 有 710 94.0 450 63.38 83 83.7 42 50.60 合计 755 100.0 485 64.24 383 100.0 257 67.10,不能直接比较两院总的生存率(应标化后再比),第四节 分类资料的统计描述,2020

34、/8/7,5、率或构成比的比较要遵循随机抽样的原则,要做假设检验。,即两组或多组率比较,要作假设检验再下结论。,第四节 分类资料的统计描述,2020/8/7,二、 率的标准化法,第四节 分类资料的统计描述,2020/8/7,甲乙两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 省医院 市医院 结转移 病例数 构成 生存数 生存率 病例数 构成 生存数 生存率 无 45 6.0 35 77.77 300 16.3 215 71.67 有 710 94.0 450 63.38 83 83.7 42 50.60 合计 755 100.0 485 64.24 383 100.0 257 67.10,不能

35、直接比较两院总的生存率(应标化后再比),第四节 分类资料的统计描述,2020/8/7,(一)标准化法的意义和基本思想 率的标准化:是指在比较两个或多个总率时,采用一个共同的内部构成标准,将两个或多个样本不同的内部 部构成调整为相同的内部构成,以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。采用标准化方法计算得到的率简称标化率,又调整率。,第四节 分类资料的统计描述,2020/8/7,基本思想:采用统一的标准内部构成(年龄、性别),在相同的内部构成条件下,计算预期的发生率(死亡率); 目的:消除因内部构成不同对总率产生的影响,使标化率具有可比性。,第四节 分类资料的统计描述,2

36、020/8/7,(二)标准化率的计算步骤,1、选择直接法或间接法 直接法:已知内部各组的率时选用; 间接法:已知各年龄组的人口数和总死亡数时选用。 2、选择标准 直接法:选择标准的人口数; 间接法:选择标准的死亡率或患病率 3、按公式计算标化率,2020/8/7,标准人口选择方法: (1)择有代表性的、较稳定的、数量较大的人群,如全世界的、全国的、全省的、本地区的历年人口数; (2)选择相互比较的人群合并做标准; (3)选择相互比较的人群某一组做标准。,相互比较时,标准要相同。例如,国际间的比较要采用世界通用的标准。,第四节 分类资料的统计描述,2020/8/7,(1)直接法计算标化率,当已知

37、被标化组内部各小组的率时(即pi), 采用直接法。,为标准组的人口数,2020/8/7,P代表标准化率,Ni为标准组各个年龄人口数,N为标准组总人口数;pi为被标化组各年龄组的发生率。 Ni pi为预期发生数;Ni/N为标准组年龄构成。注意:不能用Np 求出预期发生数。,第四节 分类资料的统计描述,2020/8/7,已知内部各分率,可用直接法,甲乙两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 省医院 市医院 结转移 病例数 生存数 生存率 病例数 生存数 生存率 无 45 35 77.77 300 215 71.67 有 710 450 63.38 83 42 50.60 合计 755 48

38、5 64.24 383 257 67.10,第四节 分类资料的统计描述,2020/8/7,两组合并为标准,1)用标准人数计算,2020/8/7,甲医院标化率= 100%,预期生存总数,标准病人总数,= 100%,770.9,1138,=67.74%,乙医院标化率= 100% =56.99%,1138,648.5,第四节 分类资料的统计描述,2020/8/7,2)用标准人口构成计算,345/1138=0.3032 793/1138=0.6968,2020/8/7,2)间接法计算标化率,P为标准组总死亡率(发生率),Pi为标准组各年龄组死亡率(发生率),r为被标化组实际死亡数(发生数),r/niP

39、i为被标化组实际死亡数与预期死亡数之比,称为标准化死亡比,用SMR(standardized mortality ratio)表示。,2020/8/7,若SMR1,说明被标化组人群死亡率高于标准组;若SMR1, 说明被标化组人群死亡率低于标准组。SMR1,被标化组人群死亡率等于标准组,间接法由于内部构成没有进行调整,故两个间接法标准化率不能直接比较,只能通过SMR与标准组比较,第四节 分类资料的统计描述,2020/8/7,例 2-20 用间接法计算标准化率,已知两医院治疗各种病型的人数以及总的生存人数:485人和257人。不知各种病型的五年生存率,则只能用间接法。,查阅文献所得,2020/8/7,省医院SSR1,说明其生存率高于标准组;市医院SSR1,说明其生存率低于标准组。,第四节 分类资料的统计描述,2020/8/7,(三)应用标准化率注意事项,、是否需要标化?(1)比较总率;(2)内部构成:相同:不用;不同:必须,2、能否标化?当各年龄组的率出现明显交叉时,宜直接比较各年龄组的发生率,而不宜用标准化法。,2020/8/7,甲乙两厂某工种某病患病率 工龄 甲 厂 乙 厂 (年)工人数 患者数 患病率(%)工人数 患者数 患病率(%) 3 400 12 3.0 100 1 1.0 3 100 10 10.0 400 72 18.0 合计 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论