




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、社区人群健康研究的统计学方法 杨双波流行病与卫生统计学教研室1 统计学是一门运用概率论和数理统计的基本原理研究数据收集、整理和分析的方法学,医学统计学方法是统计学在医学领域中的应用。2社区预防医学 第四篇 社区人群健康研究的统计学方法 北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4% 别的医院,其他大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?为什么要学医学统计学?3社区预防医学 第四篇 社区人群健康研究的统计学方法 北京某医院有位老大夫,用“冠心灵”治疗冠心
2、病,其对照组用西药,观察结果如下表: 表1-1 冠心灵与单纯西药疗效对比 试验用药 显效 有效 无效 合计 单纯西药 9 25 6 40 冠 心 灵 19 18 5 42冠心灵是否比单纯西药有效?4社区预防医学 第四篇 社区人群健康研究的统计学方法 某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为3周左右。问此药治疗玫瑰糠疹的确有效吗? 由于玫瑰糠疹具有自然治愈的情况 ,一般不服药,多喝水,到3周左右有些患者也会自愈。 此药的78疗效有待探讨 !5社区预防医学 第四篇 社区人群健康研究的统计学方法 2.科学研究离不开统计设计与分析3.阅读科技文献需要统计学知识4.统计分
3、析是撰写科研论文的重要甚至是必要内容之一医学统计学的意义7社区预防医学 第四篇 社区人群健康研究的统计学方法 统计学的基本概念与步骤 数值变量资料的统计描述分类变量资料的统计描述主要学习内容(9学时)8社区预防医学 第四篇 社区人群健康研究的统计学方法 统计学的基本概念一、同质和变异三、参数与统计量五、变量 七、频率与概率二、总体与样本四、随机六、误差10社区预防医学 第四篇 社区人群健康研究的统计学方法 同质:同长沙市、同7岁、同男孩、同无影响身高的疾病。例:研究长沙市2009年7岁男孩身高的正常值范围?变异:长沙市2009年7岁男孩身高有高有矮11社区预防医学 第四篇 社区人群健康研究的统
4、计学方法 统计学研究的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。12社区预防医学 第四篇 社区人群健康研究的统计学方法 观察单位:一个人变量:红细胞数同质:同某地、同2002年、同成年男子、 同正常。 总体:1)某地所有的正常成年男子 2)某地所有的正常成年男子的 红细胞数例:调查某地2002年正常成年男子的红细胞数的正常值范围14社区预防医学 第四篇 社区人群健康研究的统计学方法 样本: 是指从总体中随机抽取部分观察单位某项观察值的集合。 由于直接研究总体通常是不可能的,故一般采用抽样研究。 抽样必须遵循随机化原则。15社区预防医学 第四篇
5、 社区人群健康研究的统计学方法 为什么要样本?没法找到总体中每个观察单位需要花费大量的人力、物力财力和时间有些研究具有破坏性,只能研究从总体中抽取的一部分观察单位17社区预防医学 第四篇 社区人群健康研究的统计学方法 根据总体中全部个体值(分布特征)计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数、总体率等。总体参数一般是不知道的参数:统计量:根据样本中个体值计算出来的描述样本特征的指标。统计量用拉丁字母表示,如样本均数x、样本率p。 18社区预防医学 第四篇 社区人群健康研究的统计学方法 统计学的分析思路总体抽样研究统计推断 统计学研究的目的就是要用样本统计量推断总体参数样本
6、19社区预防医学 第四篇 社区人群健康研究的统计学方法 随机:简单随机抽样分层抽样整群抽样等距抽样(机械抽样)就是总体中每一个观察单位都有相等的机会被抽取到样本中来的原则。20社区预防医学 第四篇 社区人群健康研究的统计学方法 单纯随机抽样(简单随机抽样)最简单、最基本的抽样方法从总体N个对象中,利用抽签或其他随机方法抽取n个总体中每个对象被抽到的概率相等21社区预防医学 第四篇 社区人群健康研究的统计学方法 22社区预防医学 第四篇 社区人群健康研究的统计学方法 24社区预防医学 第四篇 社区人群健康研究的统计学方法 整群抽样 将总体分成若干群组,抽取其中部分群组作为观察单位组成样本分类单纯
7、整群抽样 被抽到的群组中的全部个体均作为调查对象二阶段抽样 通过再次抽样后调查部分个体 25社区预防医学 第四篇 社区人群健康研究的统计学方法 分层抽样 将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类按比例分配分层随机抽样:各层内抽样比例相同最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大 27社区预防医学 第四篇 社区人群健康研究的统计学方法 28社区预防医学 第四篇 社区人群健康研究的统计学方法 多级抽样 将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,在大型流行病学调查中常用。
8、方法从总体中抽取范围较大的单元(一级抽样)从一级单元中抽取范围较小的单元(二级抽样)依此类推29社区预防医学 第四篇 社区人群健康研究的统计学方法 在收集医学研究的资料时,首先要根据研究目的确定观察单位,然后对观察单位的某个特征变量进行观察或测定。观察结果或测定值称为变量值。30社区预防医学 第四篇 社区人群健康研究的统计学方法 变量: 指观察单位的某种特征。能够反应观察单位的变异性。如:性别、身高、体重、红细胞计数等变量值(或观察值): 对变量的测量的具体数值大小。资料:由变量值构成。31社区预防医学 第四篇 社区人群健康研究的统计学方法 变量分为 数值变量 计量资料 分类变量 两分类 计数
9、资料 多分类 无序分类 有序分类 等级资料32社区预防医学 第四篇 社区人群健康研究的统计学方法 数值变量 其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。所得的资料称为计量资料。33社区预防医学 第四篇 社区人群健康研究的统计学方法 分类变量 其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组,然后汇总各组个数所得到的数值。34社区预防医学 第四篇 社区人群健康研究的统计学方法 1.无序分类变量 二项分类变量 多项分类变量 无序分类变量构成的资料称为计数资料。2.有序分类变量(多项分类变量) 有序分类变量构成的资料称为等级资料。35社区预防医学 第四篇 社区人群健
10、康研究的统计学方法 资料的相互转化计量 计数 (xa “+”; xR甲= R丙 乙组的变异度最大,甲组与丙组谁的变异度大呢? 极差不能说明。99社区预防医学 第四篇 社区人群健康研究的统计学方法 2.四分位数 (quartile)间距:包括中间50%的变量值。 Q=QU-QL=P75-P25 特点:较稳定,但仍未考虑倒每个观察值的变异度。它常用于反映偏态分布资料的离散程度。100社区预防医学 第四篇 社区人群健康研究的统计学方法 3.方差(variance)和标准差(standard deviation)方差和标准差的含义R甲= R丙 =8,但可以看出,甲组的变异程度较丙组的大,极差不能反映出
11、。因此,应全面考虑每个变量值的离散情况。 先就总体而言:离均差:(x-) 的绝对值越大,说明资料越分散,但由于:(x-)=0 不能反映变异程度的大小离均差平方和:(x-)2 该值越大,说明变异程度越大。但它还受变量值个数N的影响。101社区预防医学 第四篇 社区人群健康研究的统计学方法 离均差平方和的均方: 2= (x- )2 总体方差标准差 = (x- )2 总体标准差 由于变异度越大,则2越大,故越大,说明个体变异越大,均数的代表性就越差。NN102社区预防医学 第四篇 社区人群健康研究的统计学方法 计算 实际工作中,经常得到的是样本资料,是未知的,只能用X来估计。若用 (x-x)2 (x
12、- )2 ,n N。对样本来讲由于(x-x)2 (x- )2 按前面的公式计算的2和比实际的2和偏小。英国统计学家W.S.Gosset用(n-1)代替n进行校正。自由度:= (n-1)103社区预防医学 第四篇 社区人群健康研究的统计学方法 s2=(x-x)2 样本方差s = (x-x)2 样本标准差s = x2-(x)2/n 用于小样本s = fx2-(fx)2/f 用于大样本n-1n-1n-1f-1104社区预防医学 第四篇 社区人群健康研究的统计学方法 例:甲组 26 28 30 32 34 X甲=30 R甲= 8 乙组 24 27 30 33 36 X乙=30 R乙=12 丙组 26
13、29 30 31 34 X丙=30 R丙= 8s = (x-x)2s甲=(26-30)2+(28-30)2+(30-30)2+(32-30)2+(34-30)2/4=3.16s丙=(26-30)2+(29-30)2+(30-30)2+(31-30)2+(34-30)2/4=2.92 n-1105社区预防医学 第四篇 社区人群健康研究的统计学方法 例: s = fx2- (fx)2/ f = 2666824-(18600)2/130 = 6.58(cm)f-1130-1106社区预防医学 第四篇 社区人群健康研究的统计学方法 标准差的应用用于反映正态分布资料的变异程度,S越大,变异程度越大,均数
14、的代表性越差。与均数结合,用于描述正态分布的特征,估计频数的分布用于估计医学参考值范围用于计算变异系数用于计算标准误,标准误与均数结合用于均数的假设检验和参数的估计。107社区预防医学 第四篇 社区人群健康研究的统计学方法 4.变异系数(Coefficient of Variation, CV) CV(%)= S 100%应用:比较度量衡单位不同的多组资料的变异度比较均数相差悬殊的多组资料的变异度x108社区预防医学 第四篇 社区人群健康研究的统计学方法 例:某地7岁男孩身高均数为123.10cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg,试比较身高与体重的变异程度
15、。身高: CV(%)=4.71/123.10100%=3.83%体重: CV(%)=2.26/22.29100%=10.14%109社区预防医学 第四篇 社区人群健康研究的统计学方法 应用离散趋势指标的注意事项1.极差适合于任意分布的资料,用于资料的粗略描述。四分位数间距常用于描述偏态分布以及一段或两无确切数值资料的离散趋势。2.方差和标准差属同类资料,适合与正态分布或近似正态分布的资料,但两者的度量衡单位不同,标准差与原始数据的度量衡单位相同,方差的度量衡单位是原始数据的度量衡单位的平方。3.变异系数适合于正态分布或者近似正态分布的资料,主要用于均数相差较大或度量衡单位不同的观测值变异程度的
16、比较。110社区预防医学 第四篇 社区人群健康研究的统计学方法 1.反映定量资料平均水平的指标是A.频数 B.参数 C.百分位数 D.平均数 E.统计量2.( )分布的资料,均数等于中位数A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 3.描述偏态分布资料的变异程度,以()较好A.极差 B.四分位数间距 C.方差 D.标准差 E.平均偏差111社区预防医学 第四篇 社区人群健康研究的统计学方法 分类变量资料的统计描述第三讲112社区预防医学 第四篇 社区人群健康研究的统计学方法 什么是分类变量资料?用什么指标进行描述?例:甲、乙两地发生麻疹流行,甲地患儿100人,
17、乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%用相对数能较好地反映分类变量资料的特征。113社区预防医学 第四篇 社区人群健康研究的统计学方法 一、常用相对数二、应用相对数时的注意事项三、率的标准化法114社区预防医学 第四篇 社区人群健康研究的统计学方法 一、相对数相对数:是两个有关联的数值或指标之比。常用的相对数有:率构成比相对比115社区预防医学 第四篇 社区人群健康研究的统计学方法 率(rate)率:是指在一定观察时间内,某现象实际发生数与可能发生该现象的总数之
18、比,用以说明某现象发生的频率或强度。K为比例基数,如100%、1000等。比例基数的选择主要依习惯而定或使计算结果能保留12位整数。 116社区预防医学 第四篇 社区人群健康研究的统计学方法 构成比(constituent ratio) 构成比:是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。常用百分数表示,故又称百分比。117社区预防医学 第四篇 社区人群健康研究的统计学方法 各部分构成比之和为100%。此消彼长。构成比的两个特点:118社区预防医学 第四篇 社区人群健康研究的统计学方法 例 2001年对某地中小学学生进行Hb
19、sAg检查,结果见下表,试计算各级学生HbsAg检出率及阳性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。 学 生检查人数阳性人数检出率(%)阳性构成比(%)小学生66060.915.41初中生1115494.3944.14高中生1563563.5850.45合 计33381113.33100.00119社区预防医学 第四篇 社区人群健康研究的统计学方法 相对比相对比:指两个有关指标之比,说明两个指标的比例关系。两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。 120社区预防医学 第四篇 社区人群健康研究的统计学方法 例 某地2003-2005年
20、不同性别新生儿数见下表,试计算该地不同年份新生儿性别比。 121社区预防医学 第四篇 社区人群健康研究的统计学方法 二、应用相对数的注意事项计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率对率和构成比进行比较时,应注意资料的可比性 率的标准化 样本率或构成比进行比较时要作假设检验 。122社区预防医学 第四篇 社区人群健康研究的统计学方法 如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为3/5100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果是不稳定的。在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的
21、相对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总体率的置信区间。123社区预防医学 第四篇 社区人群健康研究的统计学方法 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,得以下资料,据此得出结论:“母亲年龄在2429岁时,畸形儿最多,占总数的92.2%,表明该年龄段易发生畸形儿,符合一般规律”。试分析该结论是否合理?某地畸形儿与母亲分娩年龄的关系124社区预防医学 第四篇 社区人群健康研究的统计学方法 学 生检查人数阳性人数检出率(%)阳性构成比(%)小学生66060.915.41初中生1115494.3944.14高中生1563563
22、.5850.45合 计33381113.33100.002001年某地中小学学生HBsAg检出率及构成比125社区预防医学 第四篇 社区人群健康研究的统计学方法 在进行率或构成比比较时,除了要比较的因素外,其他影响的因素应基本一致。例如,分析比较两医院病死率的时,应注意两个医院的条件应基本相同,如果上级医院的病死率高于基层医院的病死率,并不能说明上级医院医疗水平不如基层医院,这是因为许多疑难病人均由基层医院转入上级医院所致。 126社区预防医学 第四篇 社区人群健康研究的统计学方法 当比较两个总率时,若其内部构成不同,需要进行率的标准化。 127社区预防医学 第四篇 社区人群健康研究的统计学方
23、法 率的标准化128社区预防医学 第四篇 社区人群健康研究的统计学方法 在进行两个内部构成不同的总率比较时,采用统一的标准进行校正,然后计算校正后的标准化率,再进行比较的方法称为率的标准化法。三、率的标准化法129社区预防医学 第四篇 社区人群健康研究的统计学方法 计算标准化率时,首先要选定一个比较的“标准”。 如,对年龄构成进行标化时,可选用全国、全省等大范围人口构成资料作标准,也可将比较组的合并人口或以其中任一组的人口构成作标准。 原则上,选定的标准人口应有代表性、较稳定,容易获得,便于比较。 根据获得的资料和选定的标准不同,标准化法可分为直接法和间接法。130社区预防医学 第四篇 社区人
24、群健康研究的统计学方法 直接法适用情况:已知被标化组各年龄组的实际率Pi,用标准人口数或标准人口构成进行计算。其中 为第i 组标准人口数, 为标准组总人数, 为第i 组的实际率, 为第组标准人口构成。 131社区预防医学 第四篇 社区人群健康研究的统计学方法 甲社区标准化后的患病率 乙社区标准化后的患病率132社区预防医学 第四篇 社区人群健康研究的统计学方法 如根据选定的标准人口构成做标准, 133社区预防医学 第四篇 社区人群健康研究的统计学方法 间接法适用情况:已知被标化组的死亡总数及年龄别人口数,但不知道各年龄组的实际死亡率。标准化死亡比134社区预防医学 第四篇 社区人群健康研究的统
25、计学方法 标准化死亡比:被标化组实际死亡数与预期死亡数之比,称为标准化死亡比(standard mortality ratio),简称为SMR。若SMR1,表示被标化人群的死亡率高于标准组;反之,若SMR1,表示被标化人群的死亡率低于标准组。 135社区预防医学 第四篇 社区人群健康研究的统计学方法 例 某地观察了吸烟者与不吸烟者各年龄组人数如下表,同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。 136社区预防医学 第四篇 社区人群健康研究的统计学方法 吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比 137社区预防医学 第四篇
26、 社区人群健康研究的统计学方法 吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率 138社区预防医学 第四篇 社区人群健康研究的统计学方法 率的标准化应注意的问题 (1)当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较。(2)标准化率只表明各标化组率的相对水平,而不代表其实际水平。(3)两总率各分组对应的率有明显交叉时,则不能用标准化率进行比较。(4)如为抽样研究资料,两样本标准化率的比较也应作假设检验。 139社区预防医学 第四篇 社区人群健康研究的统计学方法 1.某地某年肝炎发病人数占同年传染病人数的 10.1%,这是一种( )指标。 A.率 B.构成比 C.发病率 D.集中趋势 E.时点患病率2.计算某地某年肺癌发病率,其分母应为( )。 A.该地体检人数 B.该地年平均就诊人数 C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群140社区预防医学 第四篇 社区人群健康研究的统计学方法 3.一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列情况( )。 A.该病患病率将增加 B.该病患病率将减少 C.该病发病率将增加 D.该病发病率将减少 E.与患病率和发病率均无关4.在使用相对数时,容易犯的错误是( )。 A.将构成比当作率看待 B.将构成比当作相对比看待 C.将率当作构成比看待 D.将率当作相对比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 了解社交网络平台开发的挑战试题及答案
- 消防滋水考试题及答案解析
- 商业智能与在线学习平台的服务品质优化
- 2025年行业动态与战略试题及答案
- 运营商网络架构与管理试题及答案
- 计算机二级VB考试实战指南试题及答案
- VB语言应用实例研究试题及答案
- 如何打造有效的职业教育数字化教学资源库
- 软件人机交互试题及答案
- 风险管理与决策支持试题及答案
- 顶管施工危险源辨识及风险评价表
- 江苏省扬州市2025届高三第二次模拟考试生物试卷含解析
- 11SG534 带水平段钢斜梯(45°)
- 20232024辽宁大连市西岗区招聘社区工作者24人笔试历年典型考题及考点剖析附带答案详解
- 涂装工考试:中级涂装工考点(三)
- 医院重症监护室感染监控指南
- 2024年高中英语衡水体书法练字字帖
- 融资融券实务
- 人教版二年级下册口算题天天练1000道可打印带答案
- 2022北京东城六年级毕业考英语试题含答案
- 《药物分析与检验技术》课件-异烟肼中游离肼的检查方法
评论
0/150
提交评论