卫生统计学学习指导与习题集_第1页
卫生统计学学习指导与习题集_第2页
卫生统计学学习指导与习题集_第3页
卫生统计学学习指导与习题集_第4页
卫生统计学学习指导与习题集_第5页
免费预览已结束,剩余47页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学学习指导与习题集第一章绪论【教学要求】了解:医学统计学的发展史;统计学与公共卫生的关系。熟悉:统计学习的目标与方法掌握:统计学基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。【重点难点】第一节医学中统计思维的进化第二节统计学与公共卫生互动推动一、统计学是公共卫生专业人员的得力工具公共卫生是群体科学,应用统计探索群体规律。统计抽样技术;设计群体调查,掌握人群的卫生状况和需求;统计描述:反映疾病和卫生资源的分布特征;统计推断:偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。二、现代公共卫生领域对统计学的挑战公共卫生不仅应用统计学,而且不断提出新要求和新问题,是现代统计

2、学研究和发展的巨大功力。第三节统计学的若干概念、总体与样本总体是根据研究目的确定的同质研究对象的全体,按研究对象来源又有目标总体和研究总体。样本是指从研究总体中抽取的一部分有代表性的个体。抽样研究的目的是用样本推断总体。二、同质与变异同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。变异是指同质的个体之间存在的差异。统计学的任务是在变异的背景上描述同一总体的同质性,揭示不同总体的异质性。三、变量的类型分类变量定性变量有序变量变量,.II定量变量定量变量可分为离散型变量和连续型变量。变量类型可以转化:定量一有序一分类一二值。注意转化方向只能由信息量多向信息量少。四、参数与统计量参数是指

3、反映总体特征的统计指标。五、设计与分析统计设计是医药卫生设计科研不可或缺的部分。统计设计包括抽样方法、统计学原则、统计方法数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计1/72和统计分析是不可分割的两项内容。六、因果与联系探究因果关系首先考虑是否存在联系。但存在联系未必有因果联系,因为存在大量的混杂因素。单靠统计学分析大多只能考虑变量之间的联系,难于证明因果联系。第四节目标与方法1、 基本概念方法与技能正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。2、 教与学的方法应用是根本目的,理解概念与动手实践才是根本。要结合生活经验、医学实际来教

4、与学。借助统计学实验理解统计现象与理论,借助案例讨论从反面吸取教训。【补充习题】一、选择题(一)A1题每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。1 .下面的变量中,属于分类变量的是(A.脉搏B.血型C.肺活量2 .下面的变量中,属于定量变量的是(A.性别B.体重C.血型3 .某人记录了50名病人体重的测定结果:20人,大于70kg的17人,此种资料属于(A.定量资料B.分类资料变量资料4 .上述资料可以转换为(C)A.定量资料B.分类资料变量资料B)D.红细胞计数E.血压B)D.职业E.民族A)C.有序资料D.二分类资料E.名义小于50kg的13人,介于50kg和7

5、0kg间的C.有序资料D.二分类资料E.名义5 .若要通过样本作统计推断,样本应是A.总体中典型的一部分C.总体中随机抽取的一部分E.总体中信息明确的一部分6 .统计量(E)A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7 .因果关系(C)A.就是变量间数量上的联系C.必定表现为数量间的联系(C)B.总体中任一部分D.总体中选取的有意义的一部分B.可以用统计方法证明D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型每一道题以一个小案例出现,其下面都有A、B、C

6、、D、E五个备选答案,请从中选择一个最佳答案。1 .教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质2/72炎效果的临床试验。有180万儿童参与,约有1/4参与者得到了随机化。这180万儿童是(C)A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2 .上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对(C)而言。A.180万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题3 .定量变量、分类变量和有序变量可以相互转换。(X)4 .假变量可以参与计算,所以假变量是定量变量。(X)5 .离散变量

7、在数值很大时。单位为“千”或“万”时可以取小数值,此时可接近地视为连续型变量(V)6 .同质的个体间不存在差异。(X)7 .如果个体间有变异,则它们一定不是来自同一总体。(X)第二章定量资料的统计描述【重点难点】3/72第一节频率分布表与频率分布图一、离散型定量变量的频率分布对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。二、连续型定量变量的频率分布对连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变量的频率分布图可用直方图表达

8、。即纵坐标为频率密度,即频率/组距,直方图的面积之和等于1.三、频率分布表(图)的用途频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。第二节描述集中趋势的统计指标对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有3种:算数均数、几何均数和中位数。一、算术均数意义:算术均数简称均数,常用科表示总体均数,恭菱示样本均数。反映全部数量观察值的平均数量水平。适用条件:适用于对称分布资料,尤其

9、正态或近似正态分布资料。计算:1.直接法(基于原始数据).?+?+?+?汇?外=-=?其中,n为样本含量,?+?+?+?3为观察值。8 .频率表法(也叫加权法,基于频率表资料)?=?其中,f为组段的频数,?为组段的中值,?=(组段上限+组段下限)/2。二、几何均数意义:几何均数以符号G表示,常用来反映一组含多个数量级数据的集中位置。适用条件:适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。观察值间常呈倍数关系,或变化范围跨越多个数量级。计算:1.直接法(基于原始数据)?.aEJog?2.频率表法(也称加权法,意义:中位数常用符号G=v????或G=?基于频率表资

10、料)G_?目汇???三、中位数M表示,是指将原始观察值从小到大排序后,位次居中的那个数,即理论上有一半的观察值低于中位数,一般都观察值高于中位数。4/72适用条件:中位数适用于各种分布的资料,特别是偏峰分布资料、分布末端无确定值的资料等。i个数据用??表示。计算:1.直接法(基于原始数据)将n例观察值从小到大排列,第n为奇数时,M=?+1n为偶数时,M=1(?+?+1)9 .百分位数法(基于频率表资料)百分位数常用符号??表示,是排序后的全部实测值的某百等份分割值,即在全部实测值中有x%个体观察值比它小,有1-x%个体观察值比它大。中位数就是一个特定的百分位数,即M=?o。?=L+?:?(n*

11、x%-?)其中L为欲求的百分位数所在组段的下限,i为该组段的组距,??为截止至L的累计频数,?+?为该组段内的频数,n为总频数。四、众数意义:全部实测值中出现次数最多的数值即为众数。第三节描述离散趋势的统计指标同一总体中不同个体存在的差异称为变异。为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。一、极差意义:极差,也称全距。样本量接近的同类资料比较,极差越大意味着数据间变异越大。极差只考虑数据的最大值和最小值,所以用极差反映数据的变异程度常常比较粗略和不稳定。计算:R=最大值一最小

12、值适用条件:资料不限。二、四分位数间距意义:四分位数间距表示百分位数??5和百分位数??5之差,理论上??5与??5之间恰好包括总体中间50%的个体观察值。同类资料比较,Q越大意味着数据间变异越大。用四分位数间距反映数据的变异程度比极差稳定。计算:Q=?5?5其中,?为和??5的求法参见前述百分位数求法。适用条件:四分位数间距可用于各种分布资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。三、方差意义:方差考虑了全部观察值的变异程度。总体方差用?3表示,定义为观察值离均差平方和的算术均数;样本方差用?表示,是总体方差的无偏估计。同类资料比较时,方差越大意味

13、着数据间变异度越大。计算:总体方差?5/7242工2(X-?7)样本万差?=?7T-20,其潜伏期的平均为(B)天。A.9B.9.5C.10D.10.2E.112 .已知某地一群7岁男童身高均数为100cm,标准差为5cm;体重均数为20kg,标准差为3kg,则身高和体重的变异程度有(C)A.身高的变异程度大于体重的变异程度B.身高的变异程度等于体重的变异程度C.身高的变异程度小于体重的变异程度D.身高的变异程度与体重的变异程度之比为5:3E.因单位不同,无法比较3 .测定10名正常人的脉搏(次/分),结果为68,79,75,74,80,79,71,75,73,84.则10名正常人的脉搏标准差

14、为(B)A.4.73B.22.4C.75.8D.75.0E.1.504 .测定5人的血清滴度为1:2,1:4,1:16,1:32,则5人血清滴度的平均水平为(D)A.1:4B.1:8C.1:11.6D.1:6.96E.1:165 .测得200名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不正确的是(E)A.可用频率表法计算均数B.可用直接法计算均数C.可用直接法计算标准差D.可用加权法计算标准差E.可用直条图表本频率分布图(三)A3/A4型以下提供若干案例,每个案例下设若干道题目。请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。

15、(第12题共用题干)调查测定某地107名正常人尿铅含量(mg/L)如下:尿铅含量0481216.202428合计例数14222918156121071 .描述该资料的集中趋势,宜用(B)。A.均数B.中位数C.几何均数D.众数E.极差2 .描述该资料的离散趋势,宜用(C)。A.极差B.方差C.四分位数间距D.标准差E.变异系数7/72(四)B1型以下提供若干组题目,每一组题目前列出A、B、C、D、E五个备选答案,请从中为每一道题目选择一个最佳答案。某个备选答案可被选择一次、多次或不被选择。(14题共用备选答案)C.标准差A.极差B.四分位数间距D.变异系数E.中位数1 .比较7岁男童与17岁青

16、年身高的变异程度,宜用(D)。2 .描述近似正态分布资料个体观察值的离散趋势,宜用(C)。3 .描述偏峰分布资料个体观察值的变异程度,宜用(B)。4 .描述分布末端无确定值资料的离散程度,宜用(B)。(58题共用备选答案)E.众数A,中位数B,均数C.几何均数D.极差5 .反映一组等比资料集中趋势的指标,宜用(C)。6 .反映一组偏峰分布资料白平均水平,宜用(A)。7 .样本中出现次数最多的观察值称为(E)。8 .描述近似正态分布资料白集中位置,宜用(B)。第三章定性资料的统计描述【教学要求】掌握:常用相对数指标,相对数应用的注意事项;动态数列及其指标;标准化法的基本思想,直接法的计算及间接法

17、中SMR的意义,标准化法的注意事项。熟悉:医学人口统计和疾病统计中常用指标的意义。【重点难点】第一节三类相对数一、频率与频率分布定性资料经过分类汇总整理的频数表称为频率分布表。定性资料的变量形式有多分类8/72变量和二分类变量,均可以通过频率分布表描述其分布特征。定性资料的分布特征通常可以描述为某一类别的频数在总频数中所占比重。根据研究目的不同定性资料频率分布表的表达形式可以不同,例如可以将某一事物的所有类别的频率列在同一张表中;也可以将某事物的其中一个类别的频率与其他事物相同类别的频率列在同一张表中。二、常用的相对数指标常用相对数有三种,计算公式不同,其意义也不同。表3-1列出常用三种相对数

18、的公式和意义。三、应用相对数应注意的事项1 .理解相对数的含义不可望文生义三种相对数的定义有明确的区别,但在实际应用中,常错误解释相对数的计算结果,尤其,频率型指标和强度型指标常被混淆。对于相对数的统计指标,读者必须认真思考其定义,辨别其性质,切不可望文生义。表3-1常用相对数的公式和意义相对数指标指某现象发生的me发生某现象的观察单位数频率,或事物内部频率x?可能发生某现象的观察单位总数某个组成部分所占的比重或分布某事件发生的观察单位数指单位时间内某强度X?汇(可能发生某事件的观察单位数X时间)现象发生的频率相对比?一X100%?两个有关联的指标A与B之比2 .频率型指标的解释要紧扣总体与属

19、性本实习指导的配套教材的第三章中的表1至表3的数据均属于频率型指标,但由于表达的总体和属性不同,结果的解释亦不同。.3 .计算相对数时分母应有足够数量确保研究结果的稳定性。4 .正确地合并估计频率(或强度)型指标分别合计各组的分子和分母后再计算合计的指标,不可将分组的频率或强度取平均数作为合并的频率或速率。5 .相对数间的比较要具备可比性主要应注意观察的对象是否同质,研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;在被比较的总体之间与研究指标有关的其他因素是否一致或接近。6 .对相对数的统计推断从样本估计值推断总体的相对数也应当考虑抽样误差,需要进行参数估计和假设检验。第二节

20、医学人口统计常用指标一、医学人口统计资料的来源医学人口统计资料的主要来源为日常工作记录(报告单、卡、册)、统计报表和人口调查三个方面,见表3-2。表3-2医学人口统计资料的来源资料来源意义和内容指人口事件发生后有关部门按常规报告制度所做的原始记录,从公安部门、卫生部门、计划生育部门和疾病控制中心均可得到。特别是对出生,吊作录死亡、胎儿死亡等生命事件的法定登记,是研究人口自然变动、推算人口数以及反映人口健康水平的基础资料9/72统计报表是从原始报告单、卡、册上的数据过录整理后的一种汇总表,也可以作为较好的原始记录用于医学人口统计关系较为密切的统计报表有出生统计报表、死因统计报表、妇幼卫生统计报表

21、人口调查根据统计需要和目的,做一些定期或不定期的专项调查。调查的方法通常有普查和抽样调查。其中,人口普查为计算许多人口学指标提供了最基本的人口数资料。抽样调查是对人口问题进行广泛深入的研究,获得内容丰富的资料二、描述人口学特征的常用指标描述人口学特征的常用指标主要指人口总数和人口构成指标,常用指标及其意义列于表3-3。表3-3人口学特征的常用指标及其意义常用指标意义人口总数根据资料整理的特点,人口总数分为时点人口数:一个国家或地区在杲一特定时间的人口数;时期人口数:指某一时期(或某一年)的平均人口数。平均人口数常用作计算出生率、死亡率、发病率等指标的分母人口金字塔是将人口的性别和年龄资料结合起

22、来,以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴,人口构成作为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图。人口金字塔形象直观地反映了现有男女性别人口的年龄构成,而且也可以分析过去人口的出生死亡情况以及今后人口的发展趋势老年人口系数指65岁(或60岁)及以上人口占总人口的比重,用于反映人口是否老化及老化的程度。可作为划分人中t型的尺度少年儿童人口系数:指14岁及以下少年儿童人口占总人口的比重,从另一侧面反映人口老化程度的指标。其大小主要受生育水平的影响负担系数指每100名劳动年龄人口所负担的非劳动年龄人口数,反映了劳动年龄人口与非劳动年龄人口之问的关系。一般以1564岁者为劳动人

23、口,014岁和65岁及以上者为非劳动人口或被抚养人口老少比指65岁及以上老年人口与14岁以下的少年儿童人口之比,表示每100名少年儿童对应多少老年人,是划分人口类型的标准之一性别比指以女性人口为100,男性人口与女性的比值。如果性别比大于100表示男性人口多于女性人口;小于100表示女性人口多于男性人口。常用的有出生性别比、年龄别性别比及全人口性别比。出生性别比一般在104107之间10/72粗出生率总生育率年龄别生育率总和生育率自然增长率粗再生育率净再生育率三、生育和人口死亡的常用指标(一)生育的常用指标测量生育的指标可以分为出生率、生育率和人口再生产三类,其中常用的生育率指标有3个,人口再

24、生产指标有3个,将这些常用指标及其意义列于表3-4。表3.4有关生育的常用指标及其意义常用指标S也称普通出生率。表示某年某地平均每千人口的活产数,是反映一个国家和地区的人口自然变动的基本指标。受人口年龄性别构成的影响也称普通生育率.表示某年某地平均每千名育龄妇女的活产数,它反映育龄妇女总的生育水平。该指标受育龄妇女内部年龄构成的影响表示平均每千名某年龄组育龄妇女的活产数.可以直接比较不同地区的年龄别生育率,但不能概括一个地区的整体生育水平当年龄分组为1岁一组时,将年龄别生育率从15岁累加到49岁止,得到1549岁年龄别生育率的总和,即称总和生育率。若年龄分组为5岁一组时,则年龄别生育率之和再乘5,即得总和生育率。表示每1000名妇女一生平均生多少个孩子,或每个妇女一生平均生多少个孩子。总和生育率是用某年横断面的年龄别生育率资料计算的,因此消除了人口的年龄性别构成对生育水平的影响,不同时间、不同地区的总和生育率可以直接进行比较表示人口自然增长的情况,常被用来粗略的估计人口增长趋势。它的计算为粗出生率(CBR)与粗死亡率(CDR)之差计算与总和生育率极为近似,不同的地方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论