《卫生统计学》考试重点复习资料_第1页
《卫生统计学》考试重点复习资料_第2页
《卫生统计学》考试重点复习资料_第3页
《卫生统计学》考试重点复习资料_第4页
《卫生统计学》考试重点复习资料_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《卫生统计学》考试重点复习资料卫生统计学是揭示医疗卫生领域客观现象数量特征和规律的重要工具,其核心在于运用统计学的原理和方法解决实际问题。本复习资料旨在梳理课程核心知识点,帮助同学们巩固基础、明确重点,提升应试能力与应用能力。一、绪论与基本概念(一)卫生统计学的定义与作用卫生统计学是运用统计学的基本原理和方法,研究居民健康状况、医疗卫生服务以及卫生事业管理中数据的收集、整理、分析和推断的一门应用科学。它为我们认识疾病分布、评价干预措施效果、制定卫生政策提供了科学依据。(二)卫生统计工作的基本步骤1.设计(Design):这是统计工作的首要环节,也是最关键的一步。包括明确研究目的、确定研究对象、选择研究方法(如调查设计、实验设计)、制定观察指标、样本量估计等。良好的设计是保证研究质量的前提。2.收集资料(Collectionofdata):按照设计要求,获取准确、完整的原始数据。资料来源包括经常性资料(如医疗卫生工作记录、报告卡)和专题调查或实验研究资料。3.整理资料(Sortingofdata):对收集到的原始数据进行审核、纠错、分组、汇总,使其系统化、条理化,便于进一步分析。4.分析资料(Analysisofdata):运用统计学方法对整理好的数据进行分析,包括统计描述(用适当的指标和图表展示数据的分布特征)和统计推断(根据样本信息推断总体特征,如参数估计和假设检验)。(三)基本概念1.总体与样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位,用以代表总体。2.同质与变异:同质是指研究对象具有某些相同的性质或特征。变异是指同质个体间的差异,是生物医学数据的基本属性,也是统计学研究的起点。3.变量与资料类型:*变量(Variable):观察对象的某项特征,其取值可以是不同的数值或类别。*资料类型:*定量资料(Quantitativedata):亦称数值变量资料,其变量值是定量的,表现为数值大小,有度量衡单位。可分为离散型(如脉搏次数)和连续型(如身高、体重)。*定性资料(Qualitativedata):亦称分类变量资料,其变量值是定性的,表现为互不相容的类别或属性。可分为无序分类资料(如性别、血型)和有序分类资料(亦称等级资料,如疗效:治愈、好转、无效)。4.概率与频率:概率是描述随机事件发生可能性大小的数值,用P表示,取值范围0≤P≤1。频率是指在n次重复试验中,事件A发生的次数f与总次数n的比值(f/n)。当n足够大时,频率可作为概率的估计值。5.误差:观察值与真实值之差。包括系统误差、随机测量误差和抽样误差。抽样误差是由于抽样引起的样本统计量与总体参数之间的差异,是不可避免的,但有规律可循,是统计推断的基础。6.小概率事件:通常指P≤0.05或P≤0.01的事件,认为在一次试验中几乎不可能发生。这是假设检验的基本思想之一。7.参数与统计量:参数是描述总体特征的指标,如总体均数μ、总体率π。统计量是描述样本特征的指标,如样本均数x̄、样本率p。统计量是参数的估计值。二、资料的收集与整理(一)资料的来源1.经常性资料:日常医疗卫生工作记录(如门诊病历、住院病历、检验报告)、统计报表(如传染病报告卡、死亡报告卡)等。2.专题调查或实验研究资料:根据特定研究目的而专门设计的调查或实验所获得的数据。(二)资料收集的基本要求真实、准确、完整、及时、规范。(三)资料的整理1.审核:检查资料的完整性、准确性和逻辑性。2.分组:将资料按某种特征或标志分成若干组,以显示其分布规律。分组方式有两种:*质量分组:按事物的属性或类别分组,适用于定性资料。*数量分组:按数值大小分组,适用于定量资料。3.汇总:将分组后的资料进行计数或计算,得到各组的观察单位数或统计指标。(四)频数表与频数分布图1.频数表(Frequencytable):将定量资料的变量值按一定顺序分成若干组段,列出各组段的观察单位数(频数)。它可以揭示数据的分布类型和集中趋势、离散趋势。2.频数分布图:是频数表的图形表示,常用直方图(适用于连续型定量资料)、直条图(适用于离散型定量资料或定性资料)等。(五)图表的制作与应用1.统计表:结构包括标题、标目(横标目、纵标目)、线条、数字、备注。制作要求:重点突出、主谓分明、层次清楚、数据准确。2.统计图:常用类型及适用资料:*直方图:表示连续型定量资料的频数分布。*直条图:比较相互独立的指标的大小,分单式和复式。*百分条图/饼图:表示事物内部各组成部分所占的比重。*线图:表示某指标随时间或另一连续变量变化而变化的趋势。*散点图:表示两变量间的相关关系。*箱式图:展示数据的集中趋势、离散趋势和异常值。*统计地图:表示某现象的地域分布。三、数值变量资料的统计描述(一)集中趋势的描述集中趋势指一组数据向某一中心值靠拢的倾向。描述集中趋势的指标称为位置指标。1.算术均数(Arithmeticmean):简称均数。适用于对称分布,特别是正态或近似正态分布资料。计算公式有直接法和加权法。2.几何均数(Geometricmean,G):适用于等比级数资料或对数正态分布资料(如抗体滴度、细菌计数)。3.中位数(Median,M):将一组数据从小到大排列后,位于中间位置的数值。适用于:*偏态分布资料;*两端无确切值或分布不明确的资料;*有序分类资料(等级资料)。4.百分位数(Percentile,Px):是一种位置指标,一个百分位数Px将全部观察值分为两部分,理论上有x%的观察值小于或等于Px,有(100-x)%的观察值大于Px。中位数是P50。百分位数可用于描述数据的分布特征,计算四分位数间距,确定医学参考值范围等。(二)离散趋势的描述离散趋势指一组数据的分散程度或变异程度。1.极差(Range,R):亦称全距,即最大值与最小值之差。简单但不稳定,易受极端值影响,不能反映中间数据的变异情况。2.四分位数间距(Interquartilerange,IQR):即P75-P25。适用于偏态分布资料,比极差稳定。3.方差(Variance,σ²或S²):反映每个数据与均数的平均离散程度。总体方差σ²,样本方差S²。4.标准差(Standarddeviation,σ或S):方差的平方根。其量纲与原变量相同,更便于实际应用。适用于对称分布,特别是正态分布资料。5.变异系数(Coefficientofvariation,CV):标准差与均数之比,用百分数表示。适用于:*比较均数相差悬殊的几组资料的变异程度;*比较量纲不同的几组资料的变异程度。(三)正态分布及其应用1.正态分布(Normaldistribution):是一种重要的连续型分布。其特征为以均数为中心,左右对称,呈钟形曲线。有两个参数:均数μ(位置参数)和标准差σ(形状参数)。标准正态分布是μ=0,σ=1的正态分布。2.正态分布的应用:*估计频数分布:根据正态曲线下面积的规律(如μ±1.96σ范围内面积占95%)。*制定医学参考值范围:如95%参考值范围。*质量控制。*许多统计方法基于正态分布原理。(四)医学参考值范围的制定1.概念:指绝大多数(如95%、99%)正常人的某项指标值所在的范围。2.制定方法:*正态分布法:适用于正态或近似正态分布资料。公式:x̄±uα/2S。*百分位数法:适用于偏态分布资料、两端无确切值资料。公式:P2.5~P97.5(95%双侧)。3.注意事项:确定“正常人”标准、足够的样本量、单双侧的选择、适当的百分界限。四、分类变量资料的统计描述(一)常用相对数相对数是两个有联系的指标之比,用以说明事物的相对关系。1.率(Rate):表示某现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,说明某现象发生的频率或强度。如发病率、患病率、死亡率。2.构成比(Proportion):表示事物内部某一组成部分的观察单位数与该事物各组成部分的总观察单位数之比,说明某一事物内部各组成部分所占的比重或分布。构成比之和为100%。3.相对比(Relativeratio):是两个有关指标之比,说明一个指标是另一个指标的几倍或几分之几。如男女性别比、OR值、RR值。(二)应用相对数的注意事项1.计算相对数应有足够的观察单位数(分母不宜过小)。2.不能以构成比代替率。3.计算合计率(平均率)时,不能直接将各组率相加求平均,而应使用加权平均法。4.相对数比较时,应注意资料的可比性(研究对象同质、研究方法相同、观察时间相等、地区、民族等其他影响因素一致或已作调整)。5.对样本相对数的比较应作假设检验。(三)率的标准化法1.概念:当比较两个或多个总率时,若其内部构成(如年龄、性别、病情轻重等)不同,且这些内部构成因素对率有影响,则需采用统一的标准进行调整,消除内部构成不同的影响,使率具有可比性,这种方法称为率的标准化法,调整后的率称为标准化率或标化率。2.基本思想:采用统一的“标准人口构成”,以消除因内部构成不同对总率比较带来的影响。3.标准的选择:可以是各组资料的合并人口数或合并率、其中一组的人口数或率、或标准人口构成。4.计算方法:直接法(已知各组的年龄别(或其他分组)率时用)和间接法(已知各组的死亡总数和各年龄别人口数,缺乏年龄别死亡率时用)。五、总体均数的估计与假设检验(一)均数的抽样误差与标准误1.均数的抽样误差:由抽样引起的样本均数与总体均数之间的差异,以及样本均数之间的差异。2.标准误(Standarderror,SE):样本均数的标准差,是描述均数抽样误差大小的指标。计算公式:σ_x̄=σ/√n,实际工作中用S_x̄=S/√n估计。标准误越大,抽样误差越大,用样本均数估计总体均数的可靠性越差。(二)t分布1.概念:在正态总体中随机抽样,若样本含量较小(n较小),则t=(x̄-μ)/S_x̄服从自由度ν=n-1的t分布。2.t分布的特征:以0为中心的对称分布;自由度ν越小,t分布曲线峰越低,尾部翘得越高;随着ν增大,t分布逐渐逼近标准正态分布;t分布曲线下面积有t界值表可用。(三)总体均数的置信区间估计置信区间(Confidenceinterval,CI):按一定的概率(1-α)估计总体均数所在的范围。常用95%置信区间。1.σ未知且n较小:用t分布法。公式:x̄±tα/2,νS_x̄。2.σ已知或n较大:用u分布法。公式:x̄±uα/2S_x̄(σ未知但n较大时,tα/2,ν≈uα/2)。3.置信区间的意义:从总体中作多次随机抽样,每个样本可算得一个置信区间,以95%置信区间为例,平均有95%的置信区间包含总体均数,5%不包含。(四)假设检验的基本思想与步骤1.基本思想:小概率反证法思想。首先对总体参数或分布作出某种假设(H0),然后用适当的统计方法计算某检验统计量,根据该统计量的抽样分布规律,确定P值(H0成立的条件下,获得现有及更极端检验结果的概率)。若P≤α(小概率事件),则拒绝H0,接受H1(备择假设);否则,不拒绝H0。2.基本步骤:*建立检验假设,确定检验水准:*H0(无效假设):总体参数相等或总体分布相同。*H1(备择假设):总体参数不等或总体分布不同(有单侧和双侧之分)。*α(检验水准,显著性水准):通常取0.05。*选择适当的检验方法,计算检验统计量:根据资料类型、设计方案、样本量大小等选择。*确定P值,作出统计推断:将计算得到的检验统计量与相应的界值比较,或直接计算P值。若P≤α,则拒绝H0,接受H1,认为差异有统计学意义;若P>α,则不拒绝H0,认为差异无统计学意义。(五)t检验t检验的应用条件:①资料为定量资料;②资料服从正态分布或近似正态分布;③两独立样本比较时,要求两总体方差齐同(方差齐性检验)。1.单样本t检验:目的是推断样本所代表的未知总体均数μ与已知总体均数μ0是否有差别。2.配对t检验:适用于配对设计资料,目的是推断配对差值的总体均数是否为0。配对设计形式:自身配对、异体配对。3.两独立样本t检验(成组t检验):适用于完全随机设计的两样本均数比较,目的是推断两样本所来自的总体均数是否相等。若方差不齐,则可采用t'检验、变量变换或非参数检验。(六)Ⅰ型错误与Ⅱ型错误1.Ⅰ型错误(TypeⅠerror):拒绝了实际上成立的H0,犯假阳性错误。其概率为α。2.Ⅱ型错误(TypeⅡerror):不拒绝实际上不成立的H0,犯假阴性错误。其概率为β。3.检验效能(Poweroftest):即1-β,指当H1为真时,假设检验能够拒绝H0的能力。(七)假设检验的注意事项1.要有严密的研究设计,保证组间的可比性。2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论