卫生统计学重点知识点考试复习资料_第1页
卫生统计学重点知识点考试复习资料_第2页
卫生统计学重点知识点考试复习资料_第3页
卫生统计学重点知识点考试复习资料_第4页
卫生统计学重点知识点考试复习资料_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学重点知识点考试复习资料卫生统计学是运用统计学原理与方法,研究卫生领域数据的收集、整理、分析及推断的学科,核心在于通过科学的统计设计与分析揭示卫生现象的内在规律。以下从基本概念、资料类型、统计描述、概率分布、统计推断、相关回归及方法选择等维度梳理核心考点,助力高效复习。一、基本概念与研究设计(一)核心概念辨析总体与样本:总体是研究对象的全体(如某地区所有高血压患者),样本是从总体中随机抽取的部分(如随机选取的200例患者),抽样的核心目的是用样本推断总体。同质与变异:同质指研究对象的主要特征一致(如同一地区、同一年龄段的健康人群),变异是同质个体间的差异(如身高、血压的个体差异),变异是统计学研究的基础。变量与资料:变量是观察对象的特征(如年龄、性别),按取值分为三类:数值变量(计量资料):用数值表示,有单位(如身高170cm、体重65kg),可计算均数、标准差等;分类变量(计数资料):用类别表示,无单位(如性别男/女、职业医生/教师),可计算率、构成比;等级变量(等级资料):类别有顺序(如病情轻/中/重、学历小学/中学/大学),兼具计数和计量的部分特征,需用秩和检验等分析。误差类型:系统误差:由固定因素引起(如仪器校准偏差),可通过改进方法消除;随机误差:由偶然因素引起(如测量时的环境波动),不可避免但可通过增加样本量缩小;抽样误差:由抽样引起的样本统计量与总体参数的差异,是随机误差的一种,可用标准误衡量。(二)研究设计要点实验设计四原则:对照:设置对照组(如空白对照、标准对照),排除非处理因素干扰;随机:样本分配或抽样过程随机化,保证组间均衡;重复:足够的样本量(如临床试验需结合效应量、α、β估算样本量),减少偶然误差;均衡:各组除处理因素外,其他因素尽可能一致(如随机区组设计控制混杂因素)。调查设计类型:普查:全面调查(如人口普查),优点是结果全面,缺点是工作量大、易漏查;抽样调查:从总体中抽样(如单纯随机抽样、系统抽样、分层抽样、整群抽样),需注意抽样方法的选择(如分层抽样适合总体异质性大的情况);典型调查:选择典型单位调查(如选某社区研究慢性病管理),结果仅供参考,不能推断总体。二、资料类型与统计图表(一)资料类型区分计量资料:用数值表示,有单位(如身高、血糖),可计算均数、标准差等;计数资料:用类别表示,无单位(如性别、职业),可计算率、构成比;等级资料:类别有顺序(如病情轻/中/重、学历小学/中学/大学),兼具计数和计量的部分特征,需用秩和检验等分析。(二)统计图表应用统计表:结构包括标题(简明说明内容)、标目(横标目:分组;纵标目:指标)、线条(简洁,忌过多)、数字(准确,无空格)、备注(补充说明)。统计图:条图:比较不同组的计数资料(如不同地区的患病率);直方图:展示计量资料的分布(如身高的频数分布);线图:展示随时间变化的趋势(如某病发病率的年度变化);散点图:展示两计量资料的相关关系(如身高与体重的关系);箱式图:展示数据的中位数、四分位数(如不同组的血压分布)。三、统计描述指标(一)集中趋势指标算术均数(ˉx):适用于正态或近似正态分布的计量资料(如正常人群的身高),计算公式:直接法(ˉx=Σx/n)、加权法(ˉx=Σfx/Σf,f为组段频数)。几何均数(G):适用于等比数列或对数正态分布资料(如抗体滴度1:2、1:4、1:8),公式:G=lg⁻¹(Σlgx/n)(直接法)或G=lg⁻¹(Σflgx/Σf)(加权法)。中位数(M):适用于偏态分布、分布不明或含极端值的资料(如肿瘤患者的生存时间),未分组资料:排序后取中间值(n为奇数:M=x_(n+1)/₂;n为偶数:M=(x_n/₂+x_(n/₂+1))/₂);分组资料:M=L+(i/f)(n/2-F_L),L为中位数组下限,i为组距,f为中位数组频数,F_L为前一组累计频数。百分位数(Pₓ):表示某百分位置的数值(如P₂₅、P₇₅、P₉₅),用于描述资料的分布范围(如偏态资料的参考值范围用P₂.₅~P₉₇.₅)。(二)离散趋势指标极差(R):R=最大值-最小值,简单但受极端值影响大,适用于初步分析。四分位数间距(IQR):IQR=P₇₅-P₂₅,反映中间50%数据的变异,适用于偏态资料,比极差稳定。方差(S²)与标准差(S):反映个体变异,适用于正态分布,公式:S²=Σ(x-ˉx)²/(n-1),S=√S²。标准差与均数结合(ˉx±S)描述正态资料的分布。变异系数(CV):CV=(S/ˉx)×100%,用于比较不同量纲或均数悬殊的资料(如身高与体重的变异程度比较)。四、概率分布与抽样分布(一)理论分布正态分布(N(μ,σ²)):特征:对称、钟形曲线,μ为位置参数,σ为变异参数;σ越小,曲线越陡峭。标准正态分布(N(0,1)):通过Z变换(Z=(x-μ)/σ)将正态分布转换为标准正态分布,Z值的绝对值反映偏离均数的程度。应用:参考值范围估计(正态分布用ˉx±1.96S,偏态用P₂.₅~P₉₇.₅);质量控制(如“3σ”原则)。二项分布(B(n,π)):条件:n次独立重复试验,每次成功概率为π(如n次抽样中阳性数的分布)。应用:率的区间估计(n大、π不接近0或1时,用正态近似法:p±Zα/₂×Sₚ,Sₚ=√(p(1-p)/n));假设检验(如两样本率比较的Z检验)。Poisson分布(P(λ)):条件:稀有事件,单位时间/空间内的发生数(如每毫升水中的细菌数),性质:均数λ=方差,具有可加性(如2个独立Poisson分布的和仍为Poisson分布,参数为λ₁+λ₂)。应用:率的区间估计(λ大时用正态近似法:λ±Zα/₂×√λ);假设检验(如两样本Poisson率比较)。(二)抽样分布t分布:条件:小样本(n<50)、正态总体、σ未知,用样本标准差S代替σ。特点:峰低尾高,自由度ν=n-1,ν越小,t分布越扁平;ν→∞时,t分布趋近于标准正态分布。应用:总体均数的置信区间(σ未知时用t界值,如95%置信区间:ˉx±tα/₂,ν×S/√n);t检验。χ²分布:由标准正态变量的平方和构成(如χ²=ΣZᵢ²,Zᵢ~N(0,1)),自由度ν=变量个数,特点:右偏态,ν越大,分布越趋近正态。应用:方差的置信区间;卡方检验(如四格表、行×列表分析)。F分布:由两个独立χ²分布(除以各自自由度)的比值构成(F=(χ₁²/ν₁)/(χ₂²/ν₂)),用于方差分析(比较组间变异与组内变异的比值)。五、统计推断:参数估计与假设检验(一)参数估计点估计:用样本统计量直接估计总体参数(如用ˉx估计μ,用p估计π),优点是简单,缺点是未考虑抽样误差。区间估计:给出参数的可能范围(置信区间),如:总体均数的置信区间:σ已知用Z界值(ˉx±Zα/₂×σ/√n);σ未知用t界值(ˉx±tα/₂,ν×S/√n);大样本(n≥100)也可用Z界值(S代替σ)。总体率的置信区间:正态近似法(n大,np和n(1-p)≥5时,p±Zα/₂×Sₚ);精确概率法(小样本,如n<40或T<5时用Fisher精确检验的思路估计率的区间)。(二)假设检验的基本逻辑1.建立假设:H₀(无效假设,如μ₁=μ₂)和H₁(备择假设,如μ₁≠μ₂或μ₁>μ₂),双侧检验用于探索差异,单侧检验用于验证预期方向的差异。2.确定检验水准:α通常取0.05,即允许犯Ⅰ类错误(拒绝正确H₀)的概率为5%。3.计算检验统计量:根据资料类型和设计选择(如t值、χ²值、F值等)。4.确定P值:P值是H₀成立时,获得当前统计量及更极端结果的概率。5.推断结论:P≤α时,拒绝H₀,认为差异有统计学意义;P>α时,不拒绝H₀,尚不能认为差异有统计学意义。(三)常用假设检验方法t检验:单样本t检验:比较样本均数与已知总体均数(如某地区儿童身高与全国标准的比较)。配对t检验:配对设计(如自身前后对比、配对对象),检验差值的均数是否为0(如服药前后的血压变化)。两独立样本t检验:成组设计,比较两样本均数(如两组患者的疗效评分),条件:正态分布、方差齐(用F检验或Levene检验判断方差齐性,不齐时用t’检验或秩和检验)。方差分析(ANOVA):完全随机设计(单因素):比较多组均数(如不同药物的疗效),条件:正态、方差齐、独立,检验统计量F=组间变异/组内变异。随机区组设计(两因素):控制区组因素(如不同医院为区组),减少误差,检验统计量F处理=处理变异/误差变异,F区组=区组变异/误差变异。多重比较:方差分析拒绝H₀后,需比较具体组间差异(如SNK法、LSD法,避免多次t检验增加Ⅰ类错误)。χ²检验:四格表资料(成组设计):比较两样本率(如两组的发病率),条件:n≥40且T≥5(T为理论频数,T=行合计×列合计/总例数),否则用校正χ²(n≥40但1≤T<5)或Fisher精确检验(n<40或T<1)。配对四格表(McNemar检验):配对设计(如同一批标本的两种检测方法),检验b+c≥40时用χ²=(b-c)²/(b+c),否则用校正公式。行×列表资料:比较多组率或构成比(如不同职业的患病率),注意理论频数太小(1/5以上格子T<5或1个格子T<1)时,需合并组或用Fisher精确检验。非参数检验(秩和检验):适用条件:偏态分布、分布不明、等级资料、方差不齐等。方法:Wilcoxon符号秩检验(配对设计)、Wilcoxon成组秩和检验(两独立样本)、Kruskal-WallisH检验(多独立样本)、FriedmanM检验(随机区组设计)。六、直线相关与回归(一)直线相关相关系数r:反映两计量资料的线性相关方向和密切程度,取值范围[-1,1]。r>0为正相关,r<0为负相关,|r|越接近1,相关越密切;|r|=0为无线性相关(但可能有非线性相关)。假设检验:用t检验(tᵣ=|r|/√((1-r²)/(n-2)))或直接查r界值表,判断相关是否有统计学意义。注意事项:相关分析要求双变量正态分布(Pearson相关),否则用Spearman秩相关;异常点会显著影响r值,需先剔除或验证。(二)直线回归回归方程:ŷ=a+bx,其中a为截距(x=0时的ŷ估计值),b为回归系数(x每增加1单位,y的平均变化量)。回归系数的意义:b>0时,x与y正相关;b<0时,负相关。b的假设检验用t检验(t_b=|b|/S_b,S_b为b的标准误)或方差分析(将总变异分解为回归变异和剩余变异)。相关与回归的联系:r和b同号,r²为决定系数,反映回归平方和占总平方和的比例(如r²=0.6,说明y的变异中60%可由x的变异解释)。七、统计方法的选择与常见误区(一)方法选择思路计量资料:先判断分布(正态性检验,如Shapiro-Wilk检验),正态且方差齐→t检验/方差分析;偏态/方差不齐→秩和检验。计数资料:二分类→χ²检验(成组)或McNemar检验(配对);多分类→行×列表χ²检验;率的比较还可考虑Z检验(大样本)。等级资料:秩和检验(如不同疗效的比较),或有序logistic回归(分析多因素对等级结局的影响)。(二)常见错误规避误用t检验代替方差分析:多组比较时,多次t检验会增加Ⅰ类错误(如3组比较需做3次t检验,α=0.05时,犯错误的概率约为1-(0.95)³≈0.14),应使用方差分析。忽视分布类型:如偏态资料用均数±标准差描述,或用t检验分析,导致结果偏倚。需先做正态性检验,选择合适的统计量(如中位数、四分位数间距)和方法(秩和检验)。样本量不足:小样本导致检验效能(1-β)低,即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论