卫生统计学试题试及答案_第1页
卫生统计学试题试及答案_第2页
卫生统计学试题试及答案_第3页
卫生统计学试题试及答案_第4页
卫生统计学试题试及答案_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学试题试及答案1.单选题(每题2分,共30分)1.1某市疾控中心对10个社区进行饮用水细菌总数监测,测得对数值(lnCFU/mL)分别为:3.12,3.45,3.78,4.01,4.22,4.35,4.48,4.61,4.73,4.85。若用正态分布模型描述该数据,其95%参考值范围的计算式为A.4.06±1.96×0.51B.4.06±2.26×0.51C.4.06±1.96×0.54D.4.06±2.26×0.54E.4.06±1.96×0.49答案:A解析:先求样本均值x̄=4.06,样本标准差s=0.51。n=10,但计算参考值范围时按总体估计,用s代替σ,故95%范围x̄±1.96s。1.2在匹配病例对照研究中,若每个病例匹配一名对照,共200对,其中90对病例暴露而对照未暴露,30对对照暴露而病例未暴露,其余为二者均暴露或均未暴露。则暴露的OR估计值为A.90/30B.30/90C.(90+30)/(200−90−30)D.(90+30)/200E.90/(200−90)答案:A解析:匹配设计只考虑暴露不一致的对子,OR=病例暴露对照未暴露的对子数/对照暴露病例未暴露的对子数=90/30=3.0。1.3下列关于负二项回归的说法,错误的是A.可处理过度离散的计数数据B.其方差函数为μ+αμ²C.当α→0时,模型退化为泊松回归D.回归系数解释与泊松回归完全相同E.可用似然比检验比较负二项与泊松模型答案:D解析:虽然系数解释同为对数发生率比,但负二项回归因引入离散参数,其标准误更大,置信区间与显著性不同于泊松,故“完全相同”错误。1.4某研究欲比较三种消毒剂对手术器械表面细菌杀灭率,采用随机区组设计,每区组为同一批器械分三段,分别接受三种处理。分析该数据应首选A.单因素方差分析B.随机区组方差分析C.析因设计方差分析D.Kruskal-Wallis检验E.卡方检验答案:B解析:随机区组设计需考虑区组与处理两个因素,用随机区组ANOVA可分离区组变异,提高处理比较效率。1.5在生存分析中,若某研究对象在随访至第30个月时失访,此前未发生结局事件,则该对象的生存时间应记为A.30个月,结局事件=1B.30个月,结局事件=0C.删失,不纳入分析D.记为缺失E.按30个月计算,但权重下调答案:B解析:失访对象提供的信息为“至少存活30个月”,属右删失,记time=30,event=0。1.6对同一组高血压患者,分别用A、B两台袖带式电子血压计测量收缩压,欲评价两台仪器的一致性,首选A.Pearson相关B.配对t检验C.Bland-Altman法D.组内相关系数ICC(1,1)E.卡方检验答案:C解析:Bland-Altman图可直观显示系统误差与一致性界限,是设备比对的金标准。1.7某疫苗效力试验,接种组人年数为5000,发病密度为2/1000人年;对照组人年数为5000,发病密度为10/1000人年。则疫苗保护率VE为A.8%B.20%C.50%D.80%E.90%答案:D解析:VE=(1−IRR)×100%=(1−2/10)×100%=80%。1.8在meta分析中,若各研究间异质性检验Q=32.5,df=12,P=0.001,则下一步应A.直接采用固定效应模型B.采用随机效应模型C.剔除样本量最小研究D.放弃meta分析E.改用投票法答案:B解析:P<0.05提示存在显著异质性,应选用随机效应模型,以DerSimonian-Laird法估计τ²。1.9某研究调查农村厕所改造与腹泻发病率关系,采用差分中的差分(DiD)设计,其关键假设为A.处理组与对照组基线结局相同B.处理组与对照组时间趋势相同C.处理组随机分配D.无测量误差E.样本量足够大答案:B解析:DiD要求若无干预,两组结局随时间变化趋势平行,即共同趋势假设。1.10对某传染病潜伏期数据,经Shapiro-Wilk检验P<0.01,直方图右偏,则描述其集中趋势应报告A.均数B.中位数C.几何均数D.众数E.调和均数答案:B解析:明显非正态且右偏,用中位数更稳健。1.11在R语言glm函数中,family=quasibinomial()与family=binomial()的主要区别在于A.连接函数不同B.是否允许过度离散C.是否用最大似然D.是否支持加权E.是否可算AIC答案:B解析:quasibinomial通过估计离散参数φ,允许残差偏差大于二项假设,适合过度离散数据。1.12某市建立癌症登记系统,发现2022年肺癌新发病例共3200例,年初人口400万,则该市肺癌A.发病率为80/10万B.患病率为80/10万C.标化率可直接比较D.需计算累积发病率E.需用人年计算答案:A解析:发病率=新发病例/同期平均人口=3200/4000000×100000=80/10万。1.13在样本量估算中,若期望效应量Cohen’sd=0.5,α=0.05,power=0.90,采用双侧t检验,每组所需样本约为A.26B.64C.85D.105E.128答案:C解析:查表或软件计算,d=0.5,α=0.05,β=0.10,得n≈85/组。1.14下列关于多重插补的说法,正确的是A.插补一次即可B.插补后仅分析完整数据C.插补次数应≥5D.不需考虑缺失机制E.插补模型可与分析模型无关答案:C解析:Rubin规则建议m≥5,以稳定估计插补间方差。1.15在R语言survival包的coxph函数输出中,某变量HR=1.45,95%CI:1.10–1.92,P=0.008,则A.每增加一个单位,结局风险降低45%B.每增加一个单位,结局风险增加45%C.该变量为分类变量D.置信区间提示无统计学意义E.需计算绝对风险降低答案:B解析:HR=1.45表示每单位增加,风险增加45%,且CI不包含1,P<0.05,有意义。2.多选题(每题3分,共30分)2.1关于人群归因危险度百分比PAR%,下列说法正确的是A.与暴露频率有关B.与相对危险度有关C.公式为Pe(RR−1)/[1+Pe(RR−1)]D.可大于100%E.可用于评估干预收益答案:ABCE解析:PAR%综合暴露率与RR,公式正确;理论上≤100%,故D错。2.2下列哪些方法可用于调整混杂A.随机化B.匹配C.分层分析D.多变量回归E.标准化答案:ABCDE解析:五种均为经典混杂控制策略。2.3在Poisson回归中,若发现残差偏差/自由度=3.2,可采取A.引入过度离散参数B.改用负二项回归C.使用稳健标准误D.增加协变量E.改用logistic回归答案:ABCD解析:偏差/自由度≈1为理想,3.2提示过度离散,可A–D;结局为计数,不能用logistic。2.4关于ROC曲线,正确的是A.曲线下面积AUC=0.5表示无判别力B.最佳截断值需平衡灵敏度与特异度C.可比较不同模型预测能力D.适用于二分类结局E.可直接计算阳性预测值答案:ABCD解析:ROC不直接提供PPV,需结合患病率。2.5下列属于生存数据特点的有A.结局为二分类B.存在删失C.时间变量连续D.可含时依协变量E.服从正态分布答案:ABCD解析:生存时间不假设正态,故E错。2.6在调查问卷信度评价中,可使用的指标有A.Cronbach’sαB.ICCC.KappaD.PearsonrE.分半信度答案:ABCE解析:Pearsonr属效度或相关,不专指信度。2.7关于bootstrap方法,正确的是A.基于重抽样B.可估计置信区间C.需假设分布D.可用于小样本E.可校正偏差答案:ABDE解析:bootstrap为非参数方法,不依赖分布假设,故C错。2.8下列哪些情况易出现生态学谬误A.群体水平分析个体关联B.暴露与结局在同一层面C.未测量个体混杂D.变量聚合导致信息丢失E.采用多水平模型答案:ACD解析:B与E为预防或避免生态谬误的方法。2.9在R语言中,处理日期变量常用的包有A.lubridateB.baseC.data.tableD.chronE.stringr答案:ABCD解析:stringr用于字符串,不专用于日期。2.10关于多重比较校正,下列方法属于控制家族错误率FWER的有A.BonferroniB.HolmC.Benjamini-HochbergD.ŠidákE.TukeyHSD答案:ABDE解析:BH控制FDR,不控制FWER。3.判断题(每题1分,共10分)3.1在病例对照研究中,可直接计算发病率。答案:错解析:病例对照无随访人时,无法得发病率。3.2对数转换可使右偏数据更接近正态。答案:对解析:对数压缩大值,常用来降偏。3.3当样本量足够大时,偏态分布的样本均数仍近似正态。答案:对解析:中心极限定理保证。3.4Cox模型要求基线风险服从Weibull分布。答案:错解析:Cox为半参数,不指定h₀(t)分布。3.5在meta分析中,漏斗图对称可排除发表偏倚。答案:错解析:仅提示小样本效应,不能排除。3.6灵敏度与召回率系同一指标。答案:对解析:均为TP/(TP+FN)。3.7交叉验证可用于模型内部验证。答案:对解析:k-foldCV为经典内部验证。3.8当VIF>10时,可认为存在严重多重共线性。答案:对解析:经验阈值。3.9在R中,factor变量可直接用于lm而无需设置参照组。答案:错解析:R自动设参照,但需检查编码。3.10对于计数资料,χ²检验要求期望频数均≥5。答案:对解析:传统要求,否则用Fisher。4.计算与分析题(共90分)4.1某县对饮用水砷含量进行监测,随机抽取16口水井,测得砷浓度(μg/L)如下:7.2,6.8,9.1,8.5,10.3,11.7,12.4,13.0,14.2,15.1,15.8,16.5,17.3,18.0,19.2,20.1。已知国家标准为10μg/L。(1)计算样本均数、标准差及95%置信区间;(6分)(2)用单样本t检验判断该县井水砷是否超标;(6分)(3)若数据呈对数正态,求几何均数及其95%CI。(6分)答案与解析:(1)x̄=13.74,s=4.06,n=16,SE=4.06/√16=1.015,t₀.₀₂₅,₁₅=2.131,95%CI:13.74±2.131×1.015=(11.58,15.90)μg/L。(2)H₀:μ=10,t=(13.74−10)/1.015=3.68,df=15,P=0.002<0.05,拒绝H₀,该县井水砷显著超标。(3)对数转换后y=ln(x),ȳ=2.58,s_y=0.29,几何均数G=exp(2.58)=13.2μg/L,95%CI:exp(2.58±2.131×0.29/√16)=exp(2.58±0.155)=(11.5,15.1)μg/L。4.2一项队列研究探讨吸烟与肺癌关系,随访10年,数据如下:吸烟组:人年数=48000,肺癌死亡=240;不吸烟组:人年数=52000,肺癌死亡=104。(1)计算两组发病密度及率差、率比;(6分)(2)计算归因危险度百分比;(3分)(3)若吸烟率在该人群为45%,求人群归因危险度百分比PAR%;(3分)(4)以Poisson回归估计吸烟的RR及95%CI。(6分)答案与解析:(1)ID₁=240/48000=5.0/1000人年,ID₀=104/52000=2.0/1000人年;率差=3.0/1000人年;率比=ID₁/ID₀=2.5。(2)AR%=(RR−1)/RR×100%=60%。(3)Pe=0.45,PAR%=Pe(RR−1)/[1+Pe(RR−1)]=0.45×1.5/(1+0.45×1.5)=0.40=40%。(4)模型:log(期望事件)=log(人年)+β×吸烟(1=是,0=否),β̂=ln(2.5)=0.916,SE=√(1/240+1/104)=0.122,95%CI:0.916±1.96×0.122=(0.677,1.155),RR=exp(β)=2.5(1.97–3.17)。4.3某医院比较三种手卫生用品对医护人员手部菌落数(CFU/手)的影响,采用随机区组设计,每区组为同一医护人员先后使用三种产品,共20名医护人员。经SPSS分析得:产品间SS=1.82,区组间SS=2.05,误差SS=0.98,总SS=4.85。(1)完成方差分析表;(6分)(2)判断三种产品是否差异显著;(3分)(3)若显著,用Bonferroni法比较均值,已知三产品均数分别为:A=4.10,B=3.55,C=3.20,误差均方=0.026,求P值并解释。(6分)答案与解析:(1)方差分析表:来源SSdfMSF产品1.8220.91035.0区组2.05190.1084.15误差0.98380.026总计4.8559(2)产品F=35.0,F₀.₀₅,₂,₃₈≈3.25,P<0.001,拒绝H₀,产品间差异显著。(3)比较AvsB:差值=0.55,SE=√(0.026×2/20)=0.051,t=0.55/0.051=10.8,df=38,P<0.001;同理AvsC:t=14.3,P<0.001;BvsC:t=3.5,P=0.003(Bonferroni校正α′=0.05/3=0.017,均<0.017)。结论:菌落数A>B>C。4.4某研究收集200名新冠患者,记录年龄、性别、BMI、疫苗接种剂次(0,1,2,3)及是否发生重症(0=否,1=是)。拟建立logistic预测模型。经R分析输出:OR95%CIP年龄(每10岁)1.851.40–2.45<0.001女性0.700.45–1.090.11BMI(每单位)1.121.05–1.200.001接种剂次=10.500.28–0.890.02接种剂次=20.300.15–0.58<0.001接种剂次=30.200.08–0.48<0.001(参照:剂次=0)(1)解释年龄OR=1.85的含义;(3分)(2)计算一名60岁男性、BMI=30、接种2剂者的重症预测概率;(6分)(3)用NagelkerkeR²评价模型效能为0.42,简述其含义。(3分)答案与解析:(1)年龄每增加10岁,重症发生odds增加85%。(2)线性预测值η=β₀+β₁×(60−?)+…,设年龄以10岁为单位,则η=β₀+ln(1.85)×(60/10)+ln(1.12)×(30−mean)+ln(0.30)。先估β₀:基线meanage≈50,meanBMI≈26,则基线logit=β₀。设基线OR=1,则β₀=ln(事件率/(1−事件率)),假设基线事件率=0.20,β₀=−1.386。η=−1.386+ln(1.85)×6+ln(1.12)×4+ln(0.30)=−1.386+6×0.615+4×0.113−1.204=1.54,概率p=exp(1.54)/(1+exp(1.54))=0.82。(3)NagelkerkeR²=0.42表示模型解释了42%的变异,预测能力中等偏上。4.5某县实施改厕干预,采用整群随机对照试验,20个村随机分干预(10村)与对照(10村),每村随机抽取30户,随访一年腹泻发病率。结果:干预村平均发病率=0.15,对照=0.25,村间标准差σ=0.06。(1)计算设计效应DE;(3分)(2)用混合效应logistic回归估计干预效应,报告OR及95%CI;(6分)(3)若忽略聚类,用普通logistic回归会出现什么问题?(3分)答案与解析:(1)组内相关系数ρ=(σ_b²)/(σ_b²+σ_w²),假设户间σ_w²≈p(1−p)=0.2×0.8=0.16,则ρ=0.06²/(0.06²+0.16)=0.022;DE=1+(m−1)ρ=1+29×0.022=1.64。(2)混合模型:logit(腹泻)=β₀+β₁×干预+u_j,u_j~N(0,σ_u²)。估计β₁:log(OR)=ln(0.15/0.85)/(0.25/0.75)=ln(0.176/0.333)=−0.64,SE=√(1/450+1/450+2×0.06²/10)=0.11,95%CI:−0.64±1.96×0.11=(−0.86,−0.42),OR=0.53(0.42–0.65)。(3)忽略聚类致标准误偏小,Ⅰ类错误膨胀,置信区间过窄。4.6某研究对50名高血压患者进行连续7天血压监测,每天早晚各一次,共14个时点。欲分析晨峰血压与左室质量指数LVMI的关系。(1)写出线性混合效应模型表达式,考虑受试者随机截距;(3分)(2)若时点水平残差呈自相关,如何修正?(3分)(3)解释随机截距方差成分的意义。(3分)答案与解析:(1)LVMI_ij=β₀+β₁×晨峰_ij+u_i+ε_ij,u_i~N(0,σ_u²),ε_ij~N(0,σ²)。(2)用AR(1)或复合对称结构,如ε_ij=ρε_i,j−1+ζ_ij,或在lme4::lmer中加pdClasses。(3)σ_u²反映个体间LVMI基线差异,若显著大于0,说明需控制个体聚集。4.7某市建立流感监测哨点,连续5周报告病例数:12,18,27,45,63。(1)计算周环比增长率;(3分)(2)用指数增长模型N_t=N₀e^{rt}估计增长率r;(3分)(3)预测第6周病例数。(3分)答案与解析:(1)环比:18/12=1.50,27

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论