流行病学与医学统计试题及答案_第1页
流行病学与医学统计试题及答案_第2页
流行病学与医学统计试题及答案_第3页
流行病学与医学统计试题及答案_第4页
流行病学与医学统计试题及答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

流行病学与医学统计试题及答案1.(单选)某市开展一项糖尿病患病率调查,采用分层整群抽样,共抽取30个社区,每个社区再随机抽取100名35岁及以上常住居民。若将“是否患糖尿病”作为二分类变量,下列哪项最能描述该研究的抽样设计?A.单纯随机抽样B.系统抽样C.分层随机抽样D.分层整群抽样E.多阶段分层整群抽样答案:E解析:研究先按“社区”这一群集单位进行分层,再在每个社区内以个体为单位进行二次抽样,属于“分层+整群+多阶段”复合设计;单纯随机、系统、分层随机均未体现“群集”与“多阶段”特征。2.(单选)在计算率的标准误时,若数据来自复杂抽样设计,忽略设计效应(deff)最可能导致:A.标准误被高估,置信区间变宽B.标准误被低估,置信区间变窄C.标准误不变,置信区间不变D.标准误被低估,假设检验的Ⅰ类错误减少E.标准误被高估,假设检验的Ⅰ类错误增加答案:B解析:复杂抽样通常存在群内相关,deff>1;若仍按简单随机公式计算,会低估标准误,使置信区间窄于真实,进而增加Ⅰ类错误。3.(单选)某队列研究RR=2.5,95%CI1.8–3.4。若将暴露组样本量扩大一倍,对照组不变,预计:A.RR点估计基本不变,CI宽度变窄B.RR点估计增大,CI宽度变窄C.RR点估计减小,CI宽度变宽D.RR点估计基本不变,CI宽度不变E.RR点估计趋近于1,CI宽度变宽答案:ARR为两组风险的比值,与样本量无关;增大暴露组人数可提高精度,使CI变窄,但点估计由真实效应决定,不会系统性偏移。4.(单选)一项病例对照研究探讨吸烟与肺癌,采用人群对照。若对照组中吸烟者比例高于源人群中真实暴露比例,则OR会出现:A.趋向无效值1的偏倚B.远离1的夸大偏倚C.远离1的低估偏倚D.无法确定方向E.仅影响精确度,不影响点估计答案:A对照暴露比例被人为抬高,使暴露分布向病例靠拢,OR被拉向1,产生“趋向无效”的选择偏倚。5.(单选)某疫苗效力试验采用“整群随机”设计,共80所学校,每校120人。校水平随机分干预/对照,但分析时以个体为单位忽略聚类,则:A.置信区间变宽,P值偏大B.置信区间变窄,P值偏小C.置信区间与P值均不受影响D.只能使用校水平汇总分析,无法做个体分析E.需用稳健方差估计,否则第一类错误增加答案:E忽略聚类使标准误低估,t值虚高,P值偏小,第一类错误膨胀;稳健或GEE/混合模型可校正。6.(单选)关于“出生队列”与“时期效应”的区分,下列哪项研究设计最能直接分解二者?A.横断面调查B.重复横断面调查C.年龄-时期-队列模型(APC)D.单纯队列研究E.病例交叉设计答案:CAPC模型利用多重横断面或登记数据,通过约束估计可同时识别年龄、时期、队列三维度效应,其他设计均无法同时分解。7.(单选)某研究欲评估空气污染对每日哮喘急诊的长期趋势影响,采用广义相加模型(GAM)控制时间趋势、温湿度,但未控制流感流行,最可能的偏倚是:A.混杂偏倚B.Berkson误差C.过度控制偏倚D.暴露测量误差E.反向因果答案:A流感流行同时关联空气污染(冬季高发)与哮喘急诊,未控制将造成混杂;Berkson误差常见于分组暴露数据,与本题无关。8.(单选)在Meta分析中,若Egger回归检验P<0.05,最恰当的解释是:A.存在显著异质性B.存在显著发表偏倚C.提示但不足以证明发表偏倚D.主结果无效E.需立即换随机效应模型答案:CEgger检验仅提供“小样本效应”线索,受真实异质性、合并效应大小影响,不能单独作为发表偏倚的确证。9.(单选)某临床试验采用“适应性随机化”,下列哪项统计推断方法必须预先规定?A.期中分析的α消耗函数B.亚组分析的交互检验C.协变量调整模型D.缺失数据插补策略E.主要终点定义答案:A适应性设计允许多次揭盲调整样本量或随机化概率,必须预先规定α消耗,否则整体Ⅰ类错误失控。10.(单选)关于“工具变量(IV)”估计,下列哪项不是有效工具变量必备条件?A.与暴露强相关B.与结局无直接通路C.与任何混杂无关D.与暴露-结局的交互项相关E.仅通过暴露影响结局答案:DIV无需与交互项相关,D为无关条件;ABC为三大核心假设。11.(单选)某研究用Cox模型评估高血压对心血管事件的影响,将“收缩压”作为时依变量(time-varyingcovariate),与基线值模型相比,其主要优势是:A.控制测量误差B.控制时依混杂C.提高统计效能D.避免共线性E.降低失访影响答案:B时依变量可更新血压水平,避免“基线值固定”导致的时依混杂,尤其当血压随时间变化且同时影响后续事件风险。12.(单选)在传染病建模中,若基本再生数R0=3,疫苗效力VE=90%,接种率p=80%,则有效再生数Re最接近:A.0.24B.0.60C.0.84D.1.20E.2.40答案:CRe=R0×(1−p×VE)=3×(1−0.8×0.9)=3×0.28=0.84。13.(单选)某研究采用“断点回归(RDD)”评估禁烟政策对出生体重的影响,若驱动变量为“孕周”,断点设在37周,则核心假设是:A.37周前后其他混杂因素连续B.37周前后样本量相等C.出生体重正态分布D.政策仅影响37周后出生者E.驱动变量可被人为操纵答案:ARDD要求断点处除干预外所有潜在混杂连续,避免内生跳跃;若孕妇可精确控制孕周则假设破坏。14.(单选)关于“负二项回归”与“Poisson回归”差异,下列说法正确的是:A.负二项回归假设方差等于均值B.Poisson回归可处理过度离散C.负二项回归引入随机效应处理过度离散D.二者回归系数解释不同E.负二项回归不能用于前瞻性数据答案:C负二项在Poisson基础上加入伽马随机效应,使方差>均值,适合过度离散计数数据;系数解释均为对数风险比,无差异。15.(单选)某研究用“倾向性评分匹配”后,标准化差(standardizedmeandifference)仍>0.1,最佳下一步是:A.增加匹配容差B.更换为逆概率加权C.强制纳入高阶项再匹配D.直接报告未匹配结果E.放弃倾向性方法答案:CSMD>0.1提示协变量不平衡,可重新设定评分模型(加入交互、样条),再匹配;直接换加权或放弃均非首选。16.(单选)在“竞争风险”分析中,若将非疾病死亡视为竞争事件,用Fine-Gray模型估计亚分布风险比(sHR),其含义为:A.若竞争事件被剔除后的因果效应B.在竞争事件存在下,暴露对疾病发生的实际影响C.疾病发生且先于竞争事件的瞬时风险D.与cause-specificHR数值相等E.不再需满足比例风险假设答案:BsHR反映“实际世界”中竞争事件存在时的累积风险影响,适合政策评价;C为cause-specific解释。17.(单选)某研究用“双稳健估计”(augmentedIPW)处理缺失数据,其“双稳健”指:A.需同时指定暴露与结局模型B.需同时指定缺失机制与结局模型,任一正确即一致C.需同时指定缺失机制与暴露模型D.需同时指定加权与插补E.需同时指定协变量与交互项答案:B双稳健结合IPW与结局回归,只要“缺失模型”或“结局模型”之一正确,估计量即一致。18.(单选)关于“贝叶斯Meta分析”与“频率学Meta分析”差异,下列哪项正确?A.前者不需指定先验B.前者可直接获得后验概率P(θ>0|data)C.前者不能处理异质性D.前者结果无法解释临床意义E.前者必须采用MCMC答案:B贝叶斯框架天然提供“效应大于0”的后验概率,便于决策;先验必须指定,异质性可通过随机效应先验建模。19.(单选)某研究用“分布式滞后非线性模型(DLNM)”评估高温对死亡的影响,发现滞后14天仍有显著效应,若仅采用“当日温度”模型,最可能:A.高估即时效应B.低估总效应C.高估总效应D.对效应估计无影响E.降低模型自由度答案:B延迟效应被忽略,总效应(累积)被低估;即时效应可能因滞后未分离而被稀释。20.(单选)在“全基因组关联研究(GWAS)”中,若显著性阈值设为5×10⁻⁸,其主要目的是:A.控制族系误差(FWER)B.控制FDRC.提高统计效能D.降低测量误差E.避免人群分层答案:AGWAS进行百万次检验,5×10⁻⁸为Bonferroni校正近似,控制全基因组水平FWER。21.(多选)下列哪些方法可用于“复杂抽样数据”的方差估计?A.Taylor线性化B.刀切法(jackknife)C.平衡半样本(BRR)D.三明治稳健估计E.普通最小二乘答案:ABCDE忽略聚类与权重,无法正确估计方差;A–D均为复杂抽样常用重抽样或线性化技术。22.(多选)关于“中断时间序列(ITS)”设计,下列说法正确的是:A.需至少8个时间点B.可用分段回归估计水平与斜率变化C.需检验中断点前后自相关D.可用ARIMA控制季节性E.无需对照组即可推断因果答案:ABCDE错误,ITS仍需无同时期其他干预的假设,即“无混杂中断”;A–D均为ITS标准做法。23.(多选)某研究用“Cox比例风险模型”发现Schoenfeld残差P<0.05,可采取:A.加入时间与暴露交互项B.采用分层CoxC.采用时依系数模型D.更换为加速失效模型E.忽略,继续报告答案:ABCD比例风险违反需处理;E错误,忽略导致错误推断。24.(多选)下列哪些指标属于“人群归因分数(PAF)”的必要输入?A.暴露人群比例B.暴露组相对风险C.对照组风险D.暴露与结局的ORE.暴露与混杂的相关系数答案:ABPAF=Pe(RR−1)/[1+Pe(RR−1)],仅需暴露比例与RR;若用病例对照需OR近似RR,但CD非必要。25.(多选)在“贝叶斯剂量-反应Meta分析”中,若采用“随机行走”先验描述剂量系数,其优点包括:A.允许相邻剂量间系数平滑B.自动处理不同研究剂量不一致C.无需指定剂量函数形式D.提高极端剂量估计精度E.消除异质性答案:ABC随机行走先验(如RW1、RW2)借相邻剂量相似性实现平滑;D极端剂量外推仍受数据限制;E异质性由随机效应先验部分解释,无法消除。26.(计算题)一项病例对照研究探讨高脂饮食与结直肠癌,共纳入病例600例,对照600例。采用食物频率问卷估算“每日脂肪摄入量”,并依据源人群分布划分为低、中、高三组。结果如下:|脂肪摄入|病例|对照||----------|------|------||低|120|180||中|200|200||高|280|220|(1)计算“高vs低”暴露的OR及95%CI(Woolf法)。(2)若源人群中高、中、低暴露比例分别为30%、40%、30%,计算高暴露的PAF。(3)假设脂肪摄入测量误差为非差分,且敏感性与特异性均为90%,校正后OR为多少?答案与解析:(1)高vs低四格表:a=280,b=220,c=120,d=180OR=(a×d)/(b×c)=(280×180)/(220×120)=50400/26400=1.909logOR=ln(1.909)=0.646Var(logOR)=1/a+1/b+1/c+1/d=1/280+1/220+1/120+1/180=0.00357+0.00455+0.00833+0.00556=0.0220SE=√0.0220=0.14895%CI_log=0.646±1.96×0.148=(0.356,0.936)CI_OR=exp(0.356,0.936)=1.43–2.55(2)需将OR转为RR近似:Pe=0.30(高暴露)取低暴露为参照,其风险R0未知,可用OR近似RR(罕见病假设):PAF=Pe(OR−1)/[1+Pe(OR−1)]=0.30×0.909/(1+0.30×0.909)=0.2727/1.2727=0.214即21.4%的结直肠癌可归因于高暴露。(3)非差分测量误差:Se=Sp=0.90校正公式(Brenner1993):OR_true=OR_obs/[(Se+Sp−1)²+(1−Sp)(1−Se)(OR_obs−1)]分子分母略,直接代入:OR_true≈1.909/[(0.9+0.9−1)²+0.1×0.1×0.909]=1.909/[0.64+0.00909]=1.909/0.649≈2.94校正后OR升高,因非差分误差通常使OR趋向1,校正后远离1。27.(计算题)一项整群随机试验评估学校口腔健康教育对12岁学生龋齿发生率影响,共20所学校,随机10所干预。每校随机抽取50名学生,基线无龋齿。追踪2年,结果:干预组:共500人,新发龋齿80人;对照组:共500人,新发龋齿150人。设计效应deff=1.8。(1)忽略聚类,按简单随机计算率差、RR及95%CI。(2)考虑deff,给出校正后95%CI。(3)若欲在α=0.05、β=0.2下检测率差≥5%,需多少校(每校50人,deff=1.8)?答案与解析:(1)p1=80/500=0.16,p2=150/500=0.30RD=0.16−0.30=−0.14RR=0.16/0.30=0.533SE_RD=√[p1(1−p1)/n1+p2(1−p2)/n2]=√[0.16×0.84/500+0.30×0.70/500]=√(0.0002688+0.00042)=0.026295%CI_RD=−0.14±1.96×0.0262=(−0.191,−0.089)(2)校正:将方差乘以deffSE_RD_adj=0.0262×√1.8=0.0262×1.342=0.0352CI_RD_adj=−0.14±1.96×0.0352=(−0.209,−0.071)(3)单组n=50,校数k,总N=50k率差Δ=0.05,p1=0.16,p2=0.30,取pooledp=(0.16+0.30)/2=0.23未校正:n_per_group=(Zα/2+Zβ)²[p1(1−p1)+p2(1−p2)]/Δ²=(1.96+0.84)²[0.16×0.84+0.30×0.70]/0.0025=7.84×(0.1344+0.21)/0.0025=7.84×0.3444/0.0025=1080/人考虑deff:N_adj=1080×1.8=1944/组校数k=1944/50≈38.9→39校/组,总78校。28.(计算题)一项前瞻性队列研究随访5年,探讨BMI与2型糖尿病发病关系。采用Cox模型,BMI按每增加5kg/m²计算,得HR=1.35(95%CI1.20–1.52)。已知人群BMI均值25kg/m²,标准差4kg/m²,近似正态。(1)计算BMI从25增至30kg/m²时,5年累积风险比。(2)若暴露为“BMI≥30”,人群比例20%,计算PAF。(3)假设BMI与糖尿病存在阈值效应,真实阈值27kg/m²,但模型仍用线性,讨论对HR估计的影响。答案与解析:(1)每5单位HR=1.35,则10单位HR=1.35²=1.823(2)Pe=0.20,HR=1.823PAF=Pe(HR−1)/[1+Pe(HR−1)]=0.20×0.823/(1+0.20×0.823)=0.1646/1.1646=0.141即14.1%糖尿病可归因于肥胖(BMI≥30)。(3)线性模型将<27的BMI变化也纳入,导致对数风险斜率被稀释,HR趋向1;若真实阈值以上风险陡增,线性估计会被低估,且残差增大,比例风险假设可能违反。29.(计算题)某市监测每日PM2.5与呼吸系统死亡,采用广义线性泊松模型,控制长期趋势、温湿度、星期几。滞后结构采用DLNM,发现滞后0–3天累积RR=1.08(每10μg/m³),95%CI1.03–1.14。(1)若当日PM2.5升高20μg/m³,计算死亡增加百分比。(2)假设日均呼吸死亡20例,计算绝对增加数。(3)若PM2.5服从N(50,15²),求95%分布下的最大死亡增加数。答案与解析:(1)每10μg/m³RR=1.08,则20μg/m³RR=1.08²=1.166增加百分比=(1.166−1)×100%=16.6%(2)20×0.166≈3.3例/天(3)95%分布上限:50+1.96×15≈79.4μg/m³较均值升高29.4μg/m³RR=1.08^(2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论