2026年疾控中心公共卫生医师高频面试题包含详细解答_第1页
已阅读1页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

疾控中心公共卫生医师高频面试题

【精选近三年60道高频面试题】

【题目来源:学员面试分享复盘及网络真题整理】

【注:每道题含高分回答示例+避坑指南】

1.请简述队列研究与病例对照研究在实际应用中的最大区别与各自的局限性。(基本必考|

背诵即可)

2.在开展传染病流行病学调查时,如何有效控制和减少回忆偏倚和信息偏倚?(常问|重点

准备)

3.请解释混杂因素的概念,并在设计阶段和分析阶段分别说明“为什么这么设计”以及控制混

杂的常用统计学方法。(基本必考|需深度思考)

4.根据最新版《传染病防治法》,甲类传染病和“乙类甲管”传染病的报告时限和管控措施有

哪些核心差异?(极高频|背诵即可)

5.在进行公共卫生监测数据分析时,为什么有时会选择泊松回归而不是逻辑回归?请说明理

由。(常问|重点准备)

6.简述传染病暴发调查的基本步骤,并说明哪一个步骤在实际操作中最容易被忽视但又最致

命。(极高频|需深度思考)

7.什么是病死率和死亡率?在评估某种新型呼吸道传染病的严重程度时,主要应参考哪一个

指标?(基本必考|背诵即可)

8.请阐述现况研究(横断面研究)中样本量计算的关键参数,以及如果失访率过高应如何进

行统计学补救。(常问|考察实操)

9.在评价某种新上市疫苗的保护效果时,疫苗效力(Efficacy)与疫苗效果

(Effectiveness)在现实世界的测算有何不同?(极高频|重点准备)

10.你在过往的学习或工作中,遇到过最难或最复杂的一次现场流行病学调查(或病例复盘)

是什么?请复盘当时的调查设计和最终结论。(极高频|需深度思考)

11.如果你拿到一份辖区内过去五年的高血压患病率监测数据,存在大量缺失值和异常值,你

会如何进行清洗和预处理?(基本必考|考察实操)

12.为什么在突发公共卫生事件初期,往往很难准确计算出基本传染数(R0)?你在实践中

会如何利用现有数据进行估算?(常问|需深度思考)

13.请分享一个你主导或深度参与的慢性病(如糖尿病/高血压)社区干预项目,你是如何设

定干预指标和评估终点的?(学员真题|考察实操)

14.面对不明原因肺炎聚集性疫情,作为首批到达现场的流调人员,你的前48小时核心工作

清单是怎样的?(极高频|重点准备)

15.请描述一次你使用R语言、SAS或Python进行复杂流行病学模型拟合(如SIR模型或生存

分析)的具体经历,遇到了什么难点?(网友分享|考察实操)

16.在食源性疾病暴发调查中,如何通过病例的饮食暴露史快速锁定可疑食物?请结合实际案

例说明。(基本必考|考察实操)

17.如果法定传染病大网络报告系统提示某地诺如病毒感染呈异常上升趋势,你如何判断这是

真实暴发还是因检测能力提升导致的“假性聚集”?(极高频|需深度思考)

18.请详细说明在进行1:1匹配的病例对照研究时,如何选择合适的对照组以最大程度避免选

择偏倚?(常问|重点准备)

19.针对结核病这类慢性传染病,在重点人群(如学校、养老院)中开展主动筛查的成本效益

应当如何评估?(学员真题|需深度思考)

20.你曾遇到过流行病学调查结论与实验室病原学检测结果不一致的情况吗?如果遇到,你会

如何向领导解释并推进下一步工作?(常问|考察抗压)

21.在设计针对农村地区老年人的健康素养问卷时,如何保证问卷的信度和效度,同时兼顾受

访者的理解能力?(网友分享|重点准备)

22.请复盘一次你参与的疫苗疑似预防接种异常反应(AEFI)调查处置过程,你是如何安抚

家属并进行科学定性的?(学员真题|考察软实力)

23.如果需要在短时间内对某社区1万名居民进行特定传染病抗体水平的血清流行病学调查,

你会如何设计抽样方案?(极高频|考察实操)

24.在分析长期空气污染暴露与呼吸系统疾病发病率关联的研究中,如何剔除气象因素和季节

性变化造成的干扰?(网友分享|需深度思考)

25.请分享一次你在公共卫生项目申报或结题答辩中,面对专家尖锐质疑是如何用数据和逻辑

成功回应的经历。(常问|考察抗压)

26.假设你负责辖区内学校传染病症状监测系统的升级项目,在需求调研阶段,你会重点关注

校方医务室人员的哪些核心痛点?(学员真题|重点准备)

27.当面对一份缺乏对照组数据的突发环境污染事件健康损害评估报告,你将如何尝试补充证

据链以得出可靠结论?(常问|需深度思考)

28.请描述你是如何评估某项地方性公共卫生政策(如控烟条例)实施前后的干预效果的?用

了哪些模型或统计方法?(网友分享|考察实操)

29.在对某种新发传染病进行密切接触者追踪时,如何界定“密切接触”的范围和判定标准?这

在实操中最大的难点是什么?(基本必考|重点准备)

30.请简述在撰写现场流调报告(如《某地XX疫情流行病学调查报告》)时,最容易犯的逻

辑错误和数据表述错误有哪些?(极高频|考察实操)

31.在接到疑似聚集性发热疫情报告并赶赴某寄宿制学校后,校方为了升学率极力掩盖发病人

数并拒绝配合流调,你该如何合法合规地突破这一阻力?(极高频|考察抗压)

32.现场流调时,确诊病例因害怕隐私泄露,坚决否认自己去过某高危场所,面对这种谎报/

瞒报,你有哪些调查技巧和技术手段来核实轨迹?(基本必考|考察实操)

33.辖区某化工厂发生不明气体泄漏,周边社区多名居民出现呕吐、头晕症状,在现场未检测

出常见毒物的情况下该如何稳住局面并开展环境流调?(常问|考察抗压)

34.当疾控中心的流调数据与当地公安部门的大数据轨迹出现严重冲突,且距离发布疫情通报

仅剩两小时,你作为流调组长应如何决策并出具最终报告?(极高频|需深度思考)

35.在进行食源性疾病溯源时,涉事餐厅的老板以“影响生意”为由拒绝提供员工健康证和进货

台账,你该如何联动多部门紧急处置?(常问|考察实操)

36.辖区内突发输入性烈性传染病,隔离病房内的护士因恐惧出现群体性情绪崩溃,作为进入

红区的公卫医师,你将如何安抚并进行院感防护指导?(学员真题|考察软实力)

37.在针对某敏感人群(如艾滋病患者、吸毒者)进行高危行为干预时,受访者对你充满敌意

并拒绝随访,你有什么破冰话术和长期跟进策略?(常问|重点准备)

38.某网红餐厅发生疑似诺如病毒暴发并引发舆情,而实验室检测结果最快也需要24小时,

疾控部门此时应如何拟定给政府的风险沟通建议?(极高频|需深度思考)

39.在进行入户采样和流调时,家属因情绪失控对工作人员产生暴力倾向并在现场推搡流调队

员,你的第一反应和后续处置流程是什么?(网友分享|考察抗压)

40.如果传染病直报系统在深夜突发大规模故障无法录入数据,而你手头有几十份紧急的新增

病例报告表,你会启动怎样的应急预案?(常问|考察实操)

41.在评估某大型国际会议的公共卫生风险时,主办方拒绝削减高风险的聚集环节,你如何用

科学数据和模型说服他们修改方案?(学员真题|需深度思考)

42.流调过程中发现某确诊病例属于特殊身份人员,其随行人员拒绝透露核心行程,你如何平

衡保密规定与传染病防控的硬性要求?(常问|考察软实力)

43.当辖区内同时暴发登革热和流感聚集性疫情,疾控中心现场流行病学调查人力严重不足,

你会如何建立优先级并分配手头的核心骨干?(极高频|重点准备)

44.媒体突然曝光你起草的某份流调报告存在明显的数据前后矛盾,引发公众质疑,你将如何

进行内部复核和外部危机应对?(学员真题|考察抗压)

45.在进行农村地区寄生虫病筛查时,村民普遍存在“抽血会伤元气”的迷信思想抵制化验,你

有哪些因地制宜的健康教育和劝导方法?(网友分享|考察软实力)

46.某养老院发生大规模呼吸道聚集性感染,院方隐瞒上报长达三天且院感控制形同虚设,你

应如何第一时间阻断传播链并追责取证?(基本必考|考察实操)

47.疫苗冷链监测报警显示某批次减毒活疫苗运输途中温度短暂超标,但承运方坚称不影响效

价,你该如何决定这批疫苗的去留及启动何种评估程序?(常问|需深度思考)

48.在对疑似职业病进行现场流行病学调查时,涉事企业伪造了通风设备运行记录,你如何利

用旁证材料和作业工人的陈述还原真相?(极高频|重点准备)

49.一所幼儿园出现多名儿童手足口病感染,部分家长在群内散布“疫苗有毒导致发病”的谣

言,你作为被派往现场说明情况的公卫医师,开场白会怎么说?(学员真题|考察软实

力)

50.现场流调时,如果你发现带队的资深专家在某个关键调查方向上做出了明显违背最新指南

的判断,你将如何专业、委婉且有效地提出异议?(常问|考察软实力)

51.当你辛苦追踪了几天的零号病人最终被证实为假阳性,导致耗费了大量医疗资源,面对基

层的抱怨,你该如何进行心理调适和复盘汇报?(网友分享|考察抗压)

52.某重点饮用水源地水质监测发现大肠菌群异常超标,但周边并未发现明显的面源污染,作

为现场公卫人员,你的排查思路会做哪些调整?(基本必考|需深度思考)

53.如果发现有临床医生长期将疑似病例随意诊断为确诊病例,导致发病率被人为拉高,你如

何利用数据稽查和现场核实来纠正这一乱象?(常问|考察实操)

54.在处置突发公共卫生事件的高压连续作战中,有团队成员因长期熬夜出现了辞职念头,你

作为小组长该如何疏导情绪并保障流调任务?(学员真题|考察软实力)

55.某学校暴发诺如疫情,但疾控部门现场采集的数十份环境和肛拭子标本全部为阴性,你该

如何从采样时机、靶标选择等方面查找原因并对外解释?(极高频|需深度思考)

56.当流调对象是一位患有阿尔茨海默症的老年人,且无直系亲属陪伴,你该如何通过碎片化

的信息和监控拼凑出其过去一周的真实活动轨迹?(常问|重点准备)

57.面对特大洪涝灾害过后的灾区,公共卫生基础设施全面瘫痪,你如何利用极为有限的物资

建立起最基础的传染病症状监测预警系统?(极高频|考察实操)

58.随着生成式AI和大数据技术的发展,你认为未来五年多点触发传染病监测预警系统在基层

疾控的落地还面临哪些数据壁垒?(常问|需深度思考)

59.结合我国人畜共患病(如狂犬病、布病)的防控现状,你认为疾控部门与农业农村部门在

跨界协同防线上最大的痛点是什么?(网友分享|需深度思考)

60.我问完了,你有什么想问我的吗?(面试收尾)

【疾控中心公共卫生医师】高频面试题深度解答

Q1:请简述队列研究与病例对照研究在实际应用中的最大区别与各自的局限

性。

❌不好的回答示例:

我觉得队列研究就是由因到果的研究,先看暴露情况再看发病情况;病例对照就是

由果到因,先找病人再问他们以前接触过什么。最大的区别就是方向不一样。局限

性的话,队列研究比较费时间和钱,因为要跟踪很久;病例对照研究比较省时间,

但是容易记错东西,会有偏倚。在实际工作中,如果有钱有时间就做队列,没钱没

时间为了快点出结果就做病例对照。主要看领导安排和经费情况来决定用哪个。

为什么这么回答不好:

1.内容选择上的失误:回答仅停留在教科书式的表层定义,没有结合疾控实际应用场景(如

暴发调查或慢病随访)进行深度拓展。

2.表达方式上的问题:口语化严重,“有钱有时间”、“记错东西”等表述缺乏公卫医师应有的

专业严谨性,未准确使用专业术语。

3.给面试官留下的负面印象:显得求职者缺乏实际科研项目设计经验,仅凭死记硬背应付面

试,缺乏独立判断和流行病学设计的系统思维。

高分回答示例:

1.在疾控实际工作中,这两种设计的核心区别在于“论证因果关系的能力”与“资源消耗时效

性”的权衡。队列研究从暴露出发观察结局,能直接计算发病率和相对危险度(RR),

因果论证强度高;病例对照从结局追溯暴露,只能计算比值比(OR),主要用于快速提

出或初步验证假设。在面对突发公共卫生事件时,两者的应用场景截然不同,需要我们做

出精准的专业预判。

2.在实际应用中,我在处理突发聚集性疫情时,往往先采用病例对照研究。例如在一次食源

性疾病暴发调查中,需在48小时内锁定可疑食物。由于时间紧迫且总体发病率未知,我

迅速设计了1:1匹配的病例对照方案。虽然不可避免地存在回忆偏倚和选择偏倚,但它帮

我们高效计算出各类食物的OR值,快速锚定了受污染的食材。相反,在慢病防制科参与

高血压生活方式干预评估时,我们则采用了前瞻性队列研究,以精准测算不同干预组的归

因危险度百分比(AR%)。

3.队列研究最大的局限性在于极高的失访率和巨大的时间成本,而病例对照的局限在于极易

受混杂因素干扰且无法证明时间先后顺序。为了应对前者的失访偏倚,我曾建立社区网格

化随访机制将失访率压至5%以下;对于后者,则通过多因素逻辑回归模型来控制混杂。

总结来说,我会根据疫情紧急程度、疾病罕见性以及可用公共卫生资源,灵活匹配并优化

相应的流行病学研究设计方案。

Q2:在开展传染病流行病学调查时,如何有效控制和减少回忆偏倚和信息偏

倚?

❌不好的回答示例:

在做流调的时候,大家记不清很正常。为了减少回忆偏倚,我会多问几遍,或者提

醒他们一下那天发生了什么大事情,帮他们回忆。信息偏倚的话,就是收集数据的

时候搞错了,我会要求流调队员认真一点,把表格填完整。如果有些问题他们不想

回答,我也会尽量态度好一点去劝他们。另外就是录入数据的时候仔细核对,双人

录入,尽量不要出现错别字或者填错格子的低级失误,这样就能减少偏倚了。

为什么这么回答不好:

1.逻辑结构上的缺陷:应对措施过于零散且主观,“多问几遍”、“态度好一点”缺乏系统性的

流行病学质量控制方法论。

2.内容选择上的失误:没有提到客观验证手段(如大数据轨迹、交易记录),仍停留在传统

的“口对口”问询层面,脱离了现代疾控的工作实际。

3.错失的加分机会:未能展现出在问卷设计阶段、调查员培训阶段以及数据交叉比对维度的

专业把控能力,错失了体现项目管理经验的机会。

高分回答示例:

1.回忆偏倚和信息偏倚是现场流调中最常遇到且最容易摧毁数据效度的“杀手”。在突发传染

病疫情处置中,如果过度依赖患者主观记忆,极易导致关键暴露场所的遗漏。因此,控制

这两类偏倚必须贯穿调查设计、现场执行和数据核查的全生命周期,核心策略是“主客观

结合、标准化执行”。

2.为了最大程度控制回忆偏倚,我在带队进行流调时,严禁队员进行诱导性提问。我们采

用“时间轴锚定法”,以患者的重大事件(如发病日、节假日)为时间节点帮助其逆向推

演。更重要的是,我们全面引入了客观数据佐证:通过调取患者的手机支付账单、交通乘

车记录、核酸检测记录以及公安部门的大数据轨迹监控,将主观口述与客观轨迹进行多源

数据交叉比对(Cross-validation),极大地挤压了回忆误差的空间。

3.针对信息偏倚,我主导建立了流调质量控制SOP。首先在工具层面,优化电子化流调表

(eCRF),设置逻辑跳转和异常值硬性拦截,从源头减少填写错误;其次在人员层面,

开展标准化的调查员同质性培训,统一敏感问题的提问话术;最后在审核阶段,实行现场

流调组长“日清日结”复核制,发现逻辑矛盾立即补充调查。通过这些标准化手段,我们曾

将某起聚集性疫情流调表的核心字段缺失率和逻辑错误率从15%降至了2%以内,确保了

决策依据的可靠性。

Q3:请解释混杂因素的概念,并在设计阶段和分析阶段分别说明“为什么这么设

计”以及控制混杂的常用统计学方法。

❌不好的回答示例:

混杂因素就是那些既和疾病有关,又和暴露因素有关,从而干扰了我们判断它们之

间真实关系的因素。比如研究吸烟和肺癌,年龄可能就是一个混杂因素。在设计阶

段,我们可以通过限制和匹配来控制它,比如只研究特定年龄段的人,或者给病例

找同年龄的对照。在分析阶段,我们可以用分层分析或者多因素分析。为什么这么

设计,主要就是为了把混杂因素的影响给剔除掉,这样算出来的结果才准确,才能

发好文章或者写好报告。

为什么这么回答不好:

1.表达方式上的问题:虽然基本概念答对了,但缺乏深度的专业见解,“把影响剔除掉”的表

述过于浅显,没有深入解释背后的统计学意义。

2.逻辑结构上的缺陷:对于“为什么这么设计”的回答极其薄弱,仅仅说为了准确,未能体现

出不同控制策略在成本、可行性及外部真实性上的优劣对比。

3.给面试官留下的负面印象:像是在背诵流行病学期末考试的标准答案,缺乏作为一线公共

卫生医师在面对复杂真实世界数据时的应对经验和思考深度。

高分回答示例:

1.混杂因素(Confounder)是指在流行病学研究中,本身不仅是所研究结局的发病危险因

素,同时又与所研究的暴露因素存在统计学关联,从而在暴露与结局之间造成虚假联系或

掩盖真实联系的外部变量。在公共卫生项目实施中,如果不剥离混杂效应,极易导致干预

政策的误判。因此,我们必须在研究的顶层设计和数据挖掘阶段进行双重拦截。

2.在研究设计阶段,我们常采用“限制”、“匹配”和“随机化”。例如,在评估某新型职场健康干

预项目对心血管事件的影响时,如果不加控制,员工的年龄和基线基础疾病就是巨大混

杂。为什么在这个阶段设计控制?因为设计阶段的控制能从源头阻断混杂因素的非均匀分

布,降低后续统计模型的复杂度和压力。我们采用了倾向性评分匹配(PSM)进行设计

优化,通过寻找协变量得分高度一致的对照组,最大程度模拟了随机对照试验(RCT)的

效果,有效均衡了组间差异。

3.然而,设计阶段无法穷尽所有未知混杂,这就必须在数据分析阶段进行补救。我们在分析

时,通常会先通过Mantel-Haenszel分层分析法快速识别并校正单一重要混杂(如性

别),计算校正后的OR值。当面临多维度的复杂混杂网络时,我会构建非条件Logistic回

归或Cox比例风险模型,将可疑混杂因素作为协变量强制纳入模型进行多因素校正。通过

设计与分析的组合拳,我们在真实世界研究中能够最大程度剥离噪声,得出经得起同行评

议的独立危险因素结论,为疾控政策的制定提供硬核证据。

Q4:根据最新版《传染病防治法》,甲类传染病和“乙类甲管”传染病的报告时

限和管控措施有哪些核心差异?

❌不好的回答示例:

甲类传染病就是鼠疫和霍乱,是最危险的,一旦发现必须立刻报告,好像是两小时

内就要报上去。“乙类甲管”是比如非典或者新冠早期那种,也是按照甲类来管理

的。报告时限上,甲类肯定是要求最快的,乙类的话可能时间稍微长一点点,但我

记得乙类甲管也是要求2小时内报告的。管控措施上,两者都要隔离病人,密切接

触者也要医学观察,疫点要消毒。其实在实际操作中,两者都非常严格,都要穿最

高级别的防护服去现场处置,感觉区别不是很大。

为什么这么回答不好:

1.内容选择上的失误:对法定报告时限的核心考点记忆模糊,甚至给出了“其实感觉区别不

大”的错误结论,这是公卫医师在法规层面的严重硬伤。

2.逻辑结构上的缺陷:没有清晰地将“报告时限”和“管控措施”分点对比论述,行文逻辑混

乱,显得专业基础极其不扎实。

3.错失的加分机会:未能准确说出最新的乙类甲管名录变动(如新冠降级),错失了展示自

身对国家公共卫生政策动态保持高度敏感和实时更新的加分项。

高分回答示例:

1.《传染病防治法》是我们开展一线公卫工作的准绳,准确界定甲类与“乙类甲管”的法律边

界,直接关系到疫情早期预警的时效性和行政强制措施的合法性。目前,法定甲类仅有鼠

疫和霍乱两种;而“乙类甲管”传染病是动态调整的,如传染性非典型肺炎、炭疽中的肺炭

疽等(注:新冠已依法降为乙类乙管)。两者在报告与管控上既有高度重合,也存在细微

的法律授权差异。

2.首先在报告时限上,依据国家网络直报规范,发现甲类传染病和“乙类甲管”传染病的疑似

病例、确诊病例及病原携带者,均具备同等的最高优先级:必须在确诊或疑似后2小时内

通过传染病网络直报系统上报,绝不允许任何形式的瞒报或迟报。但在具体的管控措施和

行政授权上,两者存在核心差异。针对甲类传染病,医疗机构有权依法对拒绝隔离治疗的

患者或疑似患者,请求公安机关协助采取强制隔离治疗措施,并且其疫区的宣布和封锁权

限往往涉及更高级别的政府决策流程。

3.针对“乙类甲管”,虽然同样执行患者隔离、密接追踪和疫点终末消毒等最严格的医学管

控,但在实施区域性限制人员聚集、停工停业等社会面管控措施时,其启动门槛和法律程

序需由省级以上人民政府决定。在我的过往实操中,当面对疑似乙类甲管烈性传染病时,

我的第一反应是严格对标甲类的“2小时报告+就地隔离+极速流调”三原则启动应急预案。

只有将法律条文转化为条件反射式的SOP,才能在危机初期为阻断传播链争取到最宝贵

的黄金时间。

Q5:在进行公共卫生监测数据分析时,为什么有时会选择泊松回归而不是逻辑

回归?请说明理由。

❌不好的回答示例:

因为泊松回归主要是用来算发生率的,逻辑回归是用来算发生不发生的。如果我们

要分析发病率或者死亡率,特别是那种比较罕见的病,就会用到泊松回归。逻辑回

归一般就是看治愈还是没治愈,或者阳性还是阴性这种只有两个结果的数据。在疾

控分析数据的时候,如果领导要看某种病在不同地区的发病率差异,我就会把数据

导进SPSS里,选泊松回归跑一下看看P值。如果只看有没有得病,就用逻辑回归。

主要就是看数据的类型是什么样子的。

为什么这么回答不好:

1.逻辑结构上的缺陷:仅仅机械地罗列了“算发生率”和“算二分类结局”,没有深入解释这两

种统计模型背后的数学假设及其对公共卫生数据的适配性。

2.表达方式上的问题:“跑一下看看P值”这种说法非常外行且带有典型的“唯P值论”色彩,忽

视了模型拟合优度、超剂量分散等高级统计学考量。

3.错失的加分机会:未能结合具体的疾控监测指标(如人年发病率、时间序列监测)进行实

战场景的举例,缺乏数据分析专家的专业深度。

高分回答示例:

1.在公共卫生监测数据挖掘中,选择泊松回归(PoissonRegression)还是逻辑回归

(LogisticRegression),本质上是对因变量概率分布特征以及疾病流行规律的深度考

量。虽然两者均属于广义线性模型(GLM),但当面对特定的疾控监测场景(特别是含

有“时间-空间”暴露属性的数据)时,泊松回归具有逻辑回归无法替代的优势。

2.我们之所以在特定场景下弃用逻辑回归而选择泊松回归,核心理由有三点。首先,结局变

量属性不同:逻辑回归处理的是二元状态(患病/未患病,服从二项分布),而泊松回归

处理的是单位时间或空间内的“计数值”或“发病率”(服从泊松分布)。在进行例如“某市十

年间不同区县恶性肿瘤发病趋势”分析时,我们关心的是每10万人年的发病频次,此时必

须用泊松回归计算发病密度比(IRR)。其次,罕见事件的精准拟合:对于发病率极低

(如<5%)的新发或罕见传染病,泊松回归对低频计数的拟合效能远优于逻辑回归。最

后,暴露人时的校正:公共卫生随访队列中常出现失访或随访时间不一的情况,泊松回归

允许我们将“观察人时(Person-time)”作为偏置项(Offset)纳入模型,从而精准校正暴

露时间的差异。

3.在我的实战经验中,曾负责分析大气PM2.5浓度与每日呼吸系统疾病急诊就诊人次的关

联。由于每日就诊人数是典型的离散计数值序列,我毫不犹豫地选择了泊松回归,并在发

现数据存在“方差大于均值”的过离散(Overdispersion)现象后,果断将其升级为负二项

回归模型。通过精准的模型选型,我们排除了气象混杂,成功计算出PM2.5每升高

10μg/m³导致的急诊量超额风险,为制定空气重污染健康预警方案提供了坚实的数据支

撑。

Q6:简述传染病暴发调查的基本步骤,并说明哪一个步骤在实际操作中最容易

被忽视但又最致命。

❌不好的回答示例:

暴发调查的步骤大概就是:首先核实诊断,确认是不是真的爆发了;然后准备去现

场;到了现场后开展流行病学调查,找病人,问他们吃了什么去过哪;接着采集样

本送到实验室去化验;同时要赶紧采取控制措施,比如隔离病人、消毒环境;最后

写出调查报告上交。我觉得最容易被忽视的步骤是写报告,很多人现场做完了就不

管了,报告写得很敷衍。但报告很重要,因为领导要看,写不好会影响对整个事件

的评价。

为什么这么回答不好:

1.内容选择上的失误:将“写报告”视为最致命且被忽视的步骤是不专业的。虽然报告重要,

但在暴发控制的黄金窗口期,建立病例定义、提出并验证假设才是决定流调成败的核心技

术环节。

2.逻辑结构上的缺陷:步骤罗列不够系统,遗漏了“建立病例定义”、“建立和验证假设”等现

代现场流行病学的核心专业步骤。

3.表达方式上的问题:“找病人,问他们吃了什么”、“写不好领导要看”等表述过于大白话,

缺乏公共卫生突发事件处置的严肃性和专业严密性。

高分回答示例:

1.传染病暴发调查是一项高压下的系统工程,犹如破案。其经典步骤可以高度概括为十

步:准备现场工作、核实诊断与暴发存在、建立病例定义并搜索病例、进行描述性流行病

学分析(三间分布)、提出假设、开展分析性流行病学验证假设、完善假说并补充专项研

究、实施控制措施、评估干预效果、以及沟通反馈撰写报告。这套流程并非线性绝对死

板,控制措施往往贯穿始终。

2.在大量的一线实战复盘中,我深刻体会到,实际操作中最容易被忽视但却最致命的步骤

是“建立科学、动态的病例定义(CaseDefinition)”。很多基层公卫人员一到现场,急

于发问卷采集标本,却沿用平时门诊的宽泛临床诊断标准。我在一次校园不明原因发热暴

发调查中发现,由于初期缺乏清晰的“疑似、临床诊断、确诊”分级病例定义,流调人员将

大量普通感冒甚至过敏性鼻炎的学生误纳入统计,导致描述性疫情曲线(Epidemic

Curve)严重失真,险些让我们把调查方向错误地引向了空气传播机制。

3.意识到这一致命误区后,我立即紧急叫停并重新厘定标准:将时间严格卡在“开学后72小

时内”、空间限定在“特定宿舍楼层”、临床特征锁定为“体温≥38℃且伴有特定呕吐症状”。

通过这一精准的病例定义“漏斗”重新清洗数据后,真实的暴发聚集性立刻凸显,我们顺藤

摸瓜,迅速在48小时内通过队列研究确认了污染源为某台未经消毒的直饮水机。只有精

准定义了“谁是真正的病人”,所有的假设推演和后续干预才有意义,这是现场流调的定海

神针。

Q7:什么是病死率和死亡率?在评估某种新型呼吸道传染病的严重程度时,主

要应参考哪一个指标?

❌不好的回答示例:

病死率就是得了这个病的人里面,有多少人因为这个病死掉了。死亡率就是在这个

地区的所有总人口里,不管得没得病,因为这个病死了多少人。这两个概念挺容易

搞混的。在评估一种新的呼吸道传染病有多严重的时候,我觉得主要应该看病死

率。因为病死率高就说明这个病很毒,得了就容易死,大家就会很害怕。死亡率的

话因为除以的是总人口,基数太大了,算出来都很小,感觉不能直观地反映出这个

新病毒到底有多可怕。

为什么这么回答不好:

1.逻辑结构上的缺陷:回答过于片面,单纯依靠病死率来评估新型传染病严重程度存在重大

盲区,忽视了传播力(R0)与死亡率之间的乘数效应。

2.表达方式上的问题:“这个病很毒”、“大家就会很害怕”用词极度缺乏专业素养,不符合公

共卫生医师在进行风险评估时的客观量化语境。

3.错失的加分机会:未能结合真实世界案例(如新冠或流感)对比说明高病死率(如

MERS)与高死亡率(如大流行流感)在公共卫生医疗资源挤兑上的不同影响。

高分回答示例:

1.病死率(CaseFatalityRate,CFR)和死亡率(MortalityRate)是衡量疾病疾病负担的两

个核心维度。病死率的分子是因某病死亡的人数,分母是确诊患该病的总人数,它反映的

是疾病的临床严重性和致死能力;而死亡率的分子同样是死于某病的人数,但分母是同期

暴露的总人口数,它衡量的是该疾病对整个社会人群的生命威胁总规模。在面对新型呼吸

道传染病时,单一指标都是盲人摸象,必须综合动态评估。

2.评估新型呼吸道传染病严重程度时,初期和爆发期的参考权重是动态转移的。疫情初期,

我们主要参考病死率(CFR或IFR感染致死率),用以判定病原体的毒力,为临床救治资

源准备(如ECMO、ICU床位)提供依据。然而,从公共卫生宏观决策的视角来看,死亡

率(或超额死亡率)往往是评估疾病对社会实质性破坏更致命的指标。我曾在研讨会上建

立过一个数学推演:一种病死率高达30%但极难人传人的疾病(如某些禽流感),其造成

的社会总体死亡率极低;相反,一种病死率仅为0.5%但具备极高基本传染数(R0)的新

型呼吸道病毒,一旦造成全人群海量感染,其庞大的分母基数将导致绝对死亡人数激增,

全人群死亡率飙升,这才是真正击穿医疗卫生体系防线的元凶。

3.因此,在向政府提交风险评估报告时,我绝不会孤立地汇报病死率。我会构建一个包

含“病死率+基本传染数R0+易感人群比例”的复合风险矩阵,并利用超额死亡率(Excess

Mortality)来校正因漏诊导致的统计偏差。只有将微观的病毒毒力(病死率)与宏观的群

体流行力相结合,才能为制定疫苗接种优先级、社会面封控等非药物干预措施(NPIs)

提供最严谨的流行病学依据。

Q8:请阐述现况研究(横断面研究)中样本量计算的关键参数,以及如果失访

率过高应如何进行统计学补救。

❌不好的回答示例:

做横断面研究算样本量的时候,主要得知道预期的患病率是多少,还有就是我们能

接受的误差有多大。一般用个公式一套就能算出来。如果查的时候发现失访率太高

了,比如很多人搬走了或者不配合,那补救的方法就是赶紧再去多抽点人来调查,

把人数补齐,保证样本量够大就行。或者在分析数据的时候,把那些没调查完的人

直接删掉,只分析数据全的那些人,不然数据有空白也没法做统计分析,这样就能

保证结果的准确了。

为什么这么回答不好:

1.内容选择上的失误:将直接删除缺失数据作为应对高失访率的首选策略是严重的统计学错

误,这会引入巨大的选择偏倚,破坏样本的代表性。

2.逻辑结构上的缺陷:计算样本量的关键参数回答不全,遗漏了置信水平(α设定)、设计

效应(Deff,用于复杂抽样)等关键变量。

3.错失的加分机会:未能展示现代多重插补或逆概率加权等高级统计学补救方法,仅停留

在“多抽点人”这种低效且往往在经费受限时无法操作的基层土办法。

高分回答示例:

1.现况研究是摸清辖区健康本底数据的基石。要确保调查结果具有良好的总体推断能力,科

学的样本量计算和严密的偏倚控制缺一不可。横断面研究样本量计算的四大核心关键参数

为:预期的患病率或暴露率(p)、容许误差(d)、检验水准(通常α=0.05,对应Z值为

1.96),以及当采用分层多阶段整群抽样等复杂设计时,必须乘上的设计效应系数

(Deff,通常取1.5-2.0以校正群内相关性导致的设计效率损失)。

2.在项目执行中,失访率(无应答率)过高是极具破坏性的挑战。因为失访往往不是完全随

机的(MNAR),比如健康素养极差的人群更不愿配合调查,如果简单采取“直接剔除缺

失病例”的暴力做法,会导致严重的选择偏倚,得出的患病率将被严重低估或高估。因

此,当遇到失访率超过15%的红线时,我不会盲目扩大样本补录,而是启动多维度的补救

方案。首先在现场调查期,我必定会抽取一部分拒访或失访对象进行“无应答者简短特征

调查”,对比他们与应答者在人口学特征上是否存在系统性差异。

3.在数据分析的补救阶段,如果证实存在差异,我会采用高级统计学手段进行校正。对于个

别变量的随机缺失,我会利用R语言中的MICE包进行多重插补(MultipleImputation),

利用现有数据的协方差结构还原最可能的真实值。如果整群失访严重,我会采用基于倾向

性评分的逆概率加权法(IPW),赋予那些具有高失访特征但成功接受调查的样本更高的

权重,从而强制拉平样本分布与目标总体分布的鸿沟。这种基于数据驱动的质量控制,才

能确保最终产出的公共卫生白皮书经得起科学推敲。

Q9:在评价某种新上市疫苗的保护效果时,疫苗效力(Efficacy)与疫苗效果

(Effectiveness)在现实世界的测算有何不同?

❌不好的回答示例:

疫苗效力和疫苗效果其实讲的都是这个疫苗好不好用、能不能防病。区别就是,效

力一般是在实验室或者临床试验里面做出来的,那个时候条件很好,人群也是挑过

的,所以算出来的保护率一般都挺高的,比如90%以上。疫苗效果就是在现实生活

中真实打疫苗的结果,因为现实中大家体质不一样,还有些人可能没打满针次,所

以效果算出来肯定比效力要低。算的时候就是拿打疫苗发病的人和没打疫苗发病的

人比一下就行了。

为什么这么回答不好:

1.逻辑结构上的缺陷:虽然点出了理想环境与真实世界的区别,但缺乏流行病学方法论的支

撑,没有说明两者在研究设计(RCTvs观察性研究)上的根本差异。

2.表达方式上的问题:“比一下就行了”这种表述极其草率,忽略了真实世界研究中控制混杂

的巨大技术难度。

3.错失的加分机会:作为公卫医师,未能提及当前评估疫苗效果最主流的方法(如检测阴性

设计TND),显得知识储备未与国际前沿接轨。

高分回答示例:

1.在公卫免疫规划领域,清晰界定疫苗效力(Efficacy)和疫苗效果(Effectiveness)是制

定疫苗采购与接种策略的前提。这两者虽然都衡量疫苗的保护作用,但其测算环境、流行

病学设计和所回答的科学问题存在本质的降维区别。效力回答的是“在理想状态下疫苗能

起多大作用”,而效果回答的是“在复杂的公共卫生真实世界中,该项目实际挽救了多少

人”。

2.疫苗效力(Efficacy)的测算严格依赖于双盲随机对照试验(RCT)。在III期临床中,研究

者严格控制了纳入排查标准,通过随机化强制均衡了组间的潜在混杂因素,确保了内部真

实性。其计算公式为。然而,RCT的受试者往往较为健康,且冷

链系统完美,这无法代表全人群。因此,当疫苗大规模上市后,我们必须测算疫苗效果

(Effectiveness)。这主要通过观察性流行病学研究来实现,如队列研究或病例对照研

究。在真实世界中测算效果面临着巨大的挑战:就医行为偏差(打疫苗的人可能更注重健

康)和年龄/基础病的混杂会严重扭曲结果。

3.为了精准测算真实世界的效果,我在参与某市新型流感疫苗上市后评价时,主导采用了目

前国际公认且最高效的“检测阴性设计(Test-NegativeDesign,TND)”。这是一种特殊的

病例对照研究,我们仅在因出现呼吸道症状而来就诊的患者中开展,将核酸阳性者作为病

例组,阴性者作为对照组。这种精妙的设计完美抵消了人群的“医疗寻求行为偏倚”,再结

合多因素Logistic回归校正接种时间与年龄,最终得出该疫苗在真实社区传播中的校正保

护效果(VE)。这种基于严谨流行病学设计得出的真实数据,才是说服政府将自费疫苗

纳入医保或免费接种目录的最有力武器。

Q10:你在过往的学习或工作中,遇到过最难或最复杂的一次现场流行病学调查

(或病例复盘)是什么?请复盘当时的调查设计和最终结论。

❌不好的回答示例:

我遇到最难的一次调查是一个学校的拉肚子爆发。当时很多学生同时拉肚子,校长

很着急,一直催我们。难点就是学生们吃的东西太杂了,除了食堂还有外面的小卖

部,而且很多人记不清到底吃了什么,很难锁定到底是哪个菜有问题。后来我们就

去现场看,把所有发病的人集中起来问,做了个简单的统计,发现大部分人都吃了

食堂的某一道凉拌菜。虽然没有在菜里检测出细菌,但根据我们的经验判断肯定就

是这个菜了。最后就让食堂整改了,疫情也就控制住了。

为什么这么回答不好:

1.内容选择上的失误:描述的案例非常平庸(常规食源性暴发),且解决手段仅靠“简单统

计”和“经验判断”,完全没有体现出复杂疑难流调的“破案”技术含量。

2.逻辑结构上的缺陷:缺乏标准的现场流行病学推演逻辑(如三间分布分析、建立假设、分

析性研究验证),复盘过程像在讲流水账。

3.错失的加分机会:作为高频且需深度思考的核心题目,未能展示在面临“实验室阴性”或“信

息混杂”这种典型困局时,如何通过严密的数据建模或队列分析形成完整的证据链闭环。

高分回答示例:

1.我经历过最复杂的一次现场流调,是某大型工业园区突发的多点散发型重症肺炎疫情。难

点在于:两周内出现12例重症,但分布在6家毫无业务往来的企业,首批病原学广谱筛查

全部阴性,且未发现人传人证据。由于涉及几万人的停工恐慌,政府要求我们在72小时

内出具溯源定性报告。这是一场典型的信息碎片化、无明确暴露核心区的迷雾战。

2.面对僵局,我带领流调溯源专班彻底摒弃了常规的“发病企业内向型摸排”,果断拔高视

角,启动宏观环境的三间分布叠加分析。我们将12个病例的工作地、居住地和上下班通

勤轨迹,利用GIS系统(地理信息系统)打点并进行空间自相关分析。奇迹出现了:虽然

他们在不同厂区工作,但他们通勤轨迹的重合点,全部位于园区主干道某个十字路口方圆

1.5公里内。基于此,我大胆假设这是一起由环境污染气溶胶引发的点源暴露,而非普通

传染病。为了验证这一假说,我迅速设计了一项横断面叠加病例对照的研究:以距离该路

口不同半径画圈,测算发病罹患率,并抽取了园区内48名健康工人作为对照组进行行为

学问卷调查。

3.最终多因素分析结果显示,“过去两周内经常在核心十字路口停留或等红灯”是唯一的独立

危险因素(OR=18.5)。顺着这条线索,我们会同环保部门锁定了该路口附近一个正在违

规进行冷却塔清洗的化工厂,最终在冷却水深处分离出了高浓度的嗜肺军团菌,与后续几

名危重患者的支气管肺泡灌洗液测序高度同源。这次实战复盘让我深刻认识到,面对复杂

的聚集性疫情,突破常规的流行病学空间建模思维,与实验室精准检测的无缝咬合,才是

破局的关键。

Q11:如果你拿到一份辖区内过去五年的高血压患病率监测数据,存在大量缺失

值和异常值,你会如何进行清洗和预处理?

❌不好的回答示例:

拿到这种数据,我首先会把所有的数据导进Excel里面看一看。如果发现有些人的

年龄是空白的,或者血压值没填,因为缺了数据就没法做分析,我就会把这一整行

直接删掉。对于异常值,比如有些人收缩压填了300多或者50多,一看就是错的,

我也会把它们删掉或者手动改成一个正常的平均值。清理完之后,剩下的数据就都

是干净准确的了,然后再用SPSS算一下每年的发病率,画个图表给领导看就行

了。

为什么这么回答不好:

1.逻辑结构上的缺陷:处理流程极其简单粗暴,“直接删掉”缺失值和“手动改”异常值严重违

背了统计学和流行病学数据治理的基本伦理规范,会引入巨大的系统误差。

2.内容选择上的失误:没有对缺失值的机制(MCAR/MAR/MNAR)进行专业评估,缺乏利

用现代数据科学工具(如R/Python)进行大批量自动化规则清洗的思路。

3.给面试官留下的负面印象:暴露了求职者数据处理能力的极度匮乏,停留在本科生初级阶

段,无法胜任市级/省级疾控中心海量监测数据的深度挖掘工作。

高分回答示例:

1.疾控业务系统多年积累的监测数据往往是典型的“脏数据”,盲目剔除会造成严重的选择偏

倚,甚至扭曲疾病真实的流行趋势。拿到这份五年跨度的高血压监测数据后,我绝不会急

于进行统计分析,而是会依托R语言或Python,严格遵循公共卫生数据治理SOP,建立一

条可追溯的自动化数据清洗管道(DataPipeline)。

2.第一步是异常值(Outliers)的智能甄别与处理。我不会简单凭借主观经验修改,而是采

用“逻辑阈值+统计分布”双重校验法。一方面根据临床常识设定硬边界(如收缩压<70或

>260mmHg标记为异常);另一方面,利用箱线图(Tukey法则)或孤立森林算法识别潜

在的数据录入错误。对于确认为录入笔误的(如收缩压写成1200),我会追溯原始随访

表修正;对于真实存在的极端极值,我会在分析时保留并采用非参数检验或对数转换,以

保护生物学多样性真相。第二步是应对缺失值的精细化填补。我会首先分析缺失机制,如

果缺失率低于5%且判定为完全随机缺失(MCAR),可采用均值或中位数插补;但面对

慢病随访中常见的“非随机缺失”(如重症患者失访导致血压数据空缺),我坚决弃用删除

法或简单插补,而是利用多重插补法(MultipleImputation,如R的mice包),结合年龄、

性别、用药史等协变量联合推断,生成多组完整数据集进行合并分析。

3.最后一步,是进行数据的一致性降维和衍生变量构建。比如统一血压测量的单位、将连续

变量年龄转化为标准化年龄组(依据WHO标化人口),并依据现行的高血压防治指南,

编写代码自动生成“是否达标”的二分类标签。每次清洗我都会保留完整的语法脚本(Log

文件),确保从原始“脏数据”到最终分析级“干净视图”的每一步转换都经得起溯源审计,

从而产出高度可靠的流行病学报告。

Q12:为什么在突发公共卫生事件初期,往往很难准确计算出基本传染数

(R0)?你在实践中会如何利用现有数据进行估算?

❌不好的回答示例:

在突发传染病初期,很难算出R0是因为我们对这个新病毒还不了解,数据太少了。

很多感染的人可能没有症状,所以疾控中心发现不了他们,报上来的数字都是偏小

的,这就导致算不准。还有就是潜伏期多长大家也不知道。在实践中,如果领导要

我算R0,我就会看前几个病人平均每个人传染了多少个确诊的密切接触者,比如一

个人传了3个人,那就暂定R0是3。等以后大家开始大规模做核酸了,数据全面了,

再用电脑软件重新算一个准一点的。

为什么这么回答不好:

1.表达方式上的问题:对基本传染数R0(在没有干预且全人群易感情况下的传播力)的定

义理解不透彻,将其与有效传染数(Rt)混为一谈。

2.逻辑结构上的缺陷:提出“看前几个病人传了几个密接就是R0”的方法极其外行且存在巨大

的生存者偏差和滞后效应。

3.错失的加分机会:缺乏数理流行病学建模的专业深度,未提及利用代际间隔(Generation

Time)和疫情倍增时间(DoublingTime)结合数学模型进行估算的标准化科学方法。

高分回答示例:

1.在突发新发传染病(EID)的“战争迷雾”阶段,精准计算基本传染数(R0)堪比空中楼

阁。核心困境在于数学模型所需的三个底层参数极度匮乏:一是无症状感染比例未知导

致实际发病率(Incidence)存在巨大冰山现象;二是确切的传染期(Infectiousperiod)

和代际间隔(GenerationInterval)尚未被临床确证;三是初期报告系统存在不可避免的

报告延迟(ReportingDelay)。此外,一旦政府迅速介入非药物干预(NPIs),计算出

的数值就不再是R0,而是被压制的有效传染数(Rt)。

2.在实战中,面对初期极其有限且充满噪音的数据,我绝不会采用简单的“算数平均法”去数

密接人数,这会造成严重的低估。我会采用动力学模型和统计推断相组合的降维估算策

略。首先,我会深度挖掘首批核心聚集性病例(如家庭聚集或同一聚餐事件)的高质量流

调报告,通过精细计算这几十个确诊病例的接触时间轴,推导出一个初步的“系列间隔

(SerialInterval)”分布(通常服从伽马分布或威布尔分布)。

3.接着,在获取疫情发生前两周逐日新增的确诊病例或发热就诊人次形成流行曲线后,我会

利用R语言的EpiEstim或earlyR包进行拟合。我会特别设定一个包含不确定性区间的

参数矩阵,利用最大似然估计法(MLE)去拟合处于指数增长期的数据,从而给出一个

带有95%置信区间(如R0=2.5,95%CI:1.8-3.4)的估值域。这样提交给政府的不仅是

一个干瘪的数字,而是一份基于情景假设的风险预警范围,为早期是否需要启动全市范围

的交通熔断或方舱建设提供容错率极高的定量依据。

Q13:请分享一个你主导或深度参与的慢性病(如糖尿病/高血压)社区干预项

目,你是如何设定干预指标和评估终点的?

❌不好的回答示例:

我之前参与过社区的高血压健康管理项目。我们的干预指标主要就是给大爷大妈发

健康宣传册,每个月去给他们量一次血压,办一办健康讲座。评估终点的话,就是

在年底的时候,看看有多少人来听了讲座,然后算一下他们的血压是不是比年初的

时候降下来了。如果大家的平均血压都降了,就说明我们的干预项目很成功。最后

我们还搞了一个满意度调查问卷,社区居民觉得我们态度好,给打了高分,项目就

算圆满结题了。

为什么这么回答不好:

1.内容选择上的失误:“发传单、量血压、算平均值”这种属于最低层次的日常公卫服务,未

能体现出干预项目设计的“干预对照组”逻辑与流行病学深度。

2.逻辑结构上的缺陷:对“干预指标”和“评估终点”的概念混淆不清,将过程性指标(如讲座

参与人数)错误地等同于结局指标。

3.给面试官留下的负面印象:展示出的项目管理能力过于扁平,缺乏对慢病管理核心考核体

系(如规范管理率、血压控制率)的专业掌握。

高分回答示例:

1.慢性病防控是公共卫生的持久战,评价一个干预项目不能仅看“热闹程度”,必须依靠严谨

的评估框架。我曾深度主导某区“糖尿病同伴支持与数字化网格干预”项目,覆盖了4个街

道近5000名2型糖尿病患者。在项目顶层设计时,为避免以往“干预一阵风,撤走就反

弹”的弊端,我引入了RE-AIM框架(覆盖率、有效性、采用率、实施度、维持度)来全方

位设定我们的干预指标和评估终点。

2.在设定干预指标时,我将其拆解为三大维度:首先是过程性指标,摒弃了传统的“讲座次

数”,转而采用具有依从性约束的指标,如“智能血糖仪上传数据的周活跃率”和“个性化饮

食打卡完成率”。其次是近期结局指标(SurrogateEndpoints),除了常规的空腹血糖下

降值,我重点锁定了金标准——“糖化血红蛋白(HbA1c)达标率(<7.0%)的提升幅

度”。最后是卫生经济学干预指标,我们前瞻性地收集了患者在社区卫生服务中心的医保

门诊药费支出变化。

3.对于最终的评估终点,我设计了一项为期18个月的整群随机对照试验(ClusterRCT)。

我们不仅对比了干预组与常规管理对照组在HbA1c达标率上的统计学差异,更将“心血管

终点事件(如脑卒中、心梗住院)的发生密度”和“糖尿病视网膜病变/足病变等并发症的转

诊率”作为远期硬终点。项目结题时,我们通过多因素Cox回归证实,深度数字化干预使

患者的糖化控制率绝对值提升了18%,并首次在基层证明了该模式能显著降低急诊住院风

险率。这一高质量证据最终促成了该模式在全省范围的政策推广。

Q14:面对不明原因肺炎聚集性疫情,作为首批到达现场的流调人员,你的前

48小时核心工作清单是怎样的?

❌不好的回答示例:

如果遇到不明原因肺炎,前48小时肯定是最忙的。第一天我会赶紧带队去医院,穿

好防护服去病房看病人,问他们最近去过哪里、接触过什么人,把流调表填满。然

后赶紧找护士抽血和采样,送回疾控中心实验室去化验,看看能不能测出是什么病

毒。第二天我会去病人住的地方或者单位去看看环境怎么样,消个毒,顺便把跟病

人一起吃饭、生活的人都找出来,让他们先待在家里别乱跑,观察一下有没有发烧

咳嗽的。大概就是这些工作。

为什么这么回答不好:

1.逻辑结构上的缺陷:工作内容杂乱无章,缺乏突发急性传染病早期处置的高效战术体系和

优先级排序(如先稳住大盘、定边界,再深挖细节)。

2.内容选择上的失误:遗漏了核心环节,如“提出并每日动态更新病例定义”、“封控高危场

所”、“建立临时监测系统”。

3.表达方式上的问题:表述缺乏实战紧迫感,未能展现作为现场流行病学专家(EPI)在面

对“不明病原体”时的底线思维和风险沟通能力。

高分回答示例:

1.面对不明原因肺炎聚集性疫情,前48小时是“与死神竞速”的黄金窗口期。此时病原体未

知、传播途径不明,作为首批抵达现场的流调组长,我必须抱持“假设是最坏情况(如呼

吸道高致病性极强)”的底线思维,抛弃常规慢条斯理的调查,迅速推行以“控制传播、界

定范围、定向寻源”为核心的极速突击清单。

2.0-12小时:封堵与摸底。第一优先级不是立刻问卷,而是“物理隔绝与定标准”。立刻指导

医疗机构将现有病例转入负压/隔离病房,严控院感;同时,我会协同专家组紧急制定基

于临床症状(发热+肺部影像学特征)的第一版“宽泛病例定义”。凭借此定义,火速启动

医院HIS系统回溯检索过去两周的相似病例,并第一时间采集全套呼吸道及血清样本送往

上级进行宏观基因组(mNGS)测序。12-24小时:轨迹交叉与包围圈。兵分两路,一路

对首批病例进行地毯式核心轨迹流调(哪怕极其耗时),利用大数据强力寻找他们之间

的“时空交集点”(如某海鲜市场或某次会议),一旦锁定高度可疑共同暴露场所,立刻建

议政府实行封控并开展环境大采样。另一路迅速划定密接圈并实施集中医学观察。

3.24-48小时:主动预警与建立假设。疫情绝不仅限于已发现的冰山一角。我会立刻在辖区

内所有发热门诊、基层社区和药店建立“发热伴呼吸道症状”的每日零报告主动监测哨点。

汇总前两天的流行病学“三间分布”图谱后,连夜召开分析会,提出关于潜伏期、核心传播

途径(飞沫/气溶胶/接触)的初步科学假设。这份包含了阻断策略的动态评估报告将在第

48小时准时放在防疫指挥部的桌面上,为后续调动社会资源提供最具专业分量的“作战沙

盘”。

Q15:请描述一次你使用R语言、SAS或Python进行复杂流行病学模型拟合

(如SIR模型或生存分析)的具体经历,遇到了什么难点?

❌不好的回答示例:

我在做毕业论文的时候用SPSS做过生存分析。主要是研究不同治疗方案对癌症病

人生存时间的影响。当时我没有用R语言和Python,因为我觉得写代码太难了,还

是鼠标点点的软件比较方便。当时遇到的难点就是,有些病人中途失访了找不到人

了,或者没死是因为其他原因死的。我就上网查了一下,把这些人都算作删失数据

处理。然后跑到软件里点生存分析,出了一个KM曲线,看到两条线分开了,P值小

于0.05,我就觉得模型拟合成功了,就写到论文里了。

为什么这么回答不好:

1.内容选择上的失误:题目明确要求描述使用R/SAS/Python进行复杂模型拟合的经历,求

职者却回答使用初级的SPSS,严重偏离了对“技术硬核岗位”编程能力的考核预期。

2.逻辑结构上的缺陷:对难点的描述非常浅薄(仅仅是懂得了删失的基本概念),没有触及

模型拟合的核心痛点(如等比例风险假设检验、共线性处理等)。

3.给面试官留下的负面印象:暴露了其在数据科学和高级生物统计方面的短板,不符合对复

杂疾控数据进行高阶分析的要求。

高分回答示例:

1.在评估某市结核病高危人群“主动筛查+预防性治疗”干预策略的长期效果时,为了突破传

统观察性研究的局限,我运用R语言主导构建了一个包含时变协变量的复杂生存分析模型

(Time-DependentCoxRegression)。这个项目的目标不仅是得出一条简单的生存曲

线,而是要精确计算在整个十年的随访周期内,由于个体行为或治疗依从性动态改变而导

致的疾病进展风险的波动。

2.在拟合过程中,我遇到了两个极具挑战性的难点。第一是等比例风险假设(PH

Assumption)的违背。在初步拟合Cox模型后,我使用R中的cox.zph()函数进行检验,

发现“患者是否合并糖尿病”这一变量的Schoenfeld残差随时间发生显著倾斜

(P<0.01)。这意味着该因素的影响力随时间衰减,如果强行拟合将导致极其严重的偏

倚。为了攻克这一难点,我通过在模型中引入该变量与时间函数的交互项(Time-Varying

Effects),成功校正了非等比例风险,使模型重新达到稳健状态。

3.第二个难点是高维数据产生的多重共线性和变量筛选问题。基线调查包含了多达80项社

经地位及临床生化指标。如果全量投入普通Cox模型会导致过度拟合且难以收敛。我果断

引入了机器学习算法中的惩罚回归技术,使用glmnet包构建了Lasso-Cox生存模型。通

过十折交叉验证寻找最优的λ惩罚系数,不仅成功将冗余变量压缩至零,提取出最具预测

价值的12个核心风险因子,还显著提升了模型在测试集中的C-index(一致性指数至

0.82)。这次经历让我坚信,只有将现代编程算法与深厚的流行病学理论融会贯通,才能

从海量噪声中榨取出指引公共卫生决策的“真金”。

Q16:在食源性疾病暴发调查中,如何通过病例的饮食暴露史快速锁定可疑食

物?请结合实际案例说明。

❌不好的回答示例:

如果有食物中毒暴发了,我会先设计一个很详细的问卷,把他们这几天吃过的所有

东西都列在上面,然后挨个问发病的人。问完之后,就看哪个菜大家吃得最多。比

如有20个人拉肚子,其中18个人都吃了食堂的红烧肉,那我们基本上就能判定红烧

肉是可疑食物了。然后赶紧把食堂查封,把剩下的红烧肉送到化验室去检测,如果

能查出来有细菌,那就是证据确凿了。主要就是靠问卷调查加统计频率来找可疑食

物。

为什么这么回答不好:

1.逻辑结构上的缺陷:只调查病例而忽略对照组,仅通过“谁吃得最多”来锁定食物,这是流

行病学溯源中最典型的“幸存者偏差”逻辑陷阱(大家都吃米饭,但米饭未必有毒)。

2.内容选择上的失误:缺乏标准分析性流行病学工具的应用(如未提及计算罹患率或OR

值)。

3.错失的加分机会:未能展示现场快速分析的技巧,比如在病例对照研究或回顾性队列研究

中的交叉列表(Cross-tabulation)分析能力。

高分回答示例:

1.在食源性疾病暴发的黄金期,仅凭“发病者中吃得最多的食物”来定案极其危险,因为这极

易将大众主食(如米饭)误认为污染源。要快速、精准锁定靶点,必须建立基于数据对比

的分析性流行病学推演机制。在没有明确线索时,我的核心策略是:先用假设生成(描述

性)广泛撒网,再用假设验证(回顾性队列或病例对照)精准狙击。

2.在处理一起百人规模的婚宴疑似副溶血性弧菌食物中毒暴发时,我就是利用这一策略在现

场4小时内实现破局的。到达现场后,由于就餐人员明确(完全封闭的聚餐人群),我立

刻采用了回顾性队列研究设计。团队不光调查发病者,同时严格询问了同桌未发病者的菜

单。我利用Excel在现场快速建了一个二乘二表(交叉分析表),针对婚宴上的20多道菜

品,逐一计算“吃过该菜的罹患率”与“未吃该菜的罹患率”,并得出相对危险度(RR值)。

结果显示,虽然90%的人都吃了主打菜“清蒸多宝鱼”,但未吃的人同样大量发病(RR接近

1);然而,对于一道不起眼的冷盘“捞汁海蜇”,吃过的人发病率高达85%,没吃的人发

病率仅为5%,其RR值高达17。

3.锁定“捞汁海蜇”后,我们并没有停止,因为污染往往发生在厨房。结合RR值,我们立即对

后厨砧板和厨师进行专项流调,最终发现负责冷菜的厨师手部有感染创口,且发生了生熟

交叉污染。实验室最终在海蜇和厨师伤口处分离出同源菌株,形成了无懈可击的证据链闭

环。这证明,通过科学的列联表测算暴露相关的关联强度(RR/OR),是现场流调剥茧

抽丝的最强力工具。

Q17:如果法定传染病大网络报告系统提示某地诺如病毒感染呈异常上升趋势,

你如何判断这是真实暴发还是因检测能力提升导致的“假性聚集”?

❌不好的回答示例:

如果看到系统里诺如病毒的数据突然变多了,我会先打电话给当地的疾控中心问问

情况。看看他们最近是不是引进了新的检测仪器,或者是不是上级刚下发了要求加

强诺如检测的文件。如果是的话,那可能就是检测能力提升导致的假性聚集,因为

以前查不出来的现在都能查出来了。如果不是因为仪器和政策的原因,而是当地真

的有很多学校报告了学生拉肚子的聚集性疫情,而且去医院看病的人确实变多了,

那就说明是真实的暴发,我们需要马上派人去现场调查处置了。

为什么这么回答不好:

1.逻辑结构上的缺陷:判断方式过于依赖“打电话询问”这种主观打听,缺乏运用公共卫生监

测数据进行多维度交叉验证的客观数据分析思维。

2.内容选择上的失误:未能提出具体的数据分析指标,如重症比例、试剂盒阳性率波动、历

史基线比对等核实技术。

3.错失的加分机会:面对这种监测系统的经典预警挑战,未能体现出高级别公卫人员利用时

间序列模型或症状监测预警系统进行交叉比对的硬核实力。

高分回答示例:

1.面对传染病直报系统发出的异常上升预警,公卫医师必须具备“穿透数据迷雾”的甄别能

力。因为诸如诊断标准的变更、医保政策调整、新型高灵敏度快检试剂的大规模下发,都

会引发数据的“假性暴发(ArtifactualOutbreak)”。要精准界定其真实性,我绝不会轻信

单一维度的数字,而是会启动“多维监测基线比对与临床特征交叉校验”的立体甄别机制。

2.首先,我会拉取该地区过去五年的诺如病毒历史发病曲线,运用控制图预警模型(如移动

流行区间法MEM或Serfling回归)计算当前的暴发阈值。如果当前数据仅是轻微越过阈

值,我会立刻核对检测数据池(Denominator):不仅看阳性确诊数的绝对值增加,更要

计算“检测阳性率(PositivityRate)”。如果是因为大规模筛查导致的检测基数急剧扩

大,但阳性率反而保持平稳甚至下降,这往往是检测能力提升或过度筛查带来的“假性聚

集”。相反,如果送检数量未显著增加,但核酸阳性率从5%陡增至30%,则强烈提示社区

存在真实的广泛暴露。

3.其次,我必定会联动其他维度的预警网络进行旁证(ProxyIndicators)。真实的大规模传

染病暴发绝不会孤立地体现在一张报表上。我会立即调取当地教育部门的“中小学因病缺

勤缺课监测系统”,查看胃肠道症状缺课率是否同步飙升;同时查看医疗机构HIS系统中

的“急诊止泻药/补液盐处方量”是否异常激增。只有当病原学确诊数的异常升高,与症状监

测、药店销售及高危场所缺勤率形成多维共振,且重症就诊基数呈现同比例扩大时,我才

会果断将警报定性为“真实暴发”,并立即触发应急响应预案,防止假警报导致的公共资源

极大浪费。

Q18:请详细说明在进行1:1匹配的病例对照研究时,如何选择合适的对照组以

最大程度避免选择偏倚?

❌不好的回答示例:

做1:1匹配的时候,给每个病例找一个条件差不多的对照就行了。为了避免偏倚,主

要是看我们想控制什么因素。比如我觉得年龄和性别会影响结果,我就给一个50岁

的男病人,去医院里找一个同样也是50岁、得的不是这个病的男病人当对照。找对

照最方便的地方就是医院的门诊或者病房,只要他们愿意配合调查就可以。或者去

病人家属或者邻居里面找也行。匹配好之后,我们就问他们以前的情况,比对一下

看有什么不同,就能找出原因了。

为什么这么回答不好:

1.内容选择上的失误:将医院病房中“得其他病的病人”作为首选对照,极易引入著名的“伯克

森偏倚(Berkson'sbias)”,这是流行病学设计的大忌。

2.逻辑结构上的缺陷:没有详细阐述匹配因素(协变量)的选取原则,如果过度匹配

(Over-matching)会导致研究效率下降甚至无法得出结论,这一点完全未被提及。

3.表达方式上的问题:“找一个条件差不多的就行了”显得极其随意,缺乏流行病学顶层设计

对“对照组必须能代表产生病例的源人群”这一核心法则的深刻理解。

高分回答示例:

1.在1:1匹配的病例对照研究中,对照组的选取是关乎整个研究生死存亡的核心骨架。如果

对照组选错了,后续再高级的复杂统计模型也无法挽救因选择偏倚带来的致命偏差。选择

对照的黄金法则是:对照组必须无偏地代表产生病例的“源人群(SourcePopulation)”,

且除了匹配因素外,其他暴露特征应当是随机的。要最大程度规避选择偏倚,必须在“人

群来源”和“匹配变量设定”上进行精细手术。

2.在来源选择上,我坚决警惕并规避医院源的“伯克森偏倚”。虽然在医院找其他疾病患者做

对照最便捷,但他们往往具有更频繁的就医行为或叠加基础病,其暴露率(如吸烟史)根

本无法代表真实社区人群。因此,我首推“基于社区的人群对照”。例如在调查某地散发性

新型脑炎的危险因素时,我采用了“邻居匹配法(NeighborhoodControl)”。每确诊一个

病例,流调员会以该病例住址为中心,按照一定规则(如向东第3户)在同社区寻找未发

病的居民。这种空间匹配极其巧妙地均衡了社会经济地位、环境暴露和微气候因素,最大

程度还原了源人群的基线状态。

3.在匹配变量的设定上,我严格遵循“只匹配那些明确的强混杂因素,且绝不匹配研究的主

效应暴露因素”。我们通常只对年龄(±3岁)、性别进行强制匹配。实操中最容易犯的致

命错误是“过度匹配(Over-matching)”。如果我们在调查食源性暴发时,不仅匹配年龄性

别,还把“是否同桌就餐”作为匹配项,那病例和对照在食物暴露上的差异将被彻底抹平,

导致OR值无限趋近于1。只有把握好代表性与匹配精度的平衡,才能让对照组成为真正

的“标尺”,精准测出可疑暴露的致病权重。

Q19:针对结核病这类慢性传染病,在重点人群(如学校、养老院)中开展主动

筛查的成本效益应当如何评估?

❌不好的回答示例:

在学校和养老院做结核病主动筛查肯定是有必要的。评估成本效益,就是算一算我

们花了多少钱。成本主要包括买PPD皮试或者抽血化验的试剂钱,还有医护人员的

人工费。效益方面,就是看我们能查出多少个隐藏的结核病人。如果花了几十万,

查出来好几个传染源,并且把他们治好了,防止了在学校里大范围传染,那我觉得

这个钱花得就值,效益就很高。因为如果不管的话,等爆发了要花更多的钱去治病

和停课消毒,所以肯定是主动筛查比较划算。

为什么这么回答不好:

1.逻辑结构上的缺陷:对成本效益分析(CBA)或成本效果分析(CEA)的框架理解非常

浅薄,只计算了直接试剂成本,完全忽略了假阳性带来的过度诊断成本、间接成本以及生

命质量(QALY)的量化。

2.内容选择上的失误:没有结合结核病特有的流行病学特征(如潜伏感染LTBI的转化率),

在养老院和学校这两种截然不同的人群中,筛查效益是有天壤之别的,未做分层讨论。

3.表达方式上的问题:“我觉得花得值”极其主观,缺乏卫生经济学评价模型硬核数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论