2025年生物统计与流行病学考试题及答案_第1页
2025年生物统计与流行病学考试题及答案_第2页
2025年生物统计与流行病学考试题及答案_第3页
2025年生物统计与流行病学考试题及答案_第4页
2025年生物统计与流行病学考试题及答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年生物统计与流行病学考试题及答案一、单项选择题(每题2分,共20分)1.某研究探讨PM2.5暴露与儿童哮喘发病的关系,选择某城市3所小学的1200名7-10岁儿童,基线均无哮喘,随访3年观察哮喘发生情况。该研究设计属于:A.病例对照研究B.队列研究C.横断面研究D.随机对照试验答案:B解析:队列研究的特征是“由因到果”的观察性研究,研究对象在基线时无结局(哮喘),通过随访观察暴露(PM2.5)与结局的关联。2.采用Kaplan-Meier法估计生存曲线时,某时间点的生存概率计算需基于:A.该时间点前所有未发生事件的个体数B.该时间点发生事件的个体数C.该时间点的截尾个体数D.该时间点的期初风险人数答案:D解析:Kaplan-Meier法的生存概率是累积生存概率,每个时间点的生存概率为(期初风险人数-事件数)/期初风险人数,因此需基于期初风险人数。3.某临床试验比较新药A与标准药物B的疗效,主要终点为6个月无进展生存率。若样本量计算时将α从0.05调整为0.01,其他参数不变,则所需样本量会:A.减少B.增加C.不变D.无法确定答案:B解析:α越小(检验水准更严格),需要更大的样本量来保证检验效能(1-β),因此样本量增加。4.欲分析糖尿病患者糖化血红蛋白(HbA1c,连续变量)与糖尿病肾病(二分类变量)的关系,最适宜的统计方法是:A.独立样本t检验B.卡方检验C.Logistic回归D.方差分析答案:C解析:Logistic回归用于二分类结局与多个自变量(包括连续变量)的关联分析,可估计OR值。5.某横断面研究发现,高盐饮食者的高血压患病率显著高于低盐饮食者(P<0.05),但该结论可能存在的主要偏倚是:A.回忆偏倚B.失访偏倚C.现患-新发病例偏倚D.测量偏倚答案:C解析:横断面研究测量的是现患病例,可能遗漏已死亡或痊愈的新发病例,导致高盐饮食与高血压的关联被低估或高估(现患-新发病例偏倚)。6.在队列研究中,控制混杂偏倚最有效的方法是:A.限制研究对象的特征(如仅纳入40-60岁人群)B.匹配C.多因素回归分析D.分层分析答案:A解析:限制(restriction)通过限定研究对象的特征(如年龄、性别),直接排除混杂因素的影响,是最有效的控制方法(匹配可能引入匹配过度,回归分析为统计控制)。7.某研究报告中,OR=2.3(95%CI:1.8-2.9),P=0.001,说明:A.暴露组结局发生风险是对照组的2.3倍B.暴露与结局的关联无统计学意义C.暴露与结局的关联有统计学意义,且排除了抽样误差的影响D.暴露与结局的关联强度较弱答案:C解析:OR>1且95%CI不包含1,P<0.05,说明关联有统计学意义,且CI范围较窄,抽样误差较小。8.生存分析中,“截尾”的主要原因不包括:A.研究结束时事件未发生B.研究对象失访C.研究对象因其他疾病死亡D.研究对象发生了所关注的事件答案:D解析:截尾(censoring)指未观察到所关注事件的结局,若事件已发生则为完全数据,不属于截尾。9.为评价某疫苗的保护效果,最佳研究设计是:A.队列研究(暴露为接种疫苗)B.病例对照研究(病例为患病者)C.随机对照试验(随机分配接种或不接种)D.横断面研究(调查接种率与患病率)答案:C解析:RCT通过随机分配消除混杂因素,是评价干预措施效果的金标准。10.某研究用Cochrran-Armitage趋势检验分析吸烟量(0支/天、1-10支/天、>10支/天)与肺癌的关联,该检验的原假设是:A.不同吸烟量组的肺癌发生率相等B.吸烟量与肺癌发生率无线性趋势C.吸烟量与肺癌发生率有线性趋势D.吸烟是肺癌的危险因素答案:B解析:Cochran-Armitage趋势检验用于检验二分类结局与有序分类暴露之间是否存在线性趋势,原假设为无线性趋势。二、简答题(每题8分,共40分)1.简述巢式病例对照研究(nestedcase-controlstudy)的设计原理及其相对于传统病例对照研究的优势。答案:巢式病例对照研究是队列研究的衍生设计:首先建立一个队列,收集所有研究对象的暴露信息并随访结局;当队列中出现所关注的结局(病例)时,从同一队列的非病例中按一定比例(如1:4)匹配选择对照;最终仅对病例和对照的暴露资料进行分析。优势:①暴露资料在结局发生前收集,避免回忆偏倚;②对照来自同一队列,可比性强,减少选择偏倚;③节省资源(仅需分析病例和对照的样本),适用于大队列研究;④保留了队列研究“由因到果”的时间顺序,因果推断力度强于传统病例对照研究。2.比较Logistic回归与Cox比例风险回归的应用场景及主要区别。答案:应用场景:-Logistic回归:结局为二分类变量(如患病/未患病),用于分析暴露因素与结局的关联,估计比值比(OR)。-Cox回归:结局为时间-事件数据(如生存时间、疾病进展时间),允许存在截尾数据,用于分析影响事件发生风险的因素,估计风险比(HR)。主要区别:①结局类型:Logistic回归为二分类结局(无时间维度);Cox回归为时间-事件结局(包含时间和事件发生状态)。②模型假设:Cox回归假设风险比在时间上保持恒定(比例风险假设),Logistic回归无时间相关假设。③数据利用:Cox回归充分利用截尾数据的信息(仅知道事件未在观察时间内发生);Logistic回归若直接分析随访数据会丢失时间信息。④参数意义:Logistic回归的OR反映结局发生的比值比;Cox回归的HR反映各时间点的瞬时风险比。3.简述混杂因素(confounder)需满足的三个条件,并举例说明。答案:混杂因素需满足以下三个条件:①是疾病的危险因素(与结局独立相关):例如,年龄是冠心病的危险因素(年龄越大,冠心病风险越高)。②是暴露的相关因素(与暴露独立相关):例如,年龄与吸烟暴露相关(老年人吸烟率可能更高)。③不是暴露与结局因果链上的中间变量(非中介变量):例如,吸烟导致肺功能下降(中间变量),肺功能下降导致COPD,此时肺功能不是混杂因素,而是中介变量。举例:研究吸烟(暴露)与肺癌(结局)的关系时,年龄可能是混杂因素——年龄大的人群吸烟史更长(与暴露相关),且年龄本身是肺癌的危险因素(与结局相关),且年龄不处于吸烟→肺癌的因果链中。4.简述随机对照试验(RCT)中“双盲”(double-blind)的定义及其在控制偏倚中的作用。答案:双盲指研究者(包括干预实施者、结局评估者)和研究对象均不知道研究对象被分配到的干预组(试验组或对照组)。作用:①控制观察偏倚(observerbias):若研究者知道分组,可能在测量结局时产生主观倾向(如对试验组更仔细地检测不良反应);双盲可确保结局评估的客观性。②控制对象的行为偏倚(performancebias):若研究对象知道自己在试验组,可能改变生活方式(如更积极配合治疗),影响结局;双盲可使两组对象的行为保持一致。③提高依从性:双盲设计减少对象因偏好某组而退出的可能,降低失访偏倚。注:双盲需结合安慰剂对照(若可行),否则盲法可能失效(如手术干预难以盲法)。5.简述发病率(incidencerate)与患病率(prevalence)的区别与联系,并用公式表示两者的关系(假设疾病处于稳定状态)。答案:区别:①定义:发病率是一定时期内新发生的病例数与该时期平均人口数的比值,反映疾病的发生频率;患病率是某一时点或时期内现患病例数与该时期平均人口数的比值,反映疾病的存在频率。②时间维度:发病率是动态指标(关注“新发病例”);患病率是静态或时期指标(关注“现患病例”)。③影响因素:发病率受疾病发生风险(如暴露、遗传)影响;患病率受发病率(incidence)和病程(duration)共同影响(P=I×D,稳定状态下)。联系:在疾病处于稳定状态(无大量迁入/迁出、发病率和病程稳定)时,患病率(P)等于发病率(I)乘以平均病程(D),即P=I×D。例如,若某病年发病率为100/10万,平均病程为5年,则患病率约为500/10万。三、计算题(每题15分,共30分)1.某研究探讨肥胖(BMI≥28kg/m²)与2型糖尿病(T2DM)的关系,收集了某社区5000名40岁以上居民的资料,结果如下表:|分组|调查人数|T2DM病例数|||-|||肥胖组|1200|240||非肥胖组|3800|380|(1)计算肥胖组与非肥胖组的T2DM患病率。(2)计算肥胖与T2DM关联的比值比(OR),并解释其意义。(3)进行卡方检验(列出检验假设、计算卡方值、自由度及结论,α=0.05)。答案:(1)患病率计算:肥胖组患病率=240/1200=0.20(20%)非肥胖组患病率=380/3800=0.10(10%)(2)OR计算(病例对照研究中OR≈队列研究的RR,但此处为横断面研究,OR可近似反映关联强度):OR=(a×d)/(b×c)=(240×3420)/(960×380)=(820800)/(364800)=2.25意义:肥胖者患T2DM的比值是非肥胖者的2.25倍(或肥胖与T2DM的关联强度为2.25)。(3)卡方检验:H₀:肥胖与T2DM无关联(π₁=π₂)H₁:肥胖与T2DM有关联(π₁≠π₂)四格表数据:||病例|非病例|合计||-||--|-||肥胖组|240|960|1200||非肥胖组|380|3420|3800||合计|620|4380|5000|卡方值计算公式:χ²=n(ad-bc)²/(a+b)(c+d)(a+c)(b+d)代入数据:χ²=5000×(240×3420-960×380)²/(1200×3800×620×4380)计算分子:240×3420=820800;960×380=364800;差值=820800-364800=456000;平方=207936000000分母:1200×3800=4,560,000;620×4380=2,715,600;分母=4,560,000×2,715,600=12,383,136,000,000χ²=5000×207936000000/12383136000000≈(1.03968×10¹⁵)/(1.2383136×10¹³)≈83.96自由度df=(2-1)(2-1)=1查卡方界值表,χ²₀.₀₅,1=3.84,计算得χ²=83.96>3.84,P<0.05,拒绝H₀,认为肥胖与T2DM存在统计学关联。2.某临床试验随访了10例癌症患者的生存时间(月),其中3例截尾(标记为“+”),数据如下:5,7,9+,12,15+,18,20,22+,25,30。(1)用Kaplan-Meier法计算各时间点的生存概率(列出计算步骤)。(2)估计中位生存时间。答案:(1)Kaplan-Meier生存概率计算步骤:①按生存时间升序排列(截尾数据排在同时间点的完全数据之后):5(事件),7(事件),9+(截尾),12(事件),15+(截尾),18(事件),20(事件),22+(截尾),25(事件),30(事件)②计算各事件时间点的期初风险人数(Nt)、事件数(dt)、生存概率(St):-时间t=5月:Nt=10(所有10例均存活至5月前)dt=1(1例事件)生存概率S(5)=(10-1)/10=0.9-时间t=7月:Nt=10-1(t=5月事件)-0(无截尾)=9(因t=5月后无截尾,9例仍在风险中)dt=1(1例事件)生存概率S(7)=S(5)×(9-1)/9=0.9×(8/9)≈0.8-时间t=9月(截尾):Nt=9-1(t=7月事件)=8(t=7月后无事件,8例在风险中)dt=0(无事件)生存概率S(9)=S(7)×(8-0)/8=0.8×1=0.8(截尾不影响生存概率,仅减少后续风险人数)-时间t=12月:Nt=8-1(t=9月截尾)=7(t=9月截尾1例,剩余7例在风险中)dt=1(1例事件)生存概率S(12)=0.8×(7-1)/7≈0.8×0.857≈0.6857-时间t=15月(截尾):Nt=7-1(t=12月事件)=6(t=12月后无事件,6例在风险中)dt=0(无事件)生存概率S(15)=0.6857×(6-0)/6=0.6857×1=0.6857-时间t=18月:Nt=6-1(t=15月截尾)=5(t=15月截尾1例,剩余5例在风险中)dt=1(1例事件)生存概率S(18)=0.6857×(5-1)/5≈0.6857×0.8≈0.5486-时间t=20月:Nt=5-1(t=18月事件)=4(t=18月后无事件,4例在风险中)dt=1(1例事件)生存概率S(20)=0.5486×(4-1)/4≈0.5486×0.75≈0.4115-时间t=22月(截尾):Nt=4-1(t=20月事件)=3(t=20月后无事件,3例在风险中)dt=0(无事件)生存概率S(22)=0.4115×(3-0)/3=0.4115×1=0.4115-时间t=25月:Nt=3-1(t=22月截尾)=2(t=22月截尾1例,剩余2例在风险中)dt=1(1例事件)生存概率S(25)=0.4115×(2-1)/2≈0.4115×0.5≈0.2058-时间t=30月:Nt=2-1(t=25月事件)=1(t=25月后无事件,1例在风险中)dt=1(1例事件)生存概率S(30)=0.2058×(1-1)/1=0(最后1例事件,生存概率为0)(2)中位生存时间:即生存概率为0.5时的时间点。观察生存概率:-S(18)=0.5486(>0.5)-S(20)=0.4115(<0.5)因此中位生存时间在18-20月之间,采用线性插值法:设中位时间为t,S(t)=0.5,斜率=(0.4115-0.5486)/(20-18)=(-0.1371)/2=-0.06855(每月下降0.06855)需要从0.5486下降到0.5,差值=0.5486-0.5=0.0486所需时间=0.0486/0.06855≈0.71月因此中位生存时间≈18+0.71≈18.71月(或表述为18-20月之间,更精确需软件计算)。四、案例分析题(30分)某研究团队计划在某农村地区开展一项“家庭医生签约服务对高血压控制率的影响”的研究。该地区18岁以上常住居民约5万人,高血压患病率约30%(根据2023年社区筛查数据)。研究目的是比较签约家庭医生的居民与未签约居民的高血压控制率(控制定义为收缩压<140mmHg且舒张压<90mmHg),并分析影响控制率的因素。要求:(1)设计该研究的最佳流行病学研究类型,并说明理由。(2)列出主要研究变量(包括暴露变量、结局变量、混杂变量)。(3)简述数据收集的主要步骤(至少5项)。(4)提出控制偏倚的具体措施(至少4项)。(5)若最终纳入2000名高血压患者(1000名签约,1000名未签约),控制率分别为65%和45%,计算相对危险度(RR)、风险差(RD)并解释其公共卫生意义。答案:(1)最佳研究类型:队列研究(前瞻性)或匹配的病例对照研究;但因研究目的是“影响”(因果推断),且结局(控制率)为二分类,最佳选择是队列研究(前瞻性)。理由:-队列研究可观察“签约”(暴露)在前,“控制”(结局)在后的时间顺序,符合因果推断的时间顺序要求。-可直接计算RR(相对危险度),反映签约服务对控制率的影响强度。-研究对象为高血压患者(已患病),属于患病队列,关注的是干预(签约)对疾病控制的影响,符合队列研究设计。(若选择RCT,需随机分配签约与否,但家庭医生签约可能涉及政策实施,伦理上可能难以强制未签约组不签约,因此队列研究更可行。)(2)主要研究变量:-暴露变量:是否签约家庭医生(二分类:是/否)。-结局变量:高血压控制情况(二分类:控制/未控制;控制定义为收缩压<140mmHg且舒张压<90mmHg)。-混杂变量:①人口学因素(年龄、性别、文化程度);②临床因素(高血压病程、合并症如糖尿病、用药依从性);③行为因素(低盐饮食、规律运动、吸烟饮酒);④医疗资源因素(距离最近诊所的距离)。(3)数据收集步骤:①确定研究对象:从社区高血压患者管理档案中,纳入2024年1月1日前确诊的18岁以上高血压患者(排除妊娠、严重精神疾病等无法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论