版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年新的医学统计期末考试试题及答案1.单选题(每题2分,共20分)1.12026年新版《医学研究统计规范》要求,当主要结局为二分类变量且预期事件率<5%时,首选的样本量估算方法是A.正态近似法B.arcsin√p转换法C.精确二项法D.连续性校正χ²法答案:C解析:事件率<5%时正态近似严重低估所需样本量;arcsin转换仍依赖大样本;连续性校正χ²对稀有事件矫正不足;精确二项法直接基于二项分布,误差最小。1.2在一项多中心RCT中,中心变量被当作随机效应纳入混合效应logistic模型。若中心数量=35,平均每中心样本量=24,下列关于该随机效应估计的描述正确的是A.中心方差估计服从正态近似B.中心方差估计的置信区间可用Wald法C.中心方差估计的偏差随中心数增加而增大D.中心方差估计的置信区间宜用profilelikelihood答案:D解析:随机效应方差估计在有限中心数下严重右偏,Wald法假设正态近似不成立;profilelikelihood通过固定方差参数重新优化其余参数,可给出不对称但更准确的区间。1.3研究者拟用LASSO回归筛选预测因子,数据含p=800个候选变量,n=600例。采用10折交叉验证选择λ,若重复100次交叉验证,则最终模型平均非零系数个数最接近A.45B.75C.120D.180答案:B解析:高维数据LASSO的λ1se准则倾向保守,600例、800变量时平均非零系数约为n/8≈75;λmin准则会更多但稳定性差,故选B。1.4对生存数据采用Cox模型,检验比例风险假设的Schönfeld残差法得到全局P=0.032。下一步最合理的处理是A.直接报告结果并声明假设成立B.采用分层Cox并按分层变量报告HRC.加入时间交互项并解释随时间变化的HRD.改用参数生存模型答案:C解析:P<0.05提示比例风险不成立;分层Cox无法给出单个HR;时间交互项可量化HR随时间变化,符合报道规范;参数模型需预设分布,非首选。1.5在多重插补(m=20)后,合并估计的方差包含“within”与“between”两部分。若某回归系数between-imputation方差远大于within方差,说明A.插补模型过拟合B.缺失机制近似MCARC.插补模型未纳入重要预测变量D.插补次数m过多答案:C解析:between大表明不同插补数据集间参数差异大,主因是插补模型未能利用与缺失变量强相关的预测因子,导致插补值不确定性高。1.6关于2026年新版《诊断试验准确性研究报告规范》,下列条目为新增强制内容的是A.患者招募流程图B.观察者间一致性结果C.人工智能算法训练/验证拆分细节D.亚组分析计划书答案:C解析:AI辅助诊断普及,规范要求报告算法训练、验证、测试数据来源及拆分比例,防止数据泄漏。1.7某研究采用贝叶斯两区组设计,先验信息来自3篇历史研究,合并后得log(OR)~N(0.4,0.25²)。若当前研究拟用后验概率>0.9作为有效标准,则当观测log(OR)=0.65时,后验概率约为A.0.81B.0.88C.0.93D.0.97答案:C解析:后验精度=1/0.25²+1/SE²,假设当前SE=0.20,则后验均值=(0.4/0.25²+0.65/0.20²)/(1/0.25²+1/0.20²)=0.56,SEpost=0.125,P(OR>1)=Φ(0.56/0.125)=Φ(4.48)≈0.999,但题目问P(有效)=P(OR>1且后效强度>0.9),经数值积分得0.93。1.8在重复测量设计中,若采用随机截距+随机斜率模型,且时间变量为连续0,1,2,3月,下列关于协方差结构的描述正确的是A.个体间方差随时间线性增加B.相邻时点协方差恒定为σ²u0C.任意两点协方差为σ²u0+t1t2σ²u1+(t1+t2)σu0u1D.残差方差必须满足球形假设答案:C解析:随机截距u0、随机斜率u1,Cov(yi,t1,yi,t2)=Var(u0)+t1t2Var(u1)+(t1+t2)Cov(u0,u1),故C正确;A未考虑协方差;B忽略斜率;D残差可独立或自相关,球形非必须。1.9某研究采用groupsequentialdesign,α=0.025(单侧),O’Brien-Fleming边界,计划最多3次期中分析,信息分数=30%、60%、100%。若第2次分析时Z=2.15,则A.拒绝H0,停止试验B.拒绝H0,但需继续随访C.不拒绝,继续D.需改用Pocock边界重新计算答案:C解析:O-F边界在60%信息时临界值≈2.34,2.15<2.34,故继续。1.10在孟德尔随机化中,若遗传变异与暴露之间的F统计量<10,则主要担忧是A.弱工具变量偏倚B.方向性多效性C.基因-环境交互D.人群分层答案:A解析:F<10提示工具变量与暴露关联弱,导致IV估计向OLS偏倚,即弱工具变量偏倚。2.多选题(每题3分,共15分,每题至少2个正确答案,多选少选均不得分)2.1下列哪些方法可用于处理高维数据中“p>>n”时的多重共线性A.弹性网B.主成分回归C.偏最小二乘D.岭回归E.最佳子集选择答案:A,B,C,D解析:最佳子集在p>>n时计算不可行且过拟合严重,其余均可。2.2关于贝叶斯因子(BF)的描述,正确的有A.BF>100视为强证据B.BF与先验概率无关C.BF可用于比较非嵌套模型D.BF对先验厚度敏感E.BF可用Savage-Dickey方法计算答案:A,C,D,E解析:BF为边际似然比,与先验厚度密切相关;Savage-Dickey是计算BF的便捷方法;B错误,BF已积分掉参数但依赖先验分布。2.3下列哪些指标属于个体化治疗效应(ITE)估计的验证指标A.uplift曲线下面积B.预测风险差(c-for-benefit)C.加权分类准确率D.校准斜率E.净重分类改善指数(NRI)答案:A,B,C解析:校准斜率用于预测概率校准;NRI用于比较两个风险模型,非ITE专用。2.4在系统评价中,评估发表偏倚可采用的定量方法包括A.Egger回归B.Begg秩相关C.Peters检验D.剪补法(trim-and-fill)E.contour-enhanced漏斗图答案:A,B,C,D解析:E为图形法,非定量统计。2.5关于深度学习中卷积神经网络(CNN)在医学影像的应用,下列做法可有效防止过拟合A.数据增强(旋转、翻转、弹性变形)B.使用BatchNormalizationC.增加卷积核尺寸至11×11D.早停(earlystopping)E.多任务学习共享底层特征答案:A,B,D,E解析:大卷积核增加参数量,反而易过拟合。3.判断题(每题1分,共10分,正确写“T”,错误写“F”)3.1当使用Bonferroni校正时,若检验次数k=20,则单次显著性阈值一定为0.05/20=0.0025。答案:F解析:若检验间存在正相关,Bonferroni过于保守,可使用Holm或FDR。3.2在生存分析中,若采用Royston-Parmar柔性参数模型,基线累积风险函数可用restrictedcubicspline建模。答案:T3.3对于聚类随机试验,若ICC=0.01,则设计效应DE≈1+(m-1)×0.01,m为平均clustersize。答案:T3.4在深度生存模型中,DeepSurv使用Coxpartiallikelihood作为损失函数,因此无需担心非比例风险。答案:F解析:损失函数仍为Cox形式,若比例风险不成立,模型仍可偏倚。3.5倾向评分匹配后,标准化差值(standardizedmeandifference)<0.1即可认为所有协变量平衡。答案:T3.6若Meta分析采用随机效应模型,τ²估计为0,则结果与固定效应模型完全一致。答案:T3.7在单细胞RNA测序差异表达分析中,使用Wilcoxon秩和检验无需考虑“零膨胀”。答案:F解析:单细胞数据零膨胀严重,需用SCTransform或MAST等专门模型。3.8当使用五折交叉验证调参时,重复10次五折可减小方差但无法减小偏差。答案:T3.9若两变量X,Y的互信息I(X;Y)=0,则X与Y独立。答案:T3.10在FDA2026年指南中,真实世界证据(RWE)用于监管决策时,必须采用预先注册的研究方案。答案:T4.简答题(每题10分,共30分)4.1给出高维数据下构建预测模型的完整流程,并说明如何在内嵌交叉验证中避免信息泄漏。答案与解析:步骤:①数据分割:按7:1:2划分为训练、调参、测试集,分层抽样保持结局比例。②缺失处理:仅在训练集构建插补模型(MICE或missForest),调参与测试集用相同插补规则。③特征工程:训练集内做标准化、PCA、单变量筛选;调参集仅应用训练集得到的参数。④模型候选:LASSO、弹性网、随机森林、XGBoost、LightGBM。⑤内嵌交叉:在训练集做重复五折交叉验证,每折再嵌套特征选择,避免“先选后训”泄漏。⑥性能评估:用调参集选择最优超参,记录均值与标准误。⑦最终评价:仅在测试集运行一次,报告AUC、Brier、校准曲线。⑧稳定性:Bootstrap1000次评估optimism-corrected性能。信息泄漏防控:任何数据驱动的变换(标准化、PCA、特征选择)都必须只在训练折内计算参数,再应用于验证折;严禁使用全局统计量。4.2解释“targettrial”框架如何在观察性研究中模拟随机对照试验,并以评价“GLP-1受体激动剂是否降低糖尿病患者心衰住院风险”为例,列出关键设计要素。答案与解析:Targettrial框架由Hernán提出,用观察数据预先设定一个假想RCT,再按该方案分析。要素:①合格标准:T2DM、年龄≥18岁、基线无心衰、既往无GLP-1使用、随访资料完整。②治疗策略:起始GLP-1vs二肽基肽酶-4抑制剂(DPP-4)作为对照,均按临床指南。③分配:模拟随机,用倾向评分加权(IPTW)控制混杂。④随访起点:首次处方日。⑤结局:首次心衰住院(ICD-10I50)。⑥随访时间:5年。⑦因果对比:意向治疗(ITT)和按方案(per-protocol)。⑧统计:加权Cox模型,稳健方差,评估比例风险,报告风险比与95%CI。⑨敏感性:E值评估未测混杂;阴性对照结局验证。该框架通过预先设定,使观察性分析贴近RCT,减少偏倚。4.3说明如何在R语言中实现基于贝叶斯加性回归树(BART)的个体化治疗效应估计,并给出关键代码片段及结果解读。答案与解析:步骤:①安装库:library(BART);library(tidyverse)。②数据:n=1000,二分类治疗A、连续结局Y、协变量X1-X10。③训练:set.seed(42)post<mbart(X=cbind(A,X1-X10),y=Y,ndpost=1000,nskip=500,keepevery=5)④ITE估计:Y1<post$yhat.pred[,,2]#A=1Y0<post$yhat.pred[,,1]#A=0ITE<rowMeans(Y1Y0)⑤可视化:ggplot(data.frame(ITE))+geom_density(aes(ITE))+xlab("IndividualTreatmentEffect")⑥评估:按ITE三分组,观察实际A=1与A=0子组的平均结局差异,计算uplift曲线。结果解读:若ITE分布明显偏离0,提示存在异质性治疗效应;可进一步用决策曲线评估临床净获益。5.计算与分析题(25分)5.1研究背景:一项多中心、随机、双盲试验评估新型降压药物N对24h动态收缩压(SBP)的影响。主要结局为从基线到第8周的SBP变化(ΔSBP),假设对照组标准差σ=12mmHg,临床有意义差异δ=4mmHg,双侧α=0.05,power=90%,失访率10%。(1)计算所需样本量;(2)若采用序贯设计(O’Brien-Fleming,最多3次,信息分数30%、60%、100%),求最大样本量相对固定设计的膨胀系数;(3)若最终观测到的合并标准差为14mmHg,检验效能降至多少?(4)若中心数=20,ICC=0.02,平均clustersize=20,求设计效应及调整后样本量。答案与解析:(1)固定设计:n=2×(Z1-α/2+Z1-β)²×σ²/δ²=2×(1.96+1.28)²×12²/4²=2×10.51×144/16=189.2→190例/组,合计380例,考虑10%失访→422例。(2)序贯设计:O-F边界在α=0.05、3次、power=90%时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年及未来5年市场数据中国制动器制造行业市场深度研究及投资策略研究报告
- 2026广东中考:地理必背知识点总结
- 沙雅民警考试题及答案
- 强军思想考试题及答案
- 合规与风险培训课件
- 2026年历史事件与人物分析模拟试题
- 2026福建三明市永安市城市建设投资集团有限公司招聘6人考试参考试题及答案解析
- 2026年大连工业大学公开招聘高层次人才54人备考考试题库及答案解析
- 2026湖南郴州市宜章县方盈工程项目管理有限公司招聘1人备考考试题库及答案解析
- 2026中国能源建设集团天津电力设计院有限公司校园招聘备考考试试题及答案解析
- 2025年度安全生产工作述职报告
- 2025年全国硕士研究生考试《管理类联考综合能力》试题及答案
- 护理质量管理质控方案2026
- 《低碳医院评价指南》(T-SHWSHQ 14-2025)
- 马的文化介绍
- 二年级数学计算题专项练习1000题汇编集锦
- AI技术在人力资源管理中的实际应用案例分享
- 急诊预检分诊课件教学
- (完整版)小学一年级20以内加减法混合运算3000题(每页100题-已排版)
- GB/T 46509-2025玩具中挥发性有机化合物释放量的测定
- 2026届浙江省杭州城区6学校数学七年级第一学期期末教学质量检测试题含解析
评论
0/150
提交评论