版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年医学统计学专业考试试题及答案1.单项选择题(每题1分,共30分)1.1在生存分析中,若某研究对象的失访时间早于其死亡时间,则该数据应记为A.完全数据B.右删失C.左删失D.区间删失答案:B解析:失访时尚未发生终点事件,仅知“存活到失访时点”,属于右删失。1.2对二分类资料进行单因素筛选时,若期望队列发病率<5%,首选的检验方法是A.Pearsonχ²B.Fisher精确概率法C.Mantel-Haenszelχ²D.二项精确检验答案:B解析:当期望频数<5时,Pearsonχ²近似性差,Fisher法基于超几何分布,结果精确。1.3某RCT采用分层随机化,层因素为“中心”与“性别”,分析时应首选A.简单t检验B.协方差分析C.分层随机效应模型D.广义估计方程答案:C解析:分层随机化需保持层内均衡,采用含层随机效应的混合模型可正确还原随机结构。1.4对重复测量资料,若关心处理×时间交互,且数据存在缺失,应优先A.重复测量ANOVAB.末次观察结转C.混合效应线性模型D.广义估计方程答案:C解析:混合效应模型利用所有可观测数据,在MAR缺失机制下提供无偏估计。1.5在Meta分析中,若I²=62%,其含义为A.62%的研究存在发表偏倚B.62%的异质性由随机误差引起C.62%的总变异源于研究间异质D.合并效应量不可信答案:C解析:I²表示研究间方差占总体方差的比例,>50%提示中度异质。1.6对数秩检验的零假设是A.各组生存曲线相同B.各组风险比为0C.各组中位生存期相等D.基线风险函数为常数答案:A解析:对数秩检验比较整条生存曲线,零假设为各组生存函数一致。1.7某预测模型AUC=0.88,最佳截断值约登指数为0.58,此时A.灵敏度+特异度=1.58B.灵敏度=特异度=0.88C.假阳性率=0.12D.阳性预测值必>0.9答案:A解析:约登指数=灵敏度+特异度−1,故和为1.58。1.8在Poisson回归中,若暴露人年作为偏移,其系数应A.固定为0B.固定为1C.取对数后作为偏移D.与解释变量交互答案:C解析:Poisson回归用log(offset)强制系数为1,实现率比估计。1.9对高维组学数据变量筛选,最可能过拟合的方法是A.LASSOB.弹性网C.单变量t检验排序D.随机森林平均下降精度答案:C解析:单变量筛选忽略变量间相关,极易在后续模型中过拟合。1.10某研究OR=1.30,95%CI0.97–1.74,可认为A.有统计学意义B.拒绝零假设C.可能为机会发现D.需增加样本量答案:C解析:置信带包含1,P>0.05,差异可能由随机误差导致。1.11在交叉设计中,若存在遗留效应,应首选A.忽略,因随机化可抵消B.增加洗脱期C.采用序列×时期交互模型D.改用平行设计答案:C解析:通过模型检验序列×时期交互,可量化遗留效应大小。1.12对病例-父母对照设计,估计相对风险应采用A.ORB.RRC.传递不平衡比D.条件logistic回归答案:C解析:该设计利用等位基因传递概率,计算TDT。1.13某研究样本量估算显示需n=90,预计失访20%,最终应纳入A.90B.108C.112D.120答案:C解析:90/(1−0.2)=112.5,向上取整。1.14在多重插补后,合并估计量需使用A.简单平均B.Rubin法则C.bootstrapD.最大似然答案:B解析:Rubin法则综合组内与组间方差,给出正确标准误。1.15对有序分类结局,比例优势假设检验P=0.02,应A.仍使用比例优势模型B.改用偏比例优势模型C.合并相邻类别D.视为无序答案:B解析:P<0.05提示假设不成立,需放宽约束。1.16若两变量Pearsonr=0,可推断A.独立B.无直线相关C.无线性关系D.无曲线关系答案:B解析:r仅度量直线线性关系,非线性依赖可存在。1.17在贝叶斯统计中,若先验为β~N(0,10²),似然方差小,则后验A.由先验主导B.由似然主导C.不变D.无法计算答案:B解析:似然信息量大时,数据压倒先验。1.18对零膨胀数据,首选A.负二项回归B.零膨胀PoissonC.广义PoissonD.普通Poisson答案:B解析:ZIP同时建模“零过多”与“计数”两部分。1.19在交叉验证中,k值越大A.偏差增大B.方差增大C.计算量减小D.过拟合风险降低答案:D解析:k大训练集比例高,模型更接近全样本,方差小偏差小。1.20若Cox模型线性假设检验P<0.01,应A.加入二次项B.分层变量C.改用参数模型D.时间依赖系数答案:D解析:时间×变量交互可放松比例风险假设。1.21对生态学研究,主要偏倚为A.回忆偏倚B.混杂偏倚C.生态学谬误D.选择偏倚答案:C解析:群体水平关联不能推至个体。1.22在剂量-反应Meta分析中,应采用A.随机效应B.固定效应C.剂量-反应回归D.Peto法答案:C解析:利用广义最小二乘拟合剂量-反应曲线。1.23若两独立样本均来自正态总体,方差齐性检验P=0.04,应A.仍用合并方差t检验B.改用Welcht检验C.非参数检验D.对数转换答案:B解析:方差不齐时Welch法调整自由度。1.24在适应性设计中,若期中分析显示P=0.012,按O’Brien-Fleming边界0.014,应A.继续试验B.拒绝无效假设C.增加样本量D.降低α答案:B解析:O-F边界更严,P<边界可提前终止。1.25对高维数据降维,主成分分析要求A.变量独立B.变量标准化C.正态分布D.线性可分答案:B解析:量纲差异大时需标准化,避免大尺度变量主导。1.26若诊断试验灵敏度与特异度负相关,可采用A.固定灵敏度B.ROC曲线下面积C.约登指数D.似然比答案:B解析:AUC综合各截断,不受阈值选择影响。1.27在病例-队列设计中,估计HR需A.普通CoxB.加权CoxC.条件logisticD.精确法答案:B解析:病例-队列需逆概率加权,校正过抽样。1.28若随机效应Meta分析τ²=0,则A.异质性高B.与固定效应结果一致C.发表偏倚大D.需剪补法答案:B解析:τ²=0表示无异质,随机退化为固定。1.29对计数资料过度离散,应A.改用负二项B.加入随机效应C.准似然调整D.以上均可答案:D解析:负二项、随机效应、准似然均能处理过度离散。1.30在机器学习可解释性中,SHAP值满足A.局部准确性B.全局一致性C.缺失性D.以上全部答案:D解析:SHAP基于博弈论,满足三条公理。2.多项选择题(每题2分,共20分)2.1关于多重比较校正,正确的是A.Bonferroni法控制族错误率B.FDR控制期望假发现比例C.固定序列法不消耗αD.模拟显示Holm法比Bonferroni有更高检验效能E.贝叶斯方法无需校正答案:A,B,D解析:C错误,固定序列仍需分配α;E错误,贝叶斯仍需决策规则。2.2下列哪些属于非概率抽样A.方便抽样B.雪球抽样C.配额抽样D.系统抽样E.整群抽样答案:A,B,C解析:系统、整群可嵌入概率框架。2.3在生存数据回归诊断中,可评估比例风险的图包括A.Schoenfeld残差图B.log-log图C.累积鞅残差D.deviance残差E.dfbeta答案:A,B,C解析:dfbeta评估影响点,非比例风险。2.4关于贝叶斯因子,正确的是A.BF₁₀>10表示强证据支持H₁B.与似然比相同C.受先验影响D.可用于模型选择E.可比较非嵌套模型答案:A,C,D,E解析:B错误,BF积分掉参数,非简单似然比。2.5下列哪些方法可处理时间依赖混杂A.边际结构模型B.g-estimationC.结构嵌套模型D.传统CoxE.逆概率加权答案:A,B,C,E解析:传统Cox无法处理时依混杂。2.6在诊断准确性系统评价中,可检测发表偏倚的有A.Deeks漏斗图B.Egger回归C.剪补法D.轮廓增强漏斗图E.伽利略图答案:A,B,D解析:剪补用于干预Meta,伽利略图不常用。2.7关于交叉验证,正确的是A.留一法方差低B.分层交叉验证保持结局比例C.重复交叉验证可降低方差D.嵌套交叉验证用于调参E.验证集越大,偏差越小答案:B,C,D解析:留一法方差高;验证集大训练集小,偏差大。2.8下列哪些属于纵向数据缺失机制A.MCARB.MARC.MNARD.截断E.右删失答案:A,B,C解析:截断与删失属生存数据概念。2.9在剂量-反应分析中,可用模型包括A.线性B.二次C.限制性立方样条D.分段回归E.Hill模型答案:A,B,C,D,E解析:均为常见参数化形式。2.10关于随机化,正确的是A.可期望平衡已知混杂B.可期望平衡未知混杂C.区组随机化可保持组间均衡D.动态随机化可最小化协变量不平衡E.开放标签下随机化无效答案:A,B,C,D解析:E错误,随机化仍有效,盲法减少测量偏倚。3.判断题(每题1分,共10分)3.1对数变换可使任意右偏资料正态化。答案:×解析:对数仅对右偏且>0数据有效,极端偏态需Box-Cox。3.2在Cox模型中,基线风险函数估计需指定分布。答案:×解析:Cox为半参数,基线任意。3.3若两变量VIF>10,则一定存在严重共线性。答案:√解析:经验阈值10,>10说明方差膨胀严重。3.4贝叶斯可信区间频率覆盖概率一定等于名义水平。答案:×解析:覆盖概率依赖先验,频率性质不一定。3.5对匹配病例对照研究,需用条件logistic回归。答案:√解析:匹配设计需分层条件似然。3.6在Meta回归中,研究数<10亦可进行多变量回归。答案:×解析:事件过少易过拟合,一般要求研究数≥10×变量数。3.7对零膨胀模型,若Vuong检验P<0.05,则ZIP优于普通Poisson。答案:√解析:Vuong用于非嵌套比较,P<0.05提示ZIP更好。3.8交叉设计必然比平行设计节省样本。答案:×解析:若存在遗留效应或高退出,反而更费。3.9在机器学习测试中,验证集用于调超参数。答案:×解析:验证集调参,测试集仅最终评估。3.10对生态学相关分析,控制个体水平混杂即可消除生态学谬误。答案:×解析:群体水平关联仍不能推个体,需多水平数据。4.简答题(每题10分,共40分)4.1给出随机效应Meta分析中DerSimonian-Laird估计τ²的公式,并说明其局限。答案:公式:τ²=max{0,[Q−(k−1)]/[Σwᵢ−Σwᵢ²/Σwᵢ]}其中Q=Σwᵢ(θᵢ−θ̂)²,wᵢ=1/(σᵢ²+τ²)。局限:1.基于矩估计,效率低;2.当研究数k小,τ²可能为0,低估异质;3.不考虑不确定性,置信区间偏窄;4.对极端研究敏感;5.无法处理稀疏数据。4.2解释边际结构模型(MSM)如何控制时依混杂,并写出权重公式。答案:时依混杂既是后续暴露的预测因子,又受既往暴露影响,传统回归调整会引入碰撞偏倚。MSM通过逆概率加权构建“伪人群”,使暴露独立于时依混杂。权重公式(非稳定):SWᵢ(t)=∏_{k=0}^{t}1/[P(A(k)=a(k)|Ā(k−1),L̄(k))]稳定权重再乘以P(A(k)=a(k)|Ā(k−1))。加权后,可直接用简单模型估计暴露因果效应。4.3说明LASSO回归的几何解释,并比较其与岭回归在变量选择上的差异。答案:LASSO约束Σ|βⱼ|≤t,可行域为菱形,角点易使系数恰好为0,实现稀疏。岭回归约束Σβⱼ²≤t,可行域为球体,无角点,系数连续收缩但不为零。因此LASSO兼具选择与收缩,岭仅收缩。当预测变量高度相关,LASSO倾向于任选一个,而岭将系数均分。4.4给出计算NetReclassificationImprovement(NRI)的步骤,并指出其争议。答案:步骤:1.基于旧模型与新模型,分别计算每个个体的风险分类(如<5%,5–20%,>20%)。2.对病例组,计算新模型向上分类比例p_up,down;对非病例组计算q_up,down。3.NRI=(p_up−p_down)−(q_up−q_down)。争议:1.分类阈值主观;2.忽略连续风险变化;3.对基础风险敏感;4.统计显著≠临床意义;5.置信区间计算需事件与非事件分别bootstrap,易误用。5.计算与分析题(共50分)5.1某新药II期试验采用单臂Simon二阶段设计,预期有效率p₀=0.20,p₁=0.35,α=0.05,β=0.20。第一阶段若≤3/19有效则终止。(1)给出第二阶段样本量及总拒绝阈值;(2)若第一阶段观察到4例有效,是否进入第二阶段?(3)若最终有效13/54,结论?答案:(1)查Simon最优设计表:n₁=19,r₁=3;n=54,r=13。(2)4>3,进入第二阶段。(3)13≥13,拒绝p≤0.20,认为有效。5.2下表为配对病例对照研究,调查X基因型与疾病关联:||病例+|病例−||----------|-------|-------||对照+|35|8||对照−|21|46|(1)计算McNemarχ²及P值;(2)给出OR及95%CI;(3)解释结果。答案:(1)不一致对子:b=8,c=21;χ²=(b−c)²/(b+c)=6.76,P=0.009。(2)OR=c/b=2.625;95%CI=exp[ln(OR)±1.96√(1/b+1/c)]=1.29–5.34。(3)基因型与疾病显著相关,携带者患病风险增加约1.6倍。5.3生存数据:组An=60,观察人年=480,死亡18;组Bn=60,人年=510,死亡10。(1)计算率比RR及95%CI;(2)若用Poisson回归,写出Stata命令;(3)解释RR。答案:(1)λ_A=18/480=0.0375,λ_B=10/510=0.0196;RR=1.91;95%CI=exp[ln(1.91)±1.96√(1/18+1/10)]=0.89–4.11。(2)stsettime,failure(dead)poissondeadi.group,exposure(time)irr(3)A组死亡率为B组1.9倍,但置信带包含1,尚不能认为显著升高。5.4预测模型开发:总样本n=800,事件200,候选变量40。(1)用LASSOlogistic筛选后保留12变量,计算事件per变量;(2)指出潜在问题;(3)给出改进策略。答案:(1)200/12≈16.7事件/变量。(2)仍低于经验20事件/变量,可能过拟合,外推差。(3)①外部验证;②Bootstrapoptimism校正;③惩罚回归调优;④简化模型;⑤合并大样本。5.5多水平数据:患者嵌套于医院,共30医院,每院≈100患者,结局为术后感染。(1)给出空模型公式;(2)若空模型方差成分:医院水平σ²_u=0.36,患者水平σ²_e=3.20,计算ICC;(3)解释ICC含义。答案:(1)logit(πᵢⱼ)=β₀+uⱼ,uⱼ~N(0,σ²_u)。(2)ICC=σ²_u/(σ²_u+σ²_e)=0.36/(0.36+3.20)=0.101。(3)10.1%的总变异源于医院水平,提示医院差异对感染影响中等,需关注院内管理。6.综合应用题(共40分)6.1某研究团队拟评估空气污染(PM2.5)对急性心梗(AMI)入院的影响,拥有2018–2025年某市每日AMI入院计数、PM2.5浓度、气象变量(温
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 检验科化学试剂废弃物的处理制度及流程
- 内蒙古赤峰市2026届高三一模考试英语试题(含答案含听力原文无音频)
- 河南许昌市2025-2026学年第一学期期末质量检测七年级语文试卷
- 《曹操献刀》课件
- 2025年山西电力职业技术学院单招综合素质考试题库带答案解析
- 2025年燕京理工学院马克思主义基本原理概论期末考试模拟题带答案解析
- 2025年辽宁民族师范高等专科学校马克思主义基本原理概论期末考试模拟题含答案解析(夺冠)
- 2025年泽库县招教考试备考题库含答案解析(必刷)
- 2026年吕梁职业技术学院单招职业倾向性考试题库带答案解析
- 2025年金沙县招教考试备考题库带答案解析(夺冠)
- 财政评审廉政管理办法
- 新时代教育者核心素养与使命担当
- 公司人员服从管理制度
- 演出单位薪酬管理制度
- 企业财务数字化转型的路径规划及实施方案设计
- DB32T 1712-2011 水利工程铸铁闸门设计制造安装验收规范
- 百度人才特质在线测评题
- DL∕T 5142-2012 火力发电厂除灰设计技术规程
- 2024年水合肼行业发展现状分析:水合肼市场需求量约为11.47万吨
- 提水试验过程及数据处理
- (正式版)JBT 14933-2024 机械式停车设备 检验与试验规范
评论
0/150
提交评论