医学统计复试综合试题及答案_第1页
医学统计复试综合试题及答案_第2页
医学统计复试综合试题及答案_第3页
医学统计复试综合试题及答案_第4页
医学统计复试综合试题及答案_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计复试综合试题及答案一、单项选择题(每题1分,共30分。每题只有一个最佳答案,请将正确选项字母涂黑)1.为比较两种降压药对收缩压的降低效果,研究者将120例患者随机分为A、B两组,分别接受药物A与药物B治疗4周。若基线收缩压服从正态分布且方差齐性,最合适的统计推断方法是A.配对t检验 B.两独立样本t检验 C.Wilcoxon秩和检验 D.卡方检验 E.重复测量方差分析答案:B2.在Logistic回归中,若某自变量X的OR=0.35(95%CI:0.20–0.61),则下列说法正确的是A.X每增加一个单位,事件发生的概率增加35% B.X是事件发生的保护因素 C.该OR值说明X与事件呈线性相关 D.该模型一定不存在共线性 E.该OR值可直接解释为风险比答案:B3.某研究欲评价某肿瘤标志物对早期肺癌的诊断价值,收集200例疑似患者,最终经病理确诊肺癌80例。若标志物阳性阈值为15μg/L,得到阳性者120例,其中真阳性64例,假阳性36例。该标志物的阳性似然比为A.0.80 B.1.33 C.2.67 D.4.00 E.0.53答案:C4.对同一批受试者分别在干预前、干预后1个月、3个月测量血清CRP,若数据呈明显偏态,宜采用的假设检验为A.单因素方差分析 B.配对t检验 C.Friedman检验 D.两因素重复测量方差分析 E.Bonferroni校正答案:C5.在Cox比例风险模型中,若某变量满足比例风险假设,则A.其对数风险比随时间变化呈线性 B.其对数风险比为常数 C.Schoenfeld残差与时间无关 D.变量可省略 E.需引入时间交互项答案:C6.某随机对照试验报告相对危险度RR=0.75,P=0.04,则A.干预组事件发生率一定低于对照组 B.差异有统计学意义 C.需计算绝对危险降低度才能下结论 D.该结果不受样本量影响 E.95%CI一定包含1答案:B7.在Meta分析中,若I²=62%,提示A.研究间异质性可忽略 B.应采用固定效应模型 C.异质性中等,建议行亚组分析 D.发表偏倚严重 E.需进行敏感性分析但无需报告答案:C8.对一份生存数据,若Kaplan–Meier曲线在早期出现明显交叉,则A.Cox模型一定适用 B.应放弃生存分析 C.提示可能存在混杂 D.比例风险假设可能不成立 E.中位生存期无法计算答案:D9.某研究采用1:1倾向性评分匹配后,共纳入匹配对200对,若需检验连续型协变量在组间是否均衡,应首选A.配对t检验 B.独立t检验 C.卡方检验 D.Mann–WhitneyU检验 E.ANCOVA答案:A10.在多重线性回归中,若方差膨胀因子VIF>10,则提示A.模型拟合优度差 B.存在严重多重共线性 C.应删除因变量 D.残差不独立 E.需进行变量标准化答案:B11.某研究调查1000名成年人,记录性别、吸烟、饮酒与高血压患病情况,欲探讨吸烟与饮酒对高血压的交互作用,应采用的统计模型为A.线性回归 B.二分类Logistic回归 C.Poisson回归 D.生存分析 E.主成分分析答案:B12.若样本量固定,显著性水平α从0.05降至0.01,则A.Ⅰ型错误概率降低,检验效能升高 B.Ⅰ型错误概率升高,检验效能降低 C.Ⅰ型错误概率降低,检验效能降低 D.Ⅱ型错误概率降低 E.不影响置信区间宽度答案:C13.在临床试验中,采用“lastobservationcarriedforward”处理失访,可能A.增加随机误差 B.减少选择偏倚 C.引入潜在信息偏倚 D.提高检验效能 E.保持随机化平衡答案:C14.某研究采用分层随机化按中心分层,分析时发现某中心样本量极少,合并中心效应的最佳策略是A.删除该中心 B.将中心作为固定效应纳入模型 C.将中心作为随机效应 D.忽略中心效应 E.采用精确检验答案:C15.若诊断试验的ROC曲线下面积AUC=0.92,则A.试验灵敏度一定高于特异度 B.诊断准确度极高 C.阳性预测值一定高 D.无需考虑患病率 E.Youden指数一定>0.8答案:B16.在Poisson回归中,若暴露时间不同,应A.将暴露时间作为协变量 B.将事件数作为因变量,暴露时间作为偏移量 C.采用负二项回归 D.取对数后线性回归 E.采用Logistic回归答案:B17.某研究对50例患者测量空腹血糖与HbA1c,相关系数r=0.78,若将血糖单位由mmol/L转换为mg/dL,则r值A.增大 B.减小 C.不变 D.需重算 E.无法确定答案:C18.在随机效应Meta分析中,τ²用于描述A.研究内方差 B.研究间方差 C.抽样误差 D.总体效应量 E.发表偏倚答案:B19.若某分类变量有k个水平,欲纳入多重回归,应设置哑变量数量为A.k B.k–1 C.k+1 D.1 E.视样本量而定答案:B20.某研究采用Bonferroni法校正5次两两比较,原始P值分别为0.01、0.03、0.04、0.02、0.06,则校正后显著的结果数为A.1 B.2 C.3 D.4 E.5答案:B21.在生存数据中,若某患者失访,其生存时间应记为A.删除 B.末次随访时间,标记为删失 C.0 D.中位生存时间 E.无需记录答案:B22.某研究采用交叉设计比较两种镇痛药,阶段效应显著的统计学含义是A.药物A优于药物B B.药物B优于药物A C.不同阶段基线疼痛水平不同 D.存在遗留效应 E.随机化失败答案:C23.在多重插补法中,若插补次数m=5,最终合并统计量依据A.仅第一次插补结果 B.五次点估计均数 C.Rubin法则 D.最大似然估计 E.贝叶斯信息准则答案:C24.若某研究样本量估算得到n=128,预计失访率20%,则应纳入A.128 B.140 C.152 D.160 E.170答案:D25.在Logistic回归中,若样本量n=500,事件数60,则按“事件数自变量10倍原则”,最多可纳入A.6 B.5 C.4 D.10 E.无限制答案:A26.某研究采用精确概率法计算二项分布置信区间,其特点是A.保守,宽度最窄 B.近似正态 C.保证覆盖率不低于名义水平 D.仅适用于大样本 E.需连续性校正答案:C27.在重复测量方差分析中,若Mauchly球形检验P<0.001,应A.直接报告未校正结果 B.采用Greenhouse–Geisser校正 C.改用独立t检验 D.删除重复测量点 E.采用Bonferroni校正答案:B28.某研究采用聚类随机抽样调查社区卫生服务中心,若忽略聚类效应,则A.标准误被高估 B.标准误被低估 C.点估计偏倚 D.检验效能升高 E.置信区间变宽答案:B29.在诊断Meta分析中,若纳入研究同时提供不同阈值,应采用的模型为A.固定效应 B.随机效应 C.双变量随机效应 D.单变量随机效应 E.分层Bayes答案:C30.若某研究欲探讨基因型与环境交互作用,样本量估算需额外考虑A.主效应大小 B.交互效应大小 C.基因型频率 D.环境暴露率 E.以上全部答案:E二、多项选择题(每题2分,共20分。每题至少有两个正确答案,多选少选均不得分)31.下列哪些方法可用于检验Cox模型比例风险假设A.Schoenfeld残差图 B.时间依赖协变量法 C.Kaplan–Meier交叉图 D.Nelson–Aalen累积风险图 E.加权Cox检验答案:A、B、E32.关于多重共线性,下列说法正确的有A.会导致回归系数符号反转 B.VIF>5需警惕 C.可通过主成分分析缓解 D.必然降低模型R² E.可通过岭回归处理答案:A、B、C、E33.下列哪些属于随机对照试验中“隐藏分组”措施A.中心随机化 B.密封不透明信封 C.药房控制随机序列 D.计算机随机系统 E.研究者按生日分组答案:A、B、C、D34.在Bayes因子分析中,Bayes因子BF₁₀=15,则A.支持H₁证据强 B.支持H₀证据强 C.后验概率需结合先验 D.可替代P值 E.与样本量无关答案:A、C、D35.下列哪些情况适合采用负二项回归A.计数数据过离散 B.结局为Poisson分布 C.方差远大于均数 D.暴露时间不等 E.结局为二分类答案:A、C、D36.关于多重比较校正,下列说法正确的有A.Benjamini–Hochberg法控制FDR B.Bonferroni法保守 C.预先计划比较可不用校正 D.探索性分析必须校正 E.校正后检验效能一定降低答案:A、B、D、E37.在诊断试验系统评价中,可能导致发表偏倚的有A.英文数据库遗漏中文文献 B.阴性结果不发表 C.数据库检索策略不全面 D.纳入研究质量低 E.重复发表阳性结果答案:A、B、C、E38.下列哪些属于“意向性治疗”分析原则A.按随机分组分析 B.包括所有随机化受试者 C.对失访者进行插补 D.排除违背方案者 E.保持随机化平衡答案:A、B、C、E39.在生存分析中,若存在竞争风险,可采用A.Fine–Gray模型 B.原因别风险模型 C.Kaplan–Meier法 D.累积发生率函数 E.Logrank检验答案:A、B、D40.下列哪些指标可用于评价模型预测性能A.C统计量 B.Brier评分 C.校准斜率 D.NagelkerkeR² E.净重新分类指数NRI答案:A、B、C、D、E三、判断题(每题1分,共10分。正确请填“√”,错误填“×”)41.对数转换可将任意右偏分布转化为正态分布。 答案:×42.在Cox模型中,若某协变量随时间变化,必须采用时间依赖协变量法。 答案:√43.随机效应Meta分析的权重仅与样本量有关。 答案:×44.若诊断试验的灵敏度为100%,则阴性预测值一定为100%。 答案:×45.在多重线性回归中,标准化回归系数可用于比较不同自变量对因变量的相对重要性。 答案:√46.采用精确检验时,P值可能为0。 答案:×47.交叉设计试验中,若存在遗留效应,阶段效应与处理效应估计均会受影响。 答案:√48.在Bayes分析中,先验分布对后验分布无影响当样本量足够大。 答案:×49.负二项回归的离散参数越大,说明过离散越严重。 答案:√50.在倾向性评分匹配后,仍需检验协变量平衡性。 答案:√四、简答题(每题8分,共40分)51.简述Cox比例风险模型中“比例风险”假设的含义,并给出两种检验方法及判断标准。答案:比例风险假设指任意两个个体的风险比不随时间变化,即h(t|X₁)/h(t|X₂)=exp[β(X₁–X₂)]为常数。检验方法:(1)Schoenfeld残差法:绘制残差对时间图,若回归线水平且P>0.05,则假设成立;(2)时间依赖协变量法:在模型中加入X×ln(t)交互项,若交互项P>0.05,则假设成立。52.某RCT研究主要结局为连续型变量,报告均数差MD=–5.2(95%CI:–9.8––0.6),P=0.03。请解释置信区间与假设检验结果的关系,并说明临床意义需如何进一步判断。答案:95%CI不包含0,与P<0.05一致,提示差异有统计学意义。临床意义需结合最小临床重要差值(MCID):若MCID=3,则–5.2超过MCID,临床意义显著;若MCID=10,则临床意义不足。同时需评估效应量(如Cohen’sd)及患者重要性。53.简述多重插补法的三个步骤,并指出“可忽略缺失”需满足的条件。答案:步骤:(1)插补:基于观察数据建立预测模型,生成m套完整数据;(2)分析:对每套数据分别进行统计分析;(3)合并:采用Rubin法则合并点估计与标准误。可忽略缺失需满足:缺失机制为随机缺失(MAR),即给定观测协变量后,缺失与未观测值无关;且模型正确指定。54.解释“过离散”在Poisson回归中的表现、产生原因及负二项回归的解决原理。答案:表现:残差偏差的卡方值/自由度>>1,残差方差远大于模型预测方差。原因:异质性、未观测混杂、事件聚集。负二项回归引入随机效应项ε~Gamma,使方差函数变为μ+αμ²,允许方差大于均数,从而校正过离散。55.简述倾向性评分匹配的基本流程,并指出两种常用匹配算法及其适用场景。答案:流程:(1)利用Logistic模型估计每个个体接受处理的概率;(2)根据评分进行匹配;(3)检验匹配后协变量平衡;(4)对匹配数据进行分析。算法:(1)最近邻匹配:按评分绝对差最小配对,适用于大样本;(2)卡钳匹配:设定最大差值(如0.2×SD),控制匹配质量,适用于中小样本。五、计算与分析题(共50分)56.(15分)某研究调查1200名成年人,记录吸烟(0=否,1=是)与高血压(0=否,1=是)情况,结果如下表:吸烟高血压人数00400012001030011300(1)计算吸烟与高血压的χ²值、OR值及95%CI;(2)解释结果。答案:(1)构建2×2表:非吸烟组高血压率=200/600=0.333,吸烟组=300/600=0.500。χ²=(1200×(400×300–200×300)²)/(600×600×700×500)=1200×(120000–60000)²/(600×600×700×500)=1200×3.6×10¹⁰/1.26×10¹¹=34.29,P<0.001。OR=(300×400)/(200×300)=2.00。95%CI:lnOR=ln2≈0.693,SE=√(1/300+1/300+1/400+1/200)=√0.0142≈0.119,CI=0.693±1.96×0.119→(0.459,0.927),反变换得(1.58,2.53)。(2)吸烟组高血压风险为非吸烟组2倍,差异有统计学意义,提示吸烟可能为高血压危险因素。57.(15分)某RCT比较新药与安慰剂对肿瘤患者无进展生存期(PFS)的影响,随访24个月,数据如下:新药组n=90,事件数=30,中位PFS=18月;安慰剂组n=90,事件数=54,中位PFS=12月。(1)计算风险比HR及95%CI(采用Logrank法,假设总事件数84,分配比1:1,Z=2.45);(2)若24个月时生存曲线交叉,是否可认为新药无效?说明理由。答案:(1)HR=exp[(O₁–E₁)/V],近似法:lnHR≈Z×√(4/84)=2.45×0.218=0.534,HR=exp(0.534)=1.71,但新药组事件少,方向应相反,故HR=0.58;95%CI:exp(0.534±1.96×0.218)→(0.38,0.89)。(2)曲线交叉提示比例风险假设可能不成立,早期新药优势,后期可能逆转,需采用时间依赖Cox或限制性均值生存差综合评估,不能简单认为无效。58.(20分)某研究建立Logistic模型预测ICU患者28天死亡,纳入变量:年龄(岁)、SOFA评分、机械通气(0/1)、血乳酸(mmol/L),结果如下:变量βSEP年龄0.050.01<0.01SOFA0.200.05<0.01机械通气1.200.30<0.01乳酸0.400.10<0.01常数–5.000.80<0.01(1)计算年龄、SOFA、机械通气的OR及95%CI;(2)若某患者80岁,SOFA=10,机械通气=1,乳酸=4,求其死亡概率;(3)计算AUC需哪些额外信息?答案:(1)年龄OR=exp(0.05)=1.05,95%CI=exp(0.05±1.96×0.01)→(1.03,1.07);SOFAOR=exp(0.20)=1.22,CI→(1.11,1.35);机械通气OR=exp(1.20)=3.32,CI→(1.84,5.99)。(2)线性预测值η=–5+0.05×80+0.20×10+1.20×1+0.40×4=–5+4+2+1.2+1.6=3.8,概率p=1/(1+exp(–3.8))=0.978。(3)需每位患者的预测概率与观测结局,计算灵敏度与特异度,绘制ROC曲线得AUC。六、综合设计题(共50分)59.(25分)某高校欲探讨“夜间蓝光暴露与大学生抑郁症状”的因果关系,计划开展前瞻性队列研究。请完成以下任务:(1)提出研究假设;(2)列出主要暴露、结局及混杂变量,并说明测量方法;(3)计算所需样本量(假设抑郁症状年发生率8%,暴露组相对危险RR=1.5,α=0.05双侧,β=0.20,失访率15%);(4)描述统计分析计划(包括缺失数据、混杂控制、交互作用检验);(5)指出两种潜在偏倚及控制措施。答案:(1)H₁:夜间蓝光暴露增加大学生抑郁症状发生风险。(2)暴露:客观测量——腕式光传感器记录夜间22:00–02:00蓝光辐照度(μW/cm²),连续变量;主观测量——睡眠日记。结局:采用PHQ9≥10分判定抑郁症状,每6个月评估一次,持续2年。混杂:年龄、性别、BMI、基线PHQ9、家庭经济、吸烟、饮酒、运动、社交媒体使用时间、睡眠节律类型(MEQ评分)、课业压力(PSS评分)。(3)n=[Zα√(2p̄(1–p̄))+Zβ√(p₁(1–p₁)+p₂(1–p₂))]²/(p₁–p₂)²,p₂=0.08,p₁=0.08×1.5=0.12,p̄=0.10,Zα=1.96,Zβ=0.84,代入得n≈1030,失访15%,需纳入1212人。(4)分析:①描述性统计,t/χ²检验;②Cox比例风险模型,暴露按四分位分组,趋势检验;③调整上述混杂,采用向前逐步法;④缺失数据:采用多重插补m=10,MAR假设;⑤交互:检验性别×暴露、睡眠节律×暴露;⑥敏感性:排除基线PHQ9≥5者。(5)偏倚:①测量偏倚——传感器佩戴不规范,控制:培训+7天连续佩戴+数据质量审核;②选择偏倚——志愿者抑郁倾向高,控制:随机整群抽取宿舍、提高参与激励、比较参与者

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论