2025生物统计考试题及答案_第1页
2025生物统计考试题及答案_第2页
2025生物统计考试题及答案_第3页
2025生物统计考试题及答案_第4页
2025生物统计考试题及答案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025生物统计考试题及答案一、单项选择题(每题1分,共30分。每题只有一个最佳答案,请将正确选项字母填入括号内)1.某研究欲比较两种降压药的疗效,记录患者服药前后收缩压差值。若差值服从正态分布且方差齐性,应首选的假设检验方法是()A.配对t检验B.独立样本t检验C.Wilcoxon符号秩检验D.卡方检验答案:A2.在Logistic回归中,若某自变量X的OR=0.35(95%CI:0.20–0.60),则下列解释正确的是()A.X每增加一个单位,事件发生的概率增加35%B.X每增加一个单位,事件发生的优势比降低65%C.X与事件呈负相关,且统计学显著D.需先对X进行标准化后再解释答案:C3.对同一批受试者分别在干预前、干预4周、干预8周测量肺功能FEV1,欲检验时间趋势,应选择的模型是()A.单因素重复测量方差分析B.两因素析因设计方差分析C.协方差分析D.Kruskal–Wallis检验答案:A4.某队列研究随访5年,共观察8000人年,新发糖尿病病例120例,则发病密度的计算式为()A.120/8000B.120/(8000–120)C.(8000–120)/120D.120×8000答案:A5.在生存分析中,若Kaplan–Meier曲线早期交叉,后期分离,此时不宜直接报告()A.中位生存时间B.风险比HRC.生存率D.累积风险答案:B6.对一列有序分类变量(轻、中、重)与二分类结局进行关联性检验,首选()A.线性趋势卡方检验B.Fisher精确概率法C.列联系数D.独立样本t检验答案:A7.若多元线性回归出现VIF=8.5,则提示()A.模型欠拟合B.存在严重多重共线性C.残差异方差D.异常值答案:B8.在Meta分析中,I²=62%,其含义为()A.62%的研究存在发表偏倚B.62%的变异由随机误差引起C.62%的变异由研究间异质性引起D.合并效应量可信度为62%答案:C9.某研究样本量估算显示:α=0.05,β=0.20,预期效应量d=0.5,需每组至少64例。若实际只招募到每组50例,则最可能出现的后果是()A.Ⅰ型错误概率增大B.检验效能降低C.置信区间变窄D.效应量被高估答案:B10.对计数资料进行Poisson回归时,过度离散常用的诊断指标是()A.Pearsonχ²/dfB.AICC.C统计量D.杠杆值答案:A11.在随机区组设计中,区组因素与处理因素交互作用不显著,但区组效应显著,则()A.必须删除区组因素B.区组因素提高了检验效能C.处理效应估计偏倚D.误差自由度减小答案:B12.若某变量服从对数正态分布,欲进行组间比较,最佳策略是()A.直接t检验B.对数转换后t检验C.Mann–WhitneyU检验D.平方根转换后F检验答案:B13.在Cox回归中,比例风险假定检验常用()A.Schoenfeld残差B.Deviance残差C.Pearson残差D.杠杆值答案:A14.对二分类结局进行倾向性评分匹配后,仍需检查的假设是()A.线性B.平衡性C.正态性D.方差齐性答案:B15.若某研究报道Pearsonr=0.85,p<0.001,但散点图显示明显曲线关系,则()A.线性相关极强,结果可信B.需进一步拟合非线性模型C.需用SpearmanρD.存在异常值答案:B16.在多重比较校正方法中,最保守的是()A.BonferroniB.HolmC.FDRD.Tukey答案:A17.某研究采用交叉设计比较两种吸入剂,洗脱期不足最可能导致()A.序列效应C.阶段效应D.处理效应估计偏倚答案:A18.对同一资料分别进行参数与非参数检验,若结论相反,应()A.以p值较小者为准B.报告两种结果并讨论C.删除极端值重新分析D.增加样本量答案:B19.在负二项回归中,α参数显著大于0,说明()A.存在过度离散B.模型欠拟合C.零膨胀D.离群值答案:A20.若某变量缺失率>40%,且缺失与结局相关,最佳处理策略是()A.完整案例分析B.单一均值插补C.多重插补D.删除变量答案:C21.对生存资料进行分段指数模型,其优势在于()A.无需比例风险假定B.可处理时依协变量C.计算简单D.以上均是答案:D22.在临床试验中,采用中央随机化最主要目的是()A.降低选择偏倚B.提高依从性C.便于双盲D.减少失访答案:A23.若Logistic回归模型加入交互项后,主效应符号反转,提示()A.存在混杂B.存在效应修饰C.模型过拟合D.多重共线性答案:B24.对连续变量进行ROC分析,AUC=0.92,最佳截断值选择应兼顾()A.灵敏度与特异度B.Youden指数C.临床代价函数D.以上均需答案:D25.在分层随机化设计中,分层因素过多易导致()A.区组长度增加B.选择偏倚C.不均衡D.实施困难答案:D26.若Meta分析漏斗图明显不对称,Egger检验p=0.008,则首先应()A.采用随机效应模型B.剪补法C.寻找小样本效应来源D.放弃合并答案:C27.对重复测量数据采用混合效应模型,随机斜率与随机截距均显著,说明()A.个体间基线差异大B.时间趋势个体间不同C.存在交互D.需加入二次项答案:B28.在高维数据(p>>n)中,进行变量筛选首选()A.LASSOB.逐步回归C.单因素过滤D.主成分回归答案:A29.若某研究报道HR=1.05(95%CI:0.98–1.12),p=0.16,则()A.风险增加5%,差异显著B.风险增加5%,差异不显著C.风险降低5%,差异显著D.无法判断答案:B30.对分类变量采用Onehot编码后,若全部纳入回归模型,会导致()A.完全分离B.虚拟变量陷阱C.过拟合D.异方差答案:B二、多项选择题(每题2分,共20分。每题有两个或两个以上正确答案,多选少选均不得分)31.下列哪些情况适合使用非参数检验()A.样本量小且分布严重偏态B.有序分类资料C.方差极度不齐D.数据存在截尾答案:ABC32.关于样本量重新估算(adaptivedesign),正确的是()A.可在不破坏Ⅰ型错误前提下调整样本量B.需结合期中分析结果C.必须采用盲态数据D.可用于生存资料答案:ABD33.在Cox回归中,时依协变量的处理可采用()A.分段常数模型B.时间×协变量交互C.鞅残差图D.Landmark分析答案:ABD34.下列哪些指标可用于评价诊断试验()A.灵敏度B.似然比C.Kappa值D.NRI答案:ABD35.关于多重插补,正确的是()A.需构建多个完整数据集B.结果需合并Rubin法则C.需满足MAR假设D.插补模型应包含结局变量答案:ABCD36.在Poisson回归中,偏移量(offset)常用于()A.控制人时差异B.调整年龄结构C.处理过度离散D.标准化率比较答案:ABD37.下列哪些方法可用于处理高杠杆点()A.稳健回归B.删除重新拟合C.岭回归D.加权重置答案:ABC38.关于随机效应Meta分析,正确的是()A.假定研究效应服从正态分布B.异质性大时仍可使用C.需报告τ²D.权重与样本量无关答案:ABC39.在临床试验中,采用双盲主要目的包括()A.降低观察偏倚B.降低报告偏倚C.降低选择偏倚D.提高受试者依从性答案:AB40.对连续变量进行样条回归,优点有()A.捕捉非线性B.无需预设函数形式C.保持线性模型框架D.自动变量选择答案:ABC三、判断题(每题1分,共10分。正确打“√”,错误打“×”)41.当样本量足够大时,t检验对非正态数据仍具有稳健性。(√)42.Logistic回归的系数可以直接解释为相对危险度RR。(×)43.在生存分析中,失访个体若与未失访者特征相似,可视为非信息删失。(√)44.对有序分类资料采用卡方检验会损失信息。(√)45.多重共线性会导致回归系数符号反转。(√)46.随机效应模型合并结果总是比固定效应模型保守。(×)47.对数秩检验要求各组生存曲线成比例。(√)48.在交叉设计中,序列效应可通过统计模型调整。(√)49.对高维数据先单因素过滤再做多因素回归可完全避免过拟合。(×)50.对缺失数据采用完整案例分析不会导致偏倚。(×)四、简答题(每题8分,共40分)51.简述倾向性评分匹配的基本步骤,并指出一个关键假设及检验方法。答案:步骤:1.根据协变量估计倾向性评分(通常用Logistic回归);2.选择匹配算法(如最近邻、卡钳值0.2×SD);3.实施匹配并评估平衡性(标准化均差<0.1);4.在匹配后样本中估计处理效应;5.进行敏感性分析(如E值)。关键假设:条件独立假设(给定协变量后处理分配与潜在结果独立)。检验:通过比较匹配后处理组与对照组协变量分布,计算标准化均差和方差比,若均接近0或1,则平衡性良好。52.某研究拟评价新型标志物对急性心衰30天死亡的预测能力,数据含30%右删失。请给出分析流程,并说明如何报告结果。答案:流程:1.绘制Kaplan–Meier曲线,按标志物高低分组,行Logrank检验;2.构建单因素Cox模型,得HR及95%CI;3.调整临床混杂因素,构建多因素Cox;4.检验比例风险假定(Schoenfeld残差);5.计算时间依赖ROC,得AUC(t);6.比较基础模型与加入标志物后的C指数、NRI、IDI;7.进行内部验证(Bootstrap1000次)及敏感性分析。给出HR、95%CI、p值;报告C指数变化及95%CI;提供AUC(t)曲线图;注明缺失数据处理方法;遵循TRIPOD声明。53.解释“统计效能”与“效应量”的区别与联系,并给出当效应量固定时提高效能的两种可行策略。答案:区别:效应量是反映生物学或临床差异大小的标准化指标(如Cohend、HR),与样本无关;统计效能是在给定α下拒绝错误零假设的概率(1β),依赖于样本量、效应量、α及变异。联系:效能随效应量增大而升高;当效应量固定时,提高效能策略:1.增加样本量;2.降低测量误差(如采用更精确仪器、重复测量取均值),从而减小方差。54.简述多重共线性的两种诊断指标,并给出一种解决方案。答案:诊断:1.方差膨胀因子VIF>10;2.条件数CN>30。解决方案:采用岭回归,在损失函数中加入L2惩罚项λ∑β²,通过交叉选择λ,既降低共线性又保留变量。55.某交叉试验发现阶段×处理交互p=0.02,请解释其含义,并提出两条分析建议。答案:含义:处理效应在不同阶段不一致,即存在阶段依赖性,可能由于洗脱期不足或遗留效应。建议:1.仅分析第一阶段数据,采用平行组设计策略;2.在模型中加入阶段×处理交互项,分别报告两阶段处理效应,并讨论临床可接受性。五、综合应用题(共50分)56.(本题20分)某医院收集2018–2023年行PCI术的ST段抬高型心梗患者资料,欲评价入院血糖与术后1年主要心脑血管事件(MACCE)的关系。数据含以下变量:年龄、性别、BMI、入院血糖(mmol/L)、TIMI血流、支架类型、他汀使用、高血压、既往卒中、LVEF、随访时间(月)、MACCE(0/1)。共纳入1200例,失访30例,MACCE发生150例。问题:1.写出研究假设与统计模型;(6分)2.说明如何处理失访及缺失数据;(4分)3.给出评价血糖预测价值的完整分析步骤;(6分)4.若血糖与MACCE呈非线性,请给出两种建模策略并比较优劣。(4分)答案:1.假设:入院血糖升高与MACCE风险增加相关。模型:多因素Cox比例风险回归,以MACCE为事件,随访时间为时间变量,血糖为暴露,调整年龄、性别、BMI、TIMI、支架类型、他汀、高血压、既往卒中、LVEF。2.失访:失访30例在随访末月作为右删失;缺失数据:采用多重插补(m=20),插补模型纳入所有预测变量及结局指示变量,合并用Rubin法则。3.步骤:a.描述基线特征,按血糖四分位分组;b.绘制KM曲线,行Logrank检验;c.单因素Cox得HR1;d.逐步调整混杂,得HR2;e.检验比例风险(Schoenfeld);f.计算C指数、NRI、IDI;g.Boots

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论