版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年生物统计学技术资格认证试卷及答案一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项字母填在括号内)1.在完全随机设计中,若处理数为5,每处理重复6次,则误差自由度为()A.24 B.25 C.29 D.30答案:A2.对同一组数据进行KruskalWallis检验与单因素方差分析,若数据严重偏离正态性,则()A.两者P值几乎相等 B.KruskalWallis的P值更大 C.方差分析的P值更大 D.无法判断大小关系答案:B3.在Logistic回归中,若某自变量X的OR=0.35,其95%CI为0.22–0.55,则下列说法正确的是()A.X每增加一个单位,成功优势下降65% B.置信区间提示可能存在交互作用 C.需对X进行对数变换 D.应删除该变量以简化模型答案:A4.重复测量方差分析中,球形检验的P<0.01,下一步应优先选择()A.GreenhouseGeisser校正 B.多元方差分析 C.剔除异常点 D.对变量进行BoxCox变换答案:A5.若两变量X与Y的Pearson相关系数r=0.88,但散点图呈明显“弓形”,则首先应怀疑()A.异常值 B.非线性关系 C.异方差 D.多重共线性答案:B6.在生存分析中,若KaplanMeier曲线出现“交叉”,则不适宜直接报告()A.中位生存时间 B.Logrank检验P值 C.风险比HR D.1年生存率答案:C7.对计数资料进行R×C列联表检验,若20%单元格期望频数<5,则应()A.合并相邻行列 B.改用Fisher精确检验 C.增加样本量 D.采用对数线性模型答案:A8.在多重比较中,若Bonferroni校正后无一显著,但未校正前存在P<0.05,则说明()A.检验效能不足 B.原假设必然成立 C.应改用t检验 D.样本量过大答案:A9.若线性回归的DW统计量为0.34,则模型最可能存在()A.正自相关 B.负自相关 C.异方差 D.多重共线性答案:A10.在随机区组设计中,区组与误差交互自由度为()A.(b1)(t1) B.b(t1) C.bt1 D.(b1)(r1)答案:D11.对二项分布B(n=60,π=0.3)进行正态近似,则连续性校正后的Z统计量为()A.(x18)/√12.6 B.(x18.5)/√12.6 C.(x17.5)/√12.6 D.(x18)/√18答案:B12.若Meta分析中I²=78%,则提示()A.发表偏倚严重 B.研究间异质性高 C.固定效应模型更合适 D.需剪补法校正答案:B13.在Poisson回归中,若暴露时间不等,则需引入()A.偏移量 B.权重 C.随机效应 D.交互项答案:A14.对服从指数分布的生存数据,若采用Cox模型,则比例风险假设()A.必然成立 B.必然不成立 C.需检验 D.无法检验答案:A15.若两样本t检验的Cohen’sd=0.45,则效应量属于()A.微小 B.中等 C.大 D.无法判断答案:B16.在PCA中,若第一主成分贡献率仅35%,则建议()A.保留前3主成分 B.采用因子分析 C.增加样本量 D.对变量标准化答案:A17.若二分类Logistic模型的AUC=0.92,而PR曲线面积仅0.48,则提示()A.数据集极不平衡 B.模型过拟合 C.应降低阈值 D.需增加正则化答案:A18.对高维数据p>n,若采用Lasso回归,则λ增大时()A.偏差增大方差减小 B.偏差减小方差增大 C.偏差方差均增大 D.无变化答案:A19.若两因素析因设计中,A、B均固定,交互效应显著,则最优解释应()A.单独报告主效应 B.单独报告简单效应 C.忽略交互 D.采用一次模型答案:B20.在贝叶斯统计中,若先验为Beta(2,8),似然为Bin(20,8),则后验均值为()A.0.4 B.0.357 C.0.333 D.0.3答案:B21.若时间序列的ADF检验P=0.03,则序列()A.平稳 B.1阶单整 C.2阶单整 D.季节波动答案:A22.对RNAseq计数数据,若进行差异分析,首选的分布假设为()A.负二项 B.Poisson C.二项 D.正态答案:A23.若三水平嵌套模型中,Level2方差分量<0,则应()A.改为线性混合效应模型 B.约束为0 C.增加Level3 D.删除随机效应答案:B24.在GWAS中,若MAF<0.01,则通常()A.纳入分析 B.剔除或单独分析 C.采用线性回归 D.采用t检验答案:B25.若两样本Wilcoxon检验的P=0.008,但中位数相等,则提示()A.分布形状不同 B.检验错误 C.样本量不足 D.存在结值答案:A26.对左截尾数据,适宜的描述统计量为()A.逆概率加权 B.中位数 C.几何均数 D.众数答案:A27.若回归模型的VIF=8.5,则()A.轻度共线 B.严重共线 C.无共线 D.需标准化答案:A28.在交叉设计中,若遗留效应显著,则优先采用()A.仅第一期数据 B.混合效应模型 C.协方差分析 D.非参数检验答案:A29.若二项分布的ClopperPearson区间比Wilson区间宽,则其置信水平()A.更高 B.更低 C.相等 D.无法比较答案:A30.在机器学习交叉验证中,若重复100次10折CV,则误差估计的方差主要来源于()A.数据划分 B.模型选择 C.随机种子 D.训练算法答案:A二、多项选择题(每题2分,共20分。每题至少有两个正确答案,多选少选均不得分)31.下列哪些方法可用于检验Logistic回归的拟合优度()A.HosmerLemeshow B.似然比 C.伪R² D.ROC曲线 E.残差杠杆图答案:A、B、C32.关于多重插补,下列说法正确的是()A.插补次数应≥5 B.需合并估计与方差 C.适用于MCAR与MAR D.可用链式方程 E.插补后需删除原始缺失记录答案:A、B、C、D33.下列哪些属于非参数回归技术()A.LOWESS B.样条平滑 C.随机森林 D.核回归 E.岭回归答案:A、B、D34.在Cox模型中,验证比例风险的方法包括()A.Schoenfeld残差 B.对数累积风险图 C.时依协变量 D.偏差残差 E.Martingale残差答案:A、B、C35.下列哪些指标受患病率影响()A.灵敏度 B.特异度 C.阳性预测值 D.阴性预测值 E.Youden指数答案:C、D36.关于Bootstrap,下列正确的是()A.可用于偏倚校正 B.要求数据独立同分布 C.百分位置信区间可能不对称 D.抽样次数通常≥1000 E.适用于小样本答案:A、B、C、D、E37.在RNAseq差异表达分析中,下列哪些软件采用经验贝叶斯()A.edgeR B.DESeq2 C.limmavoom D.Cuffdiff E.baySeq答案:A、B、C、E38.下列哪些设计属于区组设计()A.拉丁方 B.随机区组 C.平衡不完全区组 D.裂区 E.析因答案:A、B、C39.关于贝叶斯因子,下列说法正确的是()A.可用于模型选择 B.值>100视为强证据 C.与P值单调相关 D.受先验影响 E.可比较非嵌套模型答案:A、B、D、E40.下列哪些方法可用于变量选择()A.Lasso B.弹性网 C.逐步回归 D.遗传算法 E.主成分回归答案:A、B、C、D三、判断题(每题1分,共10分。正确打“√”,错误打“×”)41.对同一数据,若ShapiroWilk检验P>0.05,则数据一定服从正态分布。()答案:×42.在多重线性回归中,标准化回归系数可用于比较不同量纲变量的相对重要性。()答案:√43.若两样本方差齐性检验P<0.05,则必须采用Welch校正t检验。()答案:√44.Poisson回归的离散参数φ>1时,应改用负二项回归。()答案:√45.在Meta分析中,固定效应模型假设所有研究共享同一真实效应量。()答案:√46.对高维数据,PCA可用于降维,但不能用于变量选择。()答案:×47.若Logrank检验P>0.05,则两条生存曲线在任何时点均无差异。()答案:×48.在交叉设计中,处理效应与时期效应正交。()答案:×49.若二项分布的期望频数≥5,则正态近似置信区间覆盖率一定≥95%。()答案:×50.对左偏数据取对数后,分布可变得更对称。()答案:√四、填空题(每空2分,共20分)51.若单因素方差分析的F=6.42,df₁=3,df₂=36,则查表得P值约为________。(保留三位小数)答案:0.00152.对二项分布B(n=50,π=0.2),其方差为________。答案:853.若Cox模型HR=1.85,95%CI为1.10–3.12,则风险增加百分比为________%。(保留一位小数)答案:85.054.在多重比较中,若比较次数k=10,整体α=0.05,采用Bonferroni法,则单次检验显著阈值为________。答案:0.00555.若线性回归R²=0.64,调整R²=0.60,则样本量n与自变量p的关系满足n≈________p。(保留整数)答案:1356.对正态分布N(μ,σ²),其峰度系数为________。答案:357.若随机变量X服从Poisson(λ=4),则P(X=0)=________。(保留三位小数)答案:0.01858.在贝叶斯统计中,若先验为N(0,1),似然为N(θ,1),样本均值x̄=2,n=9,则后验均值为________。(保留两位小数)答案:1.8059.若时间序列的ACF在滞后1期显著,PACF在滞后1期后截尾,则模型初判为________。答案:AR(1)60.若Wilcoxon符号秩检验的T⁺=45,n=10,双侧P≈________。(查表)答案:0.032五、简答题(每题8分,共40分)61.简述RNAseq数据为何需进行归一化,并列举两种常用归一化方法及其原理。答案:RNAseq计数受测序深度与基因长度影响,直接比较导致假阳性。常用方法:①CPM(CountsPerMillion),即每百万读段计数,消除测序深度差异;②DESeq2的sizefactor,通过计算每个样本的中位数比值估计缩放因子,使库大小一致,同时保留差异信息。62.说明Cox比例风险模型中“比例风险”含义,并给出两种检验该假设的方法。答案:比例风险指任意两个个体的风险比不随时间变化。检验方法:①Schoenfeld残差法,将残差对时间回归,若斜率显著则假设不成立;②时依协变量法,引入交互项X×log(t),若系数显著则拒绝假设。63.解释“多重共线性”对线性回归的影响,并提出三种诊断与两种解决方案。答案:共线性使系数估计方差膨胀,t检验失效,符号反转。诊断:①方差膨胀因子VIF>10;②条件指数>30;③特征值分解。解决:①删除高VIF变量;②采用岭回归压缩估计;③主成分回归降维。64.比较固定效应与随机效应Meta分析的适用场景,并各举一例。答案:固定效应假设真实效应量相同,适用于研究间差异小,如同一实验室重复试验;随机效应允许真实效应量不同,适用于研究异质性大,如多中心临床试验。65.说明为何对高维数据p>n时OLS无法直接使用,并给出两种替代方法及其原理。答案:p>n时XᵀX不可逆,OLS无唯一解。替代:①Lasso,通过L1正则化使部分系数为零,实现变量选择;②主成分回归,先对X做PCA,再用前k个主成分回归,降低维度且保留最大方差。六、综合应用题(共30分)66.某研究欲比较三种降压药物(A、B、C)对收缩压(SBP)的影响,采用随机区组设计,区组因素为年龄层(<50,50–60,>60岁),每区组9名患者,随机分配至3药物组,治疗4周后测SBP下降值(mmHg)。数据如下:区组1:A=18,B=22,C=25区组2:A=20,B=21,C=24区组3:A=16,B=20,C=23(1)写出原假设与备择假设。(3分)(2)完成方差分析表,给出F值与P值。(10分)(3)若区组效应显著,请解释其实际意义。(5分)(4)若事后比较发现仅A与C差异显著,请给出结论并建议临床用药。(5分)(5)若数据呈明显右偏,请提出一种非参数替代方法并说明理由。(7分)答案:(1)H₀:三种药物SBP下降值总体均数相等;H₁:至少两种药物均数不等。(2)计算:总均值x̄=(18+22+25+20+21+24+16+20+23)/9=21SSA=3[(1821)²+(2121)²+(2421)²]=54SSB=3[(21.6721)²+(21.6721)²+(19.6721)²]=8SSE=Σ(xx̄ᵢⱼ)²=18方差表:来源 SS df MS F P药物 54 2 27 9.0 0.015区组 8 2 4 1.33 0.329误差 18 4 4.5总 80 8(3)区组效应P>0.05,说明年龄层对降压效果影响不显著,药物效应为主。(4)A与C差异显著,C降压效果更优,建议优先选C。(5)采用Friedman检验,因数据右偏且样本小,非参数方法不依赖正态假设,适用于随机区组非正态数据。七、计算与软件实操题(共40分)67.用R语言完成下列任务,并给出关键代码与结果解释。数据集:breastcancer(随case2500包提供),变量包括age,size,nodes,pgr,er,outcome(0=存活,1=死亡)。(1)构建多因素Logistic模型,预测outcome,纳入age,size,nodes,pgr,er,报告AIC与伪R²。(10分)(2)绘制ROC曲线,计算AUC,并给出95%CI。(10分)(3)用VIF检验多重共线性,列出VIF>5的变量并提出处理方案。(10分)(4)采用Lasso进行变量选择,给出最优λ对应的变量及其系数。(10分)答案:(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年常州工程职业技术学院长期公开招聘高层次人才备考题库及完整答案详解1套
- 3D打印导板在脑脊液漏修补中的应用
- 2025年龙岩市第三医院招聘3名编内专业技术人员备考题库及一套参考答案详解
- 2025年上海对外经贸大学公开招聘工作人员备考题库及参考答案详解1套
- 小学阶段校园文化墙设计与互动体验研究教学研究课题报告
- 简约中国风简历个人介绍
- 2025年宝安中学(集团)海天学校初中实验员、小学语文教师招聘备考题库有答案详解
- 2025年鲤城区新步实验小学秋季招聘合同制顶岗教师备考题库及一套完整答案详解
- 2025年宁夏沙湖旅游股份有限公司公开招聘备考题库及答案详解参考
- 2025年浙江大学医学院唐修文课题组招聘备考题库及1套完整答案详解
- 山东省烟台市2024-2025学年高三上学期期末考试物理试题
- 人教版八年级数学上册期末复习:必刷基础60题(14种必考题型)
- 细胞外基质影响生物电导率-洞察分析
- DB11 527-2008 变配电室安全管理规范
- 出纳劳务合同模板
- 创新创业创造:职场竞争力密钥智慧树知到期末考试答案章节答案2024年上海对外经贸大学
- JTG-3830-2018公路工程建设项目概算预算编制办法
- 检测进度计划及保障措施
- 马眼看世界之品牌与品质的关系课件
- 旋挖桩钻进记录-自动计算-含公式
- 高效能人士提高办事效率七个习惯学员
评论
0/150
提交评论