2025生物统计试题总结及答案_第1页
2025生物统计试题总结及答案_第2页
2025生物统计试题总结及答案_第3页
2025生物统计试题总结及答案_第4页
2025生物统计试题总结及答案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025生物统计试题总结及答案一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项的字母填在括号内)1.在完全随机设计(CRD)中,若处理数为k,重复数为n,则总自由度为()A.kn1  B.k(n1)  C.n(k1)  D.k+n2答案:A2.对两独立正态总体方差齐性进行检验,应选用的统计量为()A.t  B.F  C.χ²  D.Z答案:B3.若X~N(μ,σ²),则P(μ1.96σ≤X≤μ+1.96σ)约为()A.90%  B.95%  C.97.5%  D.99%答案:B4.在Logistic回归中,优势比OR=1.5表示()A.暴露组发病率是非暴露组1.5倍B.暴露组优势是非暴露组1.5倍C.暴露组概率是非暴露组1.5倍D.暴露组logit增加1.5答案:B5.对重复测量资料,若忽略个体内部相关性,最直接导致的错误是()A.Ⅰ型错误率降低  B.Ⅱ型错误率降低C.标准误低估  D.标准误高估答案:C6.在多重比较中,Bonferroni校正的核心思想是()A.降低检验效能  B.控制族系错误率C.提高单检验水准  D.扩大置信区间答案:B7.若随机变量Y服从Poisson(λ),则Var(Y)=()A.λ²  B.λ  C.√λ  D.1/λ答案:B8.生存分析中,KaplanMeier估计的本质是()A.参数估计  B.非参数乘积极限C.半参数偏似然  D.贝叶斯后验答案:B9.对2×2表进行Fisher精确检验,其零假设为()A.行列独立  B.行列相关C.行列边际齐性  D.行列对称答案:A10.在广义线性模型(GLM)中,连接函数g(μ)=μ属于()A.logit  B.probit  C.identity  D.log答案:C11.若样本量n→∞,则样本均值的分布趋近于()A.χ²  B.t  C.正态  D.均匀答案:C12.对正态总体均值进行单侧检验H₀:μ≤μ₀,若α=0.05,则拒绝域为()A.t>t₀.₀₅,n1  B.t<t₀.₀₅,n1C.|t|>t₀.₀₂₅,n1  D.t>t₀.₀₂₅,n1答案:A13.在随机区组设计(RBD)中,若区组与处理存在交互作用,则()A.误差自由度增加  B.处理效应估计偏倚C.误差估计偏大  D.区组效应消失答案:B14.若相关系数r=0.8,则决定系数R²=()A.0.64  B.0.8  C.0.2  D.0.4答案:A15.对数秩检验(logranktest)比较两条生存曲线,其统计量近似服从()A.t  B.χ²  C.F  D.正态答案:B16.在Meta分析中,异质性检验Q统计量服从()A.正态  B.t  C.χ²  D.F答案:C17.若X~Bin(n,p),则当n大p小时,可用()近似。A.正态  B.Poisson  C.t  D.χ²答案:B18.对两相关样本率比较,应选用()A.McNemar  B.χ²  C.Fisher  D.CMH答案:A19.在Cox模型中,若某协变量系数β=0.2,则风险比HR=()A.1.22  B.0.82  C.1.20  D.0.20答案:A(e^0.2≈1.22)20.若残差图呈漏斗状,提示()A.方差齐性  B.方差不齐C.线性良好  D.正态性良好答案:B21.对有序分类资料,趋势检验常用()A.CochranArmitage  B.MantelHaenszelC.KruskalWallis  D.Wilcoxon答案:A22.在随机效应模型中,τ²表示()A.抽样误差  B.研究间方差C.总方差  D.权重答案:B23.若某变量服从指数分布,则其风险函数为()A.常数  B.递增  C.递减  D.先增后减答案:A24.对高维基因组数据,控制FDR常用()A.Bonferroni  B.Holm  C.BenjaminiHochberg  D.Šidák答案:C25.在ROC分析中,AUC=0.5表示()A.完美区分  B.无区分能力C.中等区分  D.差答案:B26.若设计为交叉试验,则分析时应考虑()A.顺序效应  B.区组效应C.重复效应  D.协变量答案:A27.对零膨胀计数资料,首选模型为()A.Poisson  B.负二项C.ZIP  D.线性回归答案:C28.在贝叶斯框架中,后验分布∝()A.似然×先验  B.似然/先验C.先验似然  D.似然+先验答案:A29.若样本偏度≈0、峰度≈3,则提示()A.左偏  B.右偏  C.正态  D.均匀答案:C30.对重复测量ANOVA,球形检验(Mauchly)p<0.05,应()A.用GreenhouseGeisser校正B.删除数据C.换非参  D.增加样本答案:A二、多项选择题(每题2分,共20分。每题至少有两个正确答案,多选少选均不得分)31.下列哪些属于非参数检验()A.Wilcoxon  B.KruskalWallisC.Friedman  D.MannWhitney答案:ABCD32.关于置信区间,正确的有()A.95%CI包含参数真值的概率为95%B.区间越宽,精度越低C.与标准误成正比D.与√n成反比答案:ABCD33.下列哪些方法可用于变量选择()A.LASSO  B.RidgeC.Stepwise  D.ElasticNet答案:ACD34.生存数据的特点包括()A.右删失  B.左截断C.非负  D.常呈偏态答案:ABCD35.关于统计效能,正确的有()A.与效应量正相关  B.与α负相关C.与样本量正相关  D.与方差负相关答案:ACD36.下列哪些属于多重共线性诊断指标()A.VIF>10  B.条件指数>30C.容忍度<0.1  D.特征根≈0答案:ABCD37.对二项分布,下列说法正确的是()A.均值为np  B.方差为np(1p)C.当p=0.5时对称  D.当n→∞近似正态答案:ABCD38.在Meta回归中,可纳入的协变量有()A.平均年龄  B.样本量C.研究设计  D.发表年份答案:ABCD39.下列哪些属于Bayes因子解释阈值()A.1~3弱证据  B.3~10中等C.10~30强  D.>100极强答案:ABCD40.对高维数据降维,可用()A.PCA  B.tSNEC.UMAP  D.PLS答案:ABCD三、判断题(每题1分,共10分。正确打“√”,错误打“×”)41.当样本量足够大时,t分布与标准正态分布几乎重合。()答案:√42.若两变量独立,则其相关系数必为0,反之亦然。()答案:×(非线性相关可能r=0)43.在Cox模型中,基准风险h₀(t)被完全指定。()答案:×(半参数,不指定)44.对数变换可降低右偏度。()答案:√45.多重检验校正一定降低检验效能。()答案:√46.若设计为析因设计,则必须检验交互作用。()答案:√47.当自变量存在测量误差时,回归系数估计一定偏大。()答案:×(通常偏向0)48.在负二项回归中,过度离散参数α越大,方差越大。()答案:√49.对小样本正态性检验,ShapiroWilk比KS更敏感。()答案:√50.若AIC<BIC,则模型一定更优。()答案:×(仅相对)四、填空题(每空1分,共20分)51.若X~N(10,4),则P(X>12)=________。(用标准正态累积分布Φ表示)答案:1Φ(1)52.在完全随机设计中,总平方和SST=________+SSE。答案:SSTR53.对2×2表,χ²统计量等于________(用O、E表示)。答案:Σ(OE)²/E54.若Logistic模型logit(p)=2+0.5x,则x每增加1单位,优势比为________。答案:e^0.5≈1.6555.在生存分析中,中位生存时间即生存函数S(t)=________时对应的t。答案:0.556.若随机变量Y~Exp(λ),则其期望E(Y)=________。答案:1/λ57.对多重线性回归,若R²=0.81,调整R²________(>、=、<)0.81。答案:<58.在随机效应Meta分析中,合并效应估计采用________加权。答案:逆方差59.若样本量n=100,样本率p̂=0.2,则其标准误为________。答案:√(0.2×0.8/100)=0.0460.对Poisson回归,偏移量(offset)常用________的对数。答案:人年或观察时间61.在ROC曲线中,最佳截断点常选________指数最大处。答案:Youden62.若两变量秩相关系数rs=0.7,则其衡量________相关。答案:单调63.对零膨胀模型,ZIP中零部分常用________回归。答案:logistic64.在Bayes定理中,后验Odds=先验Odds×________。答案:Bayes因子65.若设计为拉丁方,则处理数=________数=________数。答案:行,列66.对高维数据,FDR控制方法中,BenjaminiHochberg步骤中按________排序。答案:p值升序67.在Cox模型中,比例风险假定可用________残差检验。答案:Schoenfeld68.若样本峰度>3,则尾部比正态________。答案:厚69.对重复测量,线性混合模型中随机效应常用________分布。答案:正态70.在负二项回归中,当α→0,模型趋近于________回归。答案:Poisson五、简答题(每题6分,共30分)71.简述统计效能的影响因素,并说明如何在实验设计阶段提高效能。答案:影响因素:效应量、样本量、显著性水准α、方差、检验方向、统计方法。提高:增大样本量、减小测量误差(降低方差)、选择敏感设计、单侧检验(若合理)、提高α(若可接受)、采用配对或重复测量降低个体差异。72.解释生存分析中“风险比”与“优势比”的区别,并给出适用场景。答案:风险比(HR)是两组瞬时风险函数之比,适用于时间到事件数据,如Cox模型;优势比(OR)是两组优势之比,适用于横断面或病例对照研究。HR含时间维度,OR不含;HR解释相对风险变化率,OR解释优势变化。73.说明多重共线性对回归模型的影响,并列出两种诊断及两种解决方法。答案:影响:系数估计方差膨胀,符号反转,t值不显著,模型不稳定。诊断:VIF>10、条件指数>30、容忍度<0.1。解决:删除高VIF变量、主成分分析、岭回归、LASSO、中心化处理。74.简述BenjaminiHochberg控制FDR的步骤,并指出其优于Bonferroni的理由。答案:步骤:1.将m个p值升序排列得p(1)≤…≤p(m);2.找最大k使p(k)≤k/m×α;3.拒绝前k个假设。优于Bonferroni:Bonferroni控制族系错误率(FWER)过于保守,效能低;BH控制错误发现比例,更适合高维探索性研究,效能高。75.解释“置信区间”与“预测区间”在回归中的区别,并给出公式。答案:置信区间估计均值E(Y|X₀),反映参数不确定性;预测区间估计单个新Y₀,含随机误差。公式:CI=X₀β̂±t_{α/2,np}σ̂√(X₀(XᵀX)⁻¹X₀ᵀ);PI=X₀β̂±t_{α/2,np}σ̂√(1+X₀(XᵀX)⁻¹X₀ᵀ)。六、综合计算题(每题10分,共40分)76.为比较两种降压药,将20名患者随机分为两组(n₁=n₂=10),随访后收缩压下降值(mmHg)如下:A组:12,15,18,20,16,14,19,17,21,13B组:8,10,12,9,11,7,14,10,9,8假设方差齐且正态,请完成:(1)计算各组均值与合并方差;(2)进行双侧t检验(α=0.05);(3)给出差值的95%置信区间;(4)解释结果。答案:(1)x̄_A=16.5,x̄_B=9.8,差值=6.7;s_A²=8.94,s_B²=4.84,合并方差s_p²=(9×8.94+9×4.84)/18=6.89,s_p=2.625。(2)t=6.7/(2.625√(1/10+1/10))=6.7/1.175=5.70,df=18,t₀.₀₂₅,18=2.101,|t|>2.101,p<0.001,拒绝H₀。(3)95%CI=6.7±2.101×1.175=(4.23,9.17)。(4)A药降压效果平均比B药高6.7mmHg,差异有统计学意义,临床意义需结合最小重要差异判断。77.一项病例对照研究得到暴露史如下:暴露病例对照有8050无2050(1)计算OR;(2)进行χ²检验(α=0.05);(3)给出OR的95%置信区间;(4)解释。答案:(1)OR=(80×50)/(50×20)=4.0。(2)χ²=(80×5020×50)²×200/(130×70×100×100)=19.78,df=1,χ²₀.₀₅=3.84,19.78>3.84,p<0.001。(3)lnOR95%CI=ln4±1.96√(1/80+1/20+1/50+1/50)=1.386±1.96×0.346=(0.708,2.064),取指数得(2.03,7.88)。(4)暴露与疾病关联强度为4倍,差异显著,暴露可能是危险因素。78.对某化疗患者随访时间(月):4,5,5⁺,7,9⁺,10,12⁺,15,18⁺,20,其中⁺为右删失。请用KaplanMeier法:(1)列出风险集与事件数;(2)计算各时点生存率;(3)给出12月生存率及标准误;(4)绘图要点。答案:(1)时间序:4,5,5⁺,7,10,15,20;事件:1,1,0,1,1,1,0;风险集:10,9,8,7,5,3,1。(2)S(4)=0.9,S(5)=0.9×8/9=0.8,S(7)=0.8×6/7≈0.686,S(10)=0.686×4/5≈0.549,S(15)=0.549×2/3≈0.366,S(20)=0.366。(3)S(12)=S(10)=0.549,Greenwood标准误=0.549×√[1/(10×9)+1/(7×6)]≈0.549×0.176≈0.097。(4)横轴时间,纵轴S(t),阶梯下降,删失用“+”标出。79.为研究年龄(岁)、性别(男=1)、BMI对糖化血红蛋白(HbA1c%)的影响,建立线性回归,得结果:系数估计SEtp截距4.50.315<0.001年龄0.020.0120.04性别0.30.130.003BMI0.050.022.50.01R²=0.25,n=200。请完成:(1)写出回归方程;(2)解释BMI系数;(3)计算30岁男性BMI=25的预测值及95%CI;(4)检验模型整体显著性;(5)讨论R²。答案:(1)ŷ=4.5+0.02Age+0.3Gender+0.05BMI。(2)BMI每增加1kg/m²,HbA1c平均升高0.05%,控制年龄性别。(3)ŷ=4.5+0.02×30+0.3×1+0.05×25=4.5+0.6+0.3+1.25=6.65%;95%CI需残差标准误σ̂=√(SSE/(np)),先求σ̂=√[MSE]=√[(10.25)×SST/(196)],设SST=Σ(yiȳ)²,若s_y=0.8,则SST≈200×0.64=128,MSE=96/196≈0.49,σ̂≈0.7;预测标准误SE_pred=0.7×√[1/200+(X₀(XᵀX)⁻¹X₀ᵀ)],若杠杆值≈0.02,则SE_pred≈0.7×√0.22≈0.33,95%CI≈6.65±1.96×0.33≈(6.00,7.30)。(4)F=(R²/p)/[(1R²)/(np1)]=(0.25/3)/(0.75/196)=21.8,F₀.₀₅,3,196≈2.6,21.8>2.6,p<0.001,模型显著。(5)R²=0.25说明25%变异被解释,中等偏低,提示需纳入更多变量或考虑非线性。七、设计分析题(每题10分,共20分)80.某新药拟进行Ⅲ期临床试验,主要终点为连续变量,预计安慰剂组均值=10,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论