版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年生物统计学研究生入学考试试卷及答案一、单项选择题(每题2分,共30分。每题只有一个正确答案,请将正确选项字母填在括号内)1.在正态总体方差未知且样本量n=16的条件下,对总体均值μ进行双侧检验,若显著性水平α=0.05,则临界值tα/2对应的自由度为()A.15 B.14 C.16 D.17答案:A2.对同一组数据分别建立线性模型Y=β0+β1X+ε与二次模型Y=β0+β1X+β2X²+ε,若二次项系数β2的p值=0.018,则下列说法正确的是()A.线性模型已足够,二次项无统计意义B.二次模型显著优于线性模型,必须采用二次模型C.在α=0.05水平下,二次项显著,但需结合AIC或BIC再判断D.二次项显著,故线性模型存在严重误设答案:C3.在完全随机设计单因素方差分析中,若组间均方MSB=120,组内均方MSW=30,则F值与结论为()A.4,拒绝原假设 B.0.25,不拒绝原假设 C.4,不拒绝原假设 D.0.25,拒绝原假设答案:A4.对二分类响应变量建立Logistic回归,若某连续自变量X的OR=1.35(95%CI:1.10–1.65),则下列解释正确的是()A.X每增加1个单位,事件概率增加35%B.X每增加1个单位,事件发生比增加35%C.X每增加1个单位,事件发生比增加1.35倍D.X与事件概率无线性关系答案:B5.在生存分析中,若Kaplan–Meier曲线出现“交叉”,则优先考虑的下一步分析是()A.直接报告Logrankp值B.采用Cox比例风险模型C.进行分层Logrank检验或时依Cox模型D.放弃统计,仅做描述答案:C6.对同一批数据分别用Pearson与Spearman相关,若r=0.81,ρ=0.42,则最可能的原因为()A.存在离群值或非线性单调关系 B.样本量不足 C.变量为分类变量 D.计算错误答案:A7.在多重比较校正方法中,若实验共进行20次独立t检验,原始p值列表为0.003、0.011、0.025…,则Bonferroni校正后显著性阈值为()A.0.025 B.0.0025 C.0.05 D.0.01答案:B8.对随机区组设计,若区组因素F检验p=0.08,处理因素p=0.006,则下列说法正确的是()A.区组无意义,应改为完全随机设计B.区组虽未达到0.05,但仍可提高精度,建议保留C.处理因素显著,区组可忽略D.必须删除区组重新分析答案:B9.在Poisson回归中,若发现残差偏离明显大于1,首要考虑()A.增加样本量 B.改用负二项回归 C.变量标准化 D.删除异常点答案:B10.对两独立正态总体方差齐性检验,若Levene检验p=0.023,则后续均值比较应选用()A.合并方差t检验 B.Welcht检验 C.Mann–WhitneyU D.配对t检验答案:B11.在线性回归中,若VIF=8.5,则提示()A.自变量与因变量高度相关 B.存在严重多重共线性 C.模型拟合优度差 D.残差异方差答案:B12.对同一数据做PCA,若前三个主成分累计贡献率=85%,则第四主成分的特征值最可能()A.>1 B.≈1 C.<1 D.无法判断答案:C13.在Meta分析中,若I²=62%,则提示()A.无异质性 B.中度异质性 C.高度异质性 D.发表偏倚严重答案:B14.对重复测量资料,若球形检验p=0.012,则方差分析应选用()A.单因素ANOVA B.多元方差分析MANOVA C.配对t检验 D.忽略球形性答案:B15.在贝叶斯统计中,若先验为Beta(3,7),似然为二项分布Bin(n=20,k=12),则后验分布为()A.Beta(15,15) B.Beta(12,8) C.Beta(15,25) D.Beta(12,20)答案:A二、多项选择题(每题3分,共15分。每题至少有两个正确答案,多选少选均不得分)16.下列哪些方法可用于处理缺失数据MCAR机制()A.完整案例分析 B.多重插补 C.最大似然估计 D.最后观测值向前插补答案:A、B、C17.关于Cox比例风险模型,下列说法正确的是()A.不要求基线风险服从特定分布 B.需满足比例风险假定 C.可含时依协变量 D.参数解释与Logistic回归相同答案:A、B、C18.下列哪些指标可用于评价Logistic模型预测性能()A.AUC B.Brier分数 C.校准斜率 D.调整R²答案:A、B、C19.关于非参数检验,下列说法正确的是()A.Kruskal–Wallis用于多组独立样本 B.Wilcoxon符号秩用于配对资料 C.不要求正态分布 D.功效总是低于参数检验答案:A、B、C20.在实验设计中,下列哪些措施可提高统计功效()A.增加样本量 B.减少测量误差 C.采用区组设计 D.提高α水平答案:A、B、C、D三、填空题(每空2分,共20分)21.若随机变量X~N(μ,σ²),则Z=(X̄μ)/(σ/√n)服从________分布;当σ未知且用样本标准差s代替时,统计量服从________分布。答案:标准正态;t22.在多重线性回归中,若决定系数R²=0.82,调整R²=0.79,则模型中自变量数目p与样本量n满足关系________。答案:p<n1且p增加导致调整R²<R²23.对2×2交叉设计,若处理效应估计值θ̂=5.6,方差V(θ̂)=4.8,则其95%置信区间为________。答案:5.6±1.96×√4.8→5.6±4.30→(1.30,9.90)24.若Poisson分布均数λ=6,则其方差为________;当λ>________时,Poisson分布近似正态。答案:6;3025.在随机森林回归中,若袋外误差OOB=0.35,而测试集RMSE=0.42,则提示模型存在________。答案:轻微过拟合26.若线性混合效应模型中随机截距方差σ²u=0.8,残差方差σ²e=1.2,则组内相关系数ICC=________。答案:0.8/(0.8+1.2)=0.427.在Meta分析固定效应模型中,若Q检验p=0.18,则异质性方差τ²估计为________。答案:028.若两变量X、Y的秩相关系数ρ=0.72,则其决定系数等于________。答案:0.72²=0.518429.对二项分布Bin(n=50,π=0.3),则其偏度为________。答案:(12π)/√[nπ(1π)]=0.1430.在贝叶斯因子BF₁₀=12.5,则证据强度支持________假设。答案:备择四、计算与证明题(共35分)31.(8分)为研究新型肥料对作物产量的影响,随机抽取10块试验田,记录施肥前后产量差值(kg):12,8,15,9,11,13,10,14,16,12假设差值服从正态分布,试检验肥料是否显著增产(α=0.05)。解:H₀:μd=0;H₁:μd>0n=10,d̄=12,sd=2.739t=d̄/(sd/√n)=12/(2.739/3.162)=13.86df=9,单侧临界值t₀.₀₅=1.83313.86>1.833,拒绝H₀,肥料显著增产。32.(10分)某研究建立Logistic模型预测糖尿病,自变量年龄(岁)、BMI(kg/m²)、家族史(0/1),结果如下:β̂₀=8.2,β̂_age=0.07,β̂_bmi=0.15,β̂_fh=1.20(1)计算一名50岁、BMI=30、有家族史者的预测概率;(2)解释BMI的OR含义;(3)若年龄从50增至60,求概率变化百分比。解:(1)η=8.2+0.07×50+0.15×30+1.2=8.2+3.5+4.5+1.2=1.0p=1/(1+e^1)=0.731(2)OR_bmi=e^0.15=1.16,BMI每增加1单位,发病比增加16%。(3)η₁₀=1.0+0.07×10=1.7,p₁₀=0.846,变化=(0.8460.731)/0.731=15.7%。33.(9分)为比较三种抗癌药物对小鼠生存天数的影响,随机分配每组12只,数据经Logrank检验得χ²=8.45,df=2。(1)给出完整假设;(2)下结论(α=0.05);(3)若后续两两比较,校正后显著性阈值?解:(1)H₀:三组生存曲线相同;H₁:至少一条不同。(2)χ²=8.45>5.99,p=0.015,拒绝H₀,药物效应显著。(3)共3对,Bonferroni阈值=0.05/3=0.0167。34.(8分)证明:在简单线性回归中,最小二乘估计β̂₁可表示为β̂₁=∑(XiX̄)(YiȲ)/∑(XiX̄)²,并证其无偏性。证明:目标函数S=∑(Yiβ0β1Xi)²,对β1求偏导并令0得:β̂₁=∑(XiX̄)(YiȲ)/∑(XiX̄)²E(β̂₁)=E[∑(XiX̄)(β0+β1Xi+εiȲ)]/Sxx=β1∑(XiX̄)Xi/Sxx+E[∑(XiX̄)εi]/Sxx=β1+0=β1,故无偏。五、综合应用题(共30分)35.(15分)某生态研究记录湖泊氮浓度(Y,mg/L)与流域农田比例(X1,%)及降雨量(X2,mm)关系,n=40,拟合多重线性回归结果:系数:β̂₀=0.80,β̂₁=0.032,β̂₂=0.0015方差分析:SSR=4.56,SSE=2.44残差诊断:ShapiroWilkp=0.08,BreuschPaganp=0.021,VIF₁=1.7,VIF₂=1.8,最大Cook距离=0.42(1)写出完整回归方程并解释β̂₁;(2)计算R²及调整R²;(3)判断模型是否满足经典假定,若否提出改进方案;(4)若预测X1=60,X2=800,求95%置信区间(给出公式与步骤)。解:(1)Ŷ=0.80+0.032X10.0015X2;农田比例每增1%,氮浓度平均增0.032mg/L,控制降雨量不变。(2)SST=SSR+SSE=7.00,R²=4.56/7=0.651;调整R²=1(10.651)(39/37)=0.632。(3)Shapirop=0.08>0.05,残差正态;BreuschPaganp=0.021<0.05,存在异方差;VIF<5,无共线性;Cook<0.5,无强影响点。改进:采用加权最小二乘或稳健标准误。(4)X₀=(1,60,800),C=(X'X)^1,需计算X₀'CX₀,得s²_pred=MSE[1+X₀'CX₀],MSE=2.44/37=0.0659,t₀.₀₂₅,37≈2.026,CI=Ŷ₀±t·s_pred,具体数值需矩阵运算。36.(15分)为评价基因编辑技术对水稻光合速率的影响,采用随机区组设计,4个处理(含对照),5个区组,测得数据满足正态但方差不齐。给出完整分析方案:(1)写出统计模型;(2)给出假设检验步骤及方法;(3)若处理显著,说明多重比较策略;(4)若区组效应显著,其实际意义为何?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论