2025年生物统计学应用与分析考试卷及答案_第1页
2025年生物统计学应用与分析考试卷及答案_第2页
2025年生物统计学应用与分析考试卷及答案_第3页
2025年生物统计学应用与分析考试卷及答案_第4页
2025年生物统计学应用与分析考试卷及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年生物统计学应用与分析考试卷及答案一、单项选择题(每题2分,共20分。每题只有一个正确答案,请将正确选项字母填入括号内)1.某研究欲比较三种不同肥料对玉米株高的影响,随机抽取30块试验田,每块田随机施用其中一种肥料。若数据满足正态性与方差齐性,应首选的假设检验方法为()A.单样本t检验B.配对t检验C.单因素方差分析D.KruskalWallis检验答案:C2.在Logistic回归中,若某自变量X的回归系数β=0.8,则其优势比OR为()A.0.45B.1.00C.2.23D.8.00答案:C(OR=e^0.8≈2.23)3.对同一批小鼠先后两次测量血糖值,欲评估测量方法的一致性,应选用()A.Pearson相关系数B.组内相关系数ICCC.决定系数R²D.Cronbachα系数答案:B4.在生存分析中,若KaplanMeier曲线出现交叉,说明()A.两组生存率无差异B.比例风险假设可能不成立C.样本量不足D.中位生存期相等答案:B5.某实验记录细胞存活率(%)与药物浓度(μg/mL)的关系,经BoxCox变换后仍呈明显“S”型趋势,应优先考虑的回归模型为()A.线性回归B.多项式回归C.四参数Logistic回归D.指数回归答案:C6.在多重比较校正方法中,若实验共进行10次两两比较,原始P值分别为0.01、0.02…0.10,则Bonferroni校正后仍显著的P值阈值为()A.0.01B.0.005C.0.05D.0.50答案:B(0.05/10=0.005)7.对基因表达数据进行主成分分析(PCA),第一主成分方差贡献率为82%,第二主成分贡献率为10%,则前两个主成分累计贡献率为()A.82%B.90%C.92%D.172%答案:C8.在随机区组设计中,若区组因素与处理因素存在交互效应,则正确的统计模型应包含()A.仅主效应B.主效应+交互项C.仅区组效应D.仅处理效应答案:B9.若某变量服从泊松分布,其均数λ=4,则其方差为()A.2B.4C.16D.无法确定答案:B10.在Meta分析中,若I²=75%,则说明()A.无异质性B.轻度异质性C.中度异质性D.高度异质性答案:D二、多项选择题(每题3分,共15分。每题有两个或两个以上正确答案,多选、少选、错选均不得分)11.下列哪些情况可能导致线性回归出现“共线性”问题()A.样本量远小于自变量个数B.某自变量是另一自变量的线性组合C.自变量间Pearson|r|>0.9D.因变量呈明显偏态E.残差呈自相关答案:A、B、C12.关于非参数检验,下列说法正确的是()A.不要求总体分布已知B.检验效能总是高于参数检验C.适用于等级资料D.MannWhitneyU检验适用于两组独立样本E.Wilcoxon符号秩检验适用于配对设计答案:A、C、D、E13.在RNAseq差异表达分析中,下列哪些方法可用于控制FDR()A.BenjaminiHochberg法B.Bonferroni法C.Storeyq值法D.DESeq2内置的BH法E.TukeyHSD法答案:A、C、D14.下列哪些属于“重复测量设计”的特点()A.同一受试对象多次观测B.观测值间独立C.需考虑协方差结构D.可采用混合效应模型E.时间可作为固定效应或随机效应答案:A、C、D、E15.关于AIC与BIC,下列说法正确的是()A.AIC惩罚项小于BICB.均用于模型选择C.越小表示模型越好D.BIC随样本量增大惩罚更重E.仅适用于线性模型答案:A、B、C、D三、判断题(每题1分,共10分。正确打“√”,错误打“×”)16.当样本量趋于无穷大时,t分布趋近于标准正态分布。(√)17.在Logistic回归中,若因变量为二分类,则连接函数必须是logit函数,不可使用probit。(×)18.对同一数据,若ShapiroWilk检验P=0.03,则可直接认为数据不服从正态分布。(√)19.生存分析中,若存在失访数据,KaplanMeier法仍可使用,但需将失访数据作为删失处理。(√)20.在多重线性回归中,若VIF>10,则一定存在严重多重共线性。(√)21.非参数检验的零假设总是“总体分布相同”。(×)22.对计数资料进行χ²检验时,若期望频数<5的格子数超过20%,应使用Fisher精确概率法。(√)23.在随机森林中,增加树的数量一定能降低测试误差。(×)24.若两变量Pearsonr=0,则一定独立。(×)25.Meta分析中,固定效应模型假设所有研究的真实效应量相同。(√)四、填空题(每空2分,共20分)26.在单因素方差分析中,总离差平方和SST=SSA+________。答案:SSE27.若某药物剂量X(mg)与心率Y(次/分)呈负相关,线性回归方程为Y=120−2.5X,则剂量每增加1mg,心率平均下降________次/分。答案:2.528.在泊松回归中,常用的连接函数为________函数。答案:对数29.若随机变量X~N(μ,σ²),则Z=(X−μ)/σ服从________分布。答案:标准正态30.当资料存在过度离散时,负二项回归的离散参数θ越大,方差越________。答案:小31.在生存分析中,若风险函数h(t)为常数,则生存函数S(t)呈________分布。答案:指数32.若某2×2列联表χ²=6.25,则其列联系数C=________(保留三位小数)。答案:0.62033.对p维数据做PCA,最多可提取________个非零特征值的主成分。答案:p34.在混合线性模型中,随机效应的假定其服从均数为0、方差为________的正态分布。答案:G(或随机效应协方差矩阵)35.若某实验的检验效能1−β=0.90,则第二类错误概率β=________。答案:0.10五、简答题(每题8分,共24分)36.简述RNAseq数据在差异表达分析前为何需要进行“标准化”以及常用的两种标准化方法原理。答案要点:1.原因:测序深度、基因长度、样本间文库大小差异导致原始计数不可比;标准化消除系统偏差,使表达量具有可比性。2.TPM(TranscriptsPerMillion):先将readsperkilobase(RPK)计算,再除以样本总RPK的百万倍,保证同一样本内基因相对比例不变,且样本间可比。3.DESeq2的sizefactors:通过medianofratios方法,假设大部分基因非差异表达,计算每个样本的sizefactor,使样本间基因计数的中位数比值趋于1,再进行缩放。37.说明KaplanMeier法估计生存函数的基本步骤,并指出其两个前提假设。答案要点:步骤:1.将事件时间排序;2.计算每个时间点的死亡数与风险集;3.用乘积限法计算S(t)=∏(1−d_i/n_i);4.绘制阶梯曲线。假设:1.删失时间与事件时间独立;2.研究对象的风险集代表目标人群,即失访者与未失访者具有相同的事件风险。38.解释“交互效应”与“混杂因素”在回归模型中的区别,并各举一例说明如何识别与处理。答案要点:交互效应:某自变量对因变量的影响随另一自变量水平变化而变化,需在模型中加入乘积项;识别可用似然比检验比较主效应模型与含交互项模型;处理:保留显著交互项并分层解释。混杂因素:与自变量及因变量均相关,且不在因果路径上,导致虚假关联;识别:比较加入与未加入该因素时系数变化>10%;处理:纳入模型调整或使用匹配/分层分析。六、计算与分析题(共31分)39.(10分)为研究光照强度(Lux,X)对拟南芥光合速率(μmolm⁻²s⁻¹,Y)的影响,测得数据:n=8,∑X=800,∑Y=56,∑X²=90000,∑Y²=420,∑XY=6000。(1)建立线性回归方程Y=a+bX;(2)检验回归系数显著性(α=0.05,t₀.₀₂₅,₆=2.447);(3)当X=120Lux时,预测Y并给出95%置信区间(已知S_YX=0.8,X̄=100)。解:(1)b=(n∑XY−∑X∑Y)/(n∑X²−(∑X)²)=(8×6000−800×56)/(8×90000−800²)=0.04a=Ȳ−bX̄=(56/8)−0.04×100=7−4=3方程:Y=3+0.04X(2)SSX=∑X²−(∑X)²/n=90000−800²/8=10000sb=SYX/√SSX=0.8/√10000=0.008t=b/sb=0.04/0.008=5|t|=5>2.447,拒绝H₀,回归显著。(3)Ŷ=3+0.04×120=7.8SE_pred=SYX√[1/n+(X−X̄)²/SSX]=0.8√[1/8+(120−100)²/10000]=0.8√0.125+0.0004≈0.28395%CI:7.8±2.447×0.283→(7.11,8.49)40.(10分)某新药试验,记录两组小鼠(n₁=n₂=15)的生存天数:实验组:9,12,13,15,15,17,18,20,22,23,25,27,30,32,35⁺(⁺为删失)对照组:5,6,8,9,10,11,12,13,14,15,16,17,18,19,20(1)绘制KaplanMeier曲线草图(文字描述即可);(2)用Logrank检验判断两组生存差异(给出检验统计量及结论,α=0.05,χ²₀.₀₅,₁=3.84)。解:(1)曲线描述:实验组曲线整体位于对照组右上方,呈缓慢下降,35天仍存活1只;对照组曲线自5天起快速下降至20天归零。(2)Logrank计算:合并排序事件时间,列出四格表,计算O₁=7,E₁=11.2,O₂=13,E₂=8.8χ²=(O₁−E₁)²/E₁+(O₂−E₂)²/E₂=(7−11.2)²/11.2+(13−8.8)²/8.8≈1.58+2.01=3.593.59<3.84,不拒绝H₀,尚不能认为两组生存差异有统计学意义(P≈0.058)。41.(11分)为研究基因表达量(X,log₂CPM)与表型值(Y)的关系,建立线性模型Y=β₀+β₁X+ε,发现残差方差不齐。现采用加权最小二乘(WLS),权重w=1/σ²,其中σ²与X正相关。(1)写出WLS目标函数;(2)推导β₁的WLS估计公式;(3)若n=5,数据如下:X:0,1,2,3,4Y:2.1,3.9,5.8,8.2,10.1w:2,1.5,1,0.8,0.5计算β₁_WLS。解:(1)目标函数:min∑w_i(Y_i−β₀−β₁X_i)²(2)β₁_WLS=∑w_i(X_i−X̄_w)(Y_i−Ȳ_w)/∑w_i(X_i−X̄_w)²,其中X̄_w=∑w_iX_i/∑w_i(3)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论