2025年大学《生物统计学》专业题库及答案_第1页
2025年大学《生物统计学》专业题库及答案_第2页
2025年大学《生物统计学》专业题库及答案_第3页
2025年大学《生物统计学》专业题库及答案_第4页
2025年大学《生物统计学》专业题库及答案_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学《生物统计学》专业题库及答案一、描述性统计与数据可视化1.(单选)某课题组测得120尾斑马鱼体长(mm)的分布呈轻微右偏,若用箱线图呈现,则下列哪一项最可能被标记为“离群值”?A.上须末端值 B.下须末端值 C.大于Q3+1.5IQR的值 D.中位数答案:C2.(单选)对一组成年小鼠体重数据取自然对数后,偏度由1.4降至0.2,说明:A.对数变换压缩了右侧长尾 B.对数变换增加了方差 C.数据变为左偏 D.峰度一定减小答案:A3.(填空)若样本x1…xn的均值为5.6,令yi=2xi-3,则y的样本方差是原样本方差的____倍。答案:44.(计算)某次RNAseq得到6个样本的基因A的readcount分别为12、18、25、31、44、70。(1)计算变异系数(CV,%);(2)给出直方图组距为15时的频率分布表;(3)若对数据取平方根后再计算CV,结果为何?并解释为何平方根常用于count数据。答案:(1)均值=33.33,标准差=20.81,CV=62.4%;(2)[0,15)1次,[15,30)2次,[30,45)2次,[45,60)0次,[60,75)1次;(3)平方根后均值=5.52,标准差=1.72,CV=31.1%;平方根可稳定方差,使均值与方差脱钩,符合Poisson方差≈均值的特性。5.(综合)某生态站连续365d记录某候鸟每日最大栖留数量。给出绘制“时间—数量”折线图时的三大易错细节,并给出对应的R代码补丁。答案:易错1:未将日期因子化导致横轴排序错乱;补丁:as.Date()后scale_x_date()。易错2:缺失日直接忽略造成假断点;补丁:complete()填充NA再用geom_line()的na.rm=FALSE。易错3:y轴默认起点非0夸大波动;补丁:expand_limits(y=0)。二、概率分布与抽样模型6.(单选)若X~NegBin(r=3,p=0.2),则P(X≤5)的R函数调用为:A.pnbinom(5,3,0.2) B.pnbinom(5,2,0.2) C.pnbinom(3,5,0.2) D.pnbinom(3,0.2,5)答案:A7.(单选)在泊松分布中,若λ增大,则其众数:A.始终等于λ B.始终等于floor(λ) C.可能等于λ或λ-1 D.始终等于λ+1答案:C8.(计算)某CRISPR实验每转染细胞出现靶向突变的概率为0.07。若需至少5个突变细胞,问平均需准备多少细胞?给出分布名称、期望公式及数值。答案:负二项分布NegBin(r=5,p=0.07),期望E=r(1-p)/p=5×0.93/0.07≈66.4,即平均67个。9.(证明)设X|Λ~Poisson(Λ),Λ~Gamma(α,β),利用全期望公式证明边缘分布X为负二项,并给出参数对应关系。答案:E(s^X)=E[E(s^X|Λ)]=E[e^{Λ(s-1)}]=M_Λ(s-1)=(β/(β-(s-1)))^α令p=β/(β+1),则上式化为[p/(1-(1-p)s)]^α,即NegBin(r=α,p=1-p)的PGF,故X~NegBin(r=α,p=β/(β+1))。10.(应用)某微生物培养液中,每毫升平均3个菌落,若取样体积v毫升,求:(1)v为何值时,P(至少1个菌落)≥0.99?(2)若实际体积服从Exp(λ=0.2mL),求菌落总数Y的分布名称与期望。答案:(1)1-e^(-3v)≥0.99⇒v≥ln(100)/3≈1.535mL;(2)Y|V~Poisson(3V),V~Exp(0.2),则Y为泊松—指数混合,即几何分布Geo(p=0.2/(3+0.2)),期望E(Y)=3/0.2=15。三、参数估计与假设检验基础11.(单选)对一正态总体N(μ,σ²)的均值做t检验,若样本量n=16,显著性水平α=0.05,则当真实μ比μ0大0.5σ时,检验功效约为:A.0.40 B.0.60 C.0.70 D.0.80答案:B(提示:非中心参数δ=0.5×4=2,查t功效表)12.(计算)某新型荧光蛋白报告基因在8个独立转基因系中的表达量(相对单位)为:1.7、2.1、1.9、2.3、2.0、1.8、2.2、2.4。已知野生型理论均值为2.0,方差未知。(1)给出H0:μ=2.0vsHa:μ≠2.0的t统计量值;(2)计算双侧P值并下结论;(3)给出μ的95%置信区间。答案:(1)x̄=2.175,s=0.242,t=(2.175-2)/(0.242/√8)=2.04;(2)df=7,查表得P≈0.083,不拒绝H0;(3)2.175±2.365×0.242/√8→(2.17±0.202)即(1.973,2.377)。13.(综合)某实验室想验证“光照周期16L:8D可提高斑马鱼产卵量”。历史数据:12L:12D下平均210粒,σ=45粒。现计划新光照,希望检出差异30粒,功效0.8,α=0.05,求:(1)单尾z检验所需样本量;(2)若实际σ可能达60,求样本量增幅百分比;(3)若改用双侧检验,样本量如何变化?答案:(1)n=[(1.645+0.842)×45/30]^2≈35;(2)σ=60时n≈62,增幅(62-35)/35≈77%;(3)双侧z_{α/2}=1.96,n≈43,增幅23%。14.(证明)证明:对于正态总体,样本方差S²是σ²的UMVUE。答案:1.完备性:正态族对σ²是完备的;2.无偏:E(S²)=σ²;3.充分:∑(Xi-X̄)²为σ²的充分统计量;由Lehmann–Scheffé定理,S²为UMVUE。四、方差分析15.(单选)单因素ANOVA中,若F值小于1,则:A.组间均方必小于组内均方 B.总体均值必相等 C.拒绝H0 D.以上都不对答案:A16.(计算)研究三种饲料对仔鸡增重(g)的影响,每组8只,得SSA=4320,SSE=5760。(1)完成方差分析表;(2)检验H0:μ1=μ2=μ3,α=0.05;(3)若事后用TukeyHSD,临界HSD值(q0.05,3,21)≈3.57,求最小显著差异。答案:(1)dfA=2,dfE=21,MSE=274.29,F=7.87;(2)F0.05(2,21)=3.47,7.87>3.47,拒绝H0;(3)HSD=3.57×√(274.29/8)=20.9g。17.(综合)某药物实验采用2×3析因设计:因素A为剂量(低、高),因素B为给药时间(晨、午、晚),每组5只大鼠。给出下列R代码缺失部分,使能输出交互效应轮廓图并检验交互。答案:```rlibrary(ggplot2)model<aov(weight~dosetime,data=drug)summary(model)ggplot(drug,aes(x=time,y=weight,group=dose,color=dose))+stat_summary(fun=mean,geom="point")+stat_summary(fun=mean,geom="line")+theme_bw()```18.(证明)证明:在固定效应单因素ANOVA中,若H0成立,则E(MSA)=E(MSE)。答案:E(MSA)=σ²+n∑αi²/(a-1),H0下αi=0⇒E(MSA)=σ²=E(MSE)。五、回归与相关19.(单选)若简单线性回归中决定系数R²=0.81,则相关系数r可能为:A.0.81 B.-0.9 C.0.9或-0.9 D.0.405答案:C20.(计算)测得10株拟南芥叶片面积x(cm²)与光合速率y(μmolCO₂·m⁻²·s⁻¹)数据,得:∑x=240,∑y=420,∑x²=6200,∑y²=18200,∑xy=10440。(1)求回归方程;(2)检验H0:β1=0,α=0.05;(3)当x=25cm²时,给出y的95%预测区间。答案:(1)x̄=24,ȳ=42,Sxx=6200-240²/10=440,Sxy=10440-240×420/10=360β̂1=360/440=0.818,β̂0=42-0.818×24=22.37⇒ŷ=22.37+0.818x(2)SSE=18200-22.37×420-0.818×10440=127.3,s=√(127.3/8)=3.99t=0.818/(3.99/√440)=13.5,P<0.001,拒绝H0;(3)预测标准误s_pred=3.99×√[1+1/10+(25-24)²/440]=4.2024±2.306×4.20→(12.7,51.3)。21.(综合)多元回归中,若自变量p=5,n=30,R²=0.65,求调整R²;若再增一变量且R²仅升至0.66,评价该变量取舍。答案:adjR²(1)=1-(1-0.65)×29/24=0.577adjR²(2)=1-(1-0.66)×29/23=0.571调整R²下降,说明新增变量边际贡献不足,应剔除。22.(证明)证明:线性回归最小二乘估计β̂的协方差矩阵为σ²(XᵀX)⁻¹。答案:β̂=(XᵀX)⁻¹XᵀY,Cov(β̂)=(XᵀX)⁻¹XᵀCov(Y)X(XᵀX)⁻¹=σ²(XᵀX)⁻¹。六、非参数方法23.(单选)Wilcoxon秩和检验vs独立样本t检验,当数据服从重尾对称分布时,前者的:A.功效通常更高 B.第一类错误率更高 C.功效一定更低 D.仅适用于小样本答案:A24.(计算)两种杀虫剂A、B对蚊幼24h击倒时间(min)如下:A:151822252830B:12141619212326用Mann–WhitneyU检验H0:两总体分布相同,α=0.05。答案:合并秩次:A得秩4,5,7,9,10,11,秩和WA=46U=46-6×7/2=25,查表U0.05(6,7)=36,25<36,拒绝H0,A击倒时间显著更长。25.(综合)给出Kruskal–Wallis检验的秩版效应量公式,并计算上题数据。答案:ε²=(H-k+1)/(n-k),H=6.23,k=2,n=13⇒ε²=0.44(中高效应)。26.(证明)证明符号检验在median处的二项参数p=0.5。答案:对连续分布,P(X>median)=P(X<median)=0.5,故符号服从Bin(n,0.5)。七、分类数据与列联表27.(单选)2×2表用Fisher精确检验,其P值计算基于:A.超几何分布 B.二项分布 C.正态近似 D.χ²分布答案:A28.(计算)调查200名大学生“是否熬夜”与“是否近视”得:   近视非近视熬夜  90  30不熬夜 30  50(1)计算χ²统计量;(2)给出OR及95%CI;(3)解释CI是否支持关联。答案:(1)χ²=200(90×50-30×30)²/(120×80×120×80)=25.0,P<0.001;(2)OR=(90×50)/(30×30)=5.0,lnOR=1.609,SEL=√(1/90+1/30+1/30+1/50)=0.30295%CI:exp(1.609±1.96×0.302)=(2.8,9.0);(3)CI不含1,强关联。29.(综合)给出Cochran–Mantel–Haenszel检验公式,并说明如何检验三维表中的共同OR。答案:χ²CMH=[∑(ai-E(ai))]²/∑Var(ai),其中E(ai)=Ri×Ci/Ni,Var(ai)=RiCiSiNi⁻²(Ni-1)⁻¹若χ²CMH显著,则层间共同OR≠1。30.(证明)证明:在2×2表中,χ²统计量与z统计量(两比例)满足χ²=z²。答案:z=(p̂1-p̂2)/√[p̂(1-p̂)(1/n1+1/n2)],平方后分子即(ad-bc)²/N²,分母即(a+b)(c+d)(a+c)(b+d)/N³,与χ²公式一致。八、贝叶斯统计入门31.(单选)若X~Bin(n,θ),先验θ~Beta(1,1),观测到xsuccesses,则后验均值为:A.x/n B.(x+1)/(n+2) C.(x+1)/(n+1) D.x/(n+1)答案:B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论