2025年大学《生物统计学》专业题及答案_第1页
2025年大学《生物统计学》专业题及答案_第2页
2025年大学《生物统计学》专业题及答案_第3页
2025年大学《生物统计学》专业题及答案_第4页
2025年大学《生物统计学》专业题及答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学《生物统计学》专业题及答案一、单选题(每题1分,共20分。每题只有一个正确答案,请将正确选项的字母填在括号内)1.在正态总体方差未知且样本量n=16的条件下,对总体均值进行双侧t检验,显著性水平α=0.05,则拒绝域的临界值为()。A.±1.753  B.±2.131  C.±2.120  D.±1.746答案:B2.若随机变量X~B(n=100,p=0.02),则P(X=3)最接近下列哪一值()。A.0.182  B.0.061  C.0.270  D.0.323答案:A3.对两独立正态总体方差比进行F检验,若n₁=8,n₂=10,则F统计量的自由度为()。A.(7,9)  B.(8,10)  C.(9,7)  D.(10,8)答案:A4.在简单线性回归中,若决定系数R²=0.81,则相关系数r的绝对值为()。A.0.81  B.0.90  C.0.656  D.0.95答案:B5.当样本量n→∞时,样本均值的分布趋近于()。A.t分布  B.χ²分布  C.正态分布  D.F分布答案:C6.对同一批小鼠重复测量体重3次,欲检验测量误差是否显著,应选用()。A.单因素方差分析  B.配对t检验  C.重复测量方差分析  D.双样本t检验答案:C7.若两变量等级相关系数rs=0.68,n=12,则对H₀:ρs=0进行t检验的统计量值为()。A.2.44  B.2.92  C.3.15  D.1.98答案:B8.在完全随机设计方差分析中,若组间均方MSB=45,组内均方MSE=9,则F值等于()。A.5  B.36  C.0.2  D.54答案:A9.对四格表资料进行χ²检验,当任一理论频数小于5时,首选的补救方法是()。A.增加样本量  B.Fisher精确概率法  C.合并行列  D.正态近似答案:B10.若logistic回归模型ln[p/(1p)]=–2+0.3x,则x每增加1个单位,优势比OR为()。A.0.3  B.1.35  C.2.72  D.0.74答案:B11.在多重比较中,若采用Tukey法,其检验水准αE=0.05,则各对比组的名义水准()。A.等于0.05  B.小于0.05  C.大于0.05  D.与组数无关答案:B12.对服从指数分布的寿命数据,若采用Kaplan–Meier法估计生存函数,则下列说法正确的是()。A.假定风险函数恒定  B.属于非参数方法  C.需指定分布  D.仅适用于小样本答案:B13.若随机变量X~Poisson(λ=4),则E(X²)等于()。A.4  B.16  C.20  D.8答案:C14.在正态性Shapiro–Wilk检验中,若W=0.985,p=0.321,则结论为()。A.拒绝正态性  B.不拒绝正态性  C.数据呈偏态  D.需转换答案:B15.对同一受试对象先后接受A、B两种处理,若差值d~N(μd,σ²),则检验H₀:μd=0的统计量服从()。A.χ²(n–1)  B.t(n–1)  C.F(1,n–1)  D.N(0,1)答案:B16.若两变量Pearson相关系数r=–0.45,n=20,则相关显著性检验的p值范围()。A.p>0.05  B.0.01<p<0.05  C.p<0.01  D.无法判断答案:B17.在随机区组设计中,若区组与处理交互作用显著,则正确的处理策略是()。A.忽略交互  B.采用固定效应模型  C.分别在各区内比较  D.增加重复答案:C18.若某基因型频率符合Hardy–Weinberg平衡,则杂合子频率H与等位基因频率p的关系为()。A.H=p²  B.H=2p(1–p)  C.H=1–2p  D.H=p(1–p)答案:B19.对剂量–反应资料进行Probit分析,其本质属于()。A.非线性回归  B.广义线性模型  C.主成分分析  D.聚类分析答案:B20.在Meta分析中,若I²=62%,则说明()。A.无异质性  B.中度异质性  C.高度异质性  D.发表偏倚严重答案:B二、多选题(每题2分,共20分。每题至少有两个正确答案,多选少选均不得分)21.下列哪些情况适合使用非参数统计方法()。A.总体分布未知  B.方差不齐  C.数据为等级资料  D.样本量极大  E.存在极端异常值答案:ABCE22.关于置信区间,下列说法正确的是()。A.95%置信区间包含真值的概率为95%  B.区间宽度与样本量成反比  C.置信水平越高,区间越窄  D.可用于假设检验  E.与标准误成正比答案:ABDE23.在多重线性回归中,多重共线性的表现包括()。A.回归系数符号与理论相反  B.VIF>10  C.决定系数R²极低  D.特征值接近0  E.容忍度接近1答案:ABD24.关于生存分析,正确的有()。A.可处理删失数据  B.风险比HR>1表示因素不利  C.Logrank检验属参数方法  D.Cox模型要求基线风险恒定  E.中位生存期即50%事件发生时间答案:ABE25.下列属于试验设计基本原则的有()。A.随机化  B.重复  C.局部控制  D.盲法  E.双尾检验答案:ABCD26.在生物等效性评价中,常用的统计标准包括()。A.90%置信区间在80%–125%  B.双单侧t检验  C.交叉设计  D.对数转换  E.非劣效界值10%答案:ABCD27.关于类型Ⅰ错误与类型Ⅱ错误,下列说法正确的是()。A.α增大则β减小  B.样本量增加可同时降低两类错误  C.类型Ⅱ错误概率用β表示  D.类型Ⅰ错误属“存伪”  E.检验效能=1–β答案:ABCE28.在聚类分析中,常用的距离度量有()。A.欧氏距离  B.曼哈顿距离  C.马氏距离  D.余弦相似度  E.相关系数距离答案:ABCDE29.主成分分析中,主成分的性质包括()。A.彼此正交  B.方差依次递减  C.可解释原始变量全部信息  D.单位特征向量  E.主成分得分可小于0答案:ABDE30.在高通量组学数据差异分析中,控制假发现率FDR的方法有()。A.Bonferroni  B.Benjamini–Hochberg  C.Storeyq值  D.置换检验  E.Šidák校正答案:BCD三、判断题(每题1分,共10分。正确打“√”,错误打“×”)31.对偏态分布资料,中位数比算术均数更能代表集中趋势。()答案:√32.在t检验中,若p=0.048,则可认为两组差异具有生物学意义。()答案:×33.若两变量相关系数r=0,则表明两变量独立。()答案:×34.方差分析要求各组总体方差相等。()答案:√35.对数转换可降低数据异方差性。()答案:√36.Cox比例风险模型中,若PH假设不成立,可采用分层Cox模型。()答案:√37.在随机效应Meta分析中,合并效应量需考虑研究间方差τ²。()答案:√38.当样本量足够大时,二项分布可用正态近似。()答案:√39.若Shapiro–Wilk检验p>0.05,则数据一定服从正态分布。()答案:×40.在多重比较中,Bonferroni法比Tukey法更容易犯Ⅱ型错误。()答案:√四、填空题(每空2分,共20分)41.若X~N(μ,σ²),则标准化变量Z=________,服从________分布。答案:(X–μ)/σ,N(0,1)42.在简单线性回归中,回归系数b的估计公式b=________,其中分子为________,分母为________。答案:Σ(xi–x̄)(yi–ȳ)/Σ(xi–x̄)²,协方差,x的离差平方和43.对二项分布B(n,p),其均值为________,方差为________。答案:np,np(1–p)44.若χ²=12.83,df=5,则右侧尾概率p值范围约为________(保留两位小数)。答案:0.025<p<0.0545.在Cox模型中,风险函数h(t|x)=________。答案:h₀(t)exp(βx)46.若随机变量T服从Weibull分布,则其风险函数随时间________(递增/递减/恒定)取决于形状参数________。答案:递增或递减,k47.当样本量n=25,样本标准差s=6,则总体方差σ²的95%置信区间为________(用χ²分位数表示)。答案:((n–1)s²/χ²₀.₀₂₅,(n–1)s²/χ²₀.₉₇₅)=(900/39.364,900/12.401)48.在随机区组设计中,总平方和SST可分解为________、________和________三部分。答案:SS处理,SS区组,SS误差49.若logistic模型中x的系数β=–0.2,则x每增加1单位,优势比OR=________。答案:exp(–0.2)=0.818750.对高通量数据,FDR定义为________。答案:错误拒绝的原假设数占所有拒绝数的期望比例五、简答题(每题8分,共40分)51.简述假设检验中p值的定义及其常见误解,并给出正确解释。答案:p值是在原假设H₀为真的前提下,获得当前样本或更极端样本结果的概率。常见误解:①p值是H₀为真的概率;②p值小说明效应大;③p<0.05即结果重要。正确解释:p值仅反映数据与H₀的相容程度,不能给出H₀概率,也不代表效应大小或科学重要性,需结合置信区间、效应量及领域知识综合判断。52.说明多重线性回归中诊断多重共线性的步骤及补救措施。答案:步骤:①计算方差膨胀因子VIF,若VIF>10或平均VIF远大于1提示共线;②检查容忍度,若<0.1需警惕;③观察特征值与条件数,条件数>30表明严重共线;④检查相关系数矩阵,若|r|>0.9。补救:①删除或合并高度相关变量;②采用主成分回归或偏最小二乘;③岭回归或Lasso回归;④增大样本量;⑤对变量进行中心标准化。53.比较随机区组设计与完全随机设计的优缺点。答案:随机区组优点:①控制已知干扰因素,降低误差方差,提高检验效能;②所需样本量较少;②可分析区组效应。缺点:①区组若选择不当,自由度损失;②缺失数据处理复杂;③区组与处理交互难以解释。完全随机优点:①设计简单,易于实施;②缺失数据影响小;③自由度最大。缺点:①未能控制干扰,误差大;②需更大样本;③灵敏度低。54.阐述Cox比例风险模型的基本假设及检验方法。答案:基本假设:①比例风险(PH)假设:各协变量风险比随时间恒定;②对数风险与协变量呈线性关系;③独立删失。检验方法:①绘制ln(–lnS(t))对时间曲线,若曲线平行则PH成立;②纳入协变量与时间交互项,若交互项显著则PH不成立;③Schoenfeld残差法,若残差与时间相关系数显著则PHviolated;④采用分段指数模型或分层Cox处理非PH。55.说明Benjamini–Hochberg法控制FDR的步骤并给出示例。答案:步骤:①将m个p值从小到大排序p₁≤p₂≤…≤pₘ;②对第i个检验,计算临界值αi/m;③找到最大的k使得pₖ≤αk/m;④拒绝所有H₁…Hk。示例:设m=10,α=0.05,p值为0.008,0.011,0.022,0.035,0.04,0.06,0.08,0.12,0.15,0.20。计算得k=5,前5个p值小于0.05i/10,故拒绝前5个假设,FDR控制在5%。六、综合计算题(共40分)56.(12分)为研究某药物对小鼠血糖的影响,随机分为两组,每组12只。实验组均值=7.2mmol/L,标准差s₁=1.1;对照组均值=8.5mmol/L,s₂=1.3。假定方差齐性,试在α=0.05下检验药物是否显著降低血糖,并给出差值的95%置信区间。答案:H₀:μ₁=μ₂,H₁:μ₁<μ₂(单侧)。合并方差sp²=[(11×1.1²+11×1.3²)/22]=1.45,sp=1.204。t=(7.2–8.5)/(1.204×√(2/12))=–2.65,|t|=2.65。临界值t₀.₀₅,22=–1.717,2.65>1.717,拒绝H₀,药物显著降低血糖。差值置信区间:(7.2–8.5)±t₀.₀₂₅,22×1.204×√(2/12)=–1.3±2.074×0.491=(–2.32,–0.28)mmol/L。57.(14分)为研究基因型与疾病关联,得到如下四格表:   患病 对照AA  18  32Aa  22  28aa  10  40试进行χ²检验并计算OR及其95%置信区间,判断基因型是否与疾病相关。答案:H₀:基因型与疾病无关。理论频数T均>5,可用χ²。χ²=Σ(O–T)²/T=8.96,df=2,p=0.011<0.05,拒绝H₀,有关联。以aa为参照,合并AA/Aa为暴露:暴露组:患病40,对照60;非暴露:患病10,对照40。OR=(40×40)/(60×10)=2.67。lnOR=0.982,SE=√(1/40+1/60+1/10+1/40)=0.456。95%CI:exp(0.982±1.96×0.456)=(1.09,6.53)。提示暴露基因型增加患病风险。58.(14分)某实验室记录细胞存活时间(天):3,5,6+,8,10+,12,15,18+,22,30+,其中“+”为右删失。试用Kaplan–Meier法估计生存函数,并计算中位生存时间及其标准误。答案:时间排序:3,5,6+,8,10+,12,15,18+,22,30+风险数ni:10,9,8,7,6,5,4,3,2,1死亡数di:1,1,0,1,0,1,1,0,1,0生存函数S(t):S(3)=0.90,S(5)=0.80,S(8)=0.686,S(12)=0.549,S(15)=0.411,S(22)=0.206中位生存时间:S(t)=0.5介于12与15之间,线性插值:t=12+3×(0.549–0.5)/(0.549–0.411)=13.1天Greenwood标准误:SE²(13.1)=0.549²×[1/(10×9)+1/(7×6)+1/(5×4)]=0.030,SE=0.173中位生存时间=13.1±0.17天(SE)。七、软件应用与结果解读(共20分)59.(10分)R输出如下单因素方差分析结果:  Df SumSq MeanSq Fvalue Pr(>F)group  2  126.3  63.15  9.87  0.000285Residuals27 172.8  6.4请写出完整的结论,并说明下一步多重比较应选择何种方法。答案:F=9.87,p=0.000285<0.05,表明三组间总体均值差异显著。下一步采用TukeyHSD法进行多重比较,控制族错误率,输出各组均值差及置信区间,确定具体差异组别。60.(10分)对某RNAseq数据使用DESeq2得到基因A的baseMean=345,log2FoldChange=–0.82,lfcSE=0.15,stat=–5.47,pvalue=4.3e–8,padj=2.1e–6。请解释各指标含义并判断基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论