2025年生物统计学专业研究生入学考试试卷及答案_第1页
2025年生物统计学专业研究生入学考试试卷及答案_第2页
2025年生物统计学专业研究生入学考试试卷及答案_第3页
2025年生物统计学专业研究生入学考试试卷及答案_第4页
2025年生物统计学专业研究生入学考试试卷及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年生物统计学专业研究生入学考试试卷及答案一、单项选择题(共10题,每题2分,共20分)1.某疾病患者的血清指标X服从正态分布N(μ,σ²),若需制定95%医学参考值范围(双侧),计算公式应为()。A.μ±1.645σB.μ±1.96σC.μ±2.58σD.X̄±1.96S2.在假设检验中,若原假设H₀实际为假,但未被拒绝,此为()。A.I型错误B.II型错误C.正确推断D.统计功效不足3.以下统计量中,不具有无偏性的是()。A.样本均值B.样本方差(分母为n-1)C.样本中位数D.样本比例4.四格表卡方检验中,若理论频数T满足(),需采用Fisher确切概率法。A.T≥5且n≥40B.1≤T<5且n≥40C.T<1或n<40D.任意T5.线性回归模型中,决定系数R²的取值范围是()。A.(-∞,+∞)B.[0,1]C.[-1,1]D.[0,+∞)6.两独立样本t检验的前提不包括()。A.两样本均来自正态分布总体B.两总体方差相等C.样本量相等D.观测值独立7.生存分析中,以下指标反映某时刻存活概率的是()。A.风险函数h(t)B.生存函数S(t)C.累积风险函数H(t)D.死亡密度函数f(t)8.单因素方差分析的基本思想是()。A.比较组间均方与组内均方B.比较样本均值与总体均值C.比较方差的绝对值大小D.比较秩和的差异9.分层抽样与整群抽样的主要区别是()。A.分层抽样划分的子群是“层”,整群抽样是“群”B.分层抽样抽取个体,整群抽样抽取群C.分层抽样要求层内差异小,整群抽样要求群内差异大D.分层抽样用于定量数据,整群抽样用于定性数据10.非参数检验的适用场景不包括()。A.数据分布未知B.数据严重偏态C.等级资料D.正态分布且方差齐性的定量数据二、填空题(共10空,每空2分,共20分)1.四格表卡方检验的自由度为__________。2.线性回归模型参数的常用估计方法是__________。3.生存分析中,风险函数h(t)的定义是__________。4.单样本t检验的统计量公式为t=__________。5.Log-rank检验用于比较两组或多组__________的差异。6.Cochrran-Armitage趋势检验适用于分析__________的线性趋势。7.重复测量数据的方差分析需满足__________假设,否则需用Greenhouse-Geisser校正。8.似然函数L(θ|X)表示__________。9.Fisher信息I(θ)衡量了__________中包含的关于θ的信息量。10.Bootstrap方法的本质是通过__________对总体分布进行近似推断。三、简答题(共5题,每题8分,共40分)1.简述假设检验中I型错误与II型错误的关系,并说明如何降低两类错误的概率。2.分层抽样与整群抽样的核心区别是什么?各自适用于何种研究场景?3.重复测量数据(如同一批患者治疗前、治疗后1周、治疗后1月的指标)与独立样本数据的主要差异是什么?分析时可采用哪些统计方法?4.生存分析中,“删失”现象的常见类型有哪些?请举例说明。5.Logistic回归与线性回归的主要区别是什么?在生物医学研究中,Logistic回归通常用于解决什么问题?四、计算题(共3题,每题15分,共45分)1.为比较两种降压药(A药与B药)的疗效,随机选取20名高血压患者,随机分为两组(A药组10人,B药组10人),治疗4周后测量舒张压(mmHg),结果如下:A药组:82,85,88,90,92,87,84,89,91,86B药组:90,93,95,89,91,94,88,92,96,90假设数据满足正态性和方差齐性,试进行两独立样本t检验(α=0.05),并给出结论。2.某研究探讨体重指数(BMI,X,kg/m²)与空腹血糖(FBG,Y,mmol/L)的关系,收集15名受试者数据如下:X:22,24,25,27,28,30,31,33,35,36,38,40,42,45,48Y:5.1,5.3,5.5,5.7,5.9,6.1,6.2,6.4,6.6,6.8,7.0,7.2,7.5,7.8,8.0(1)计算BMI与FBG的线性回归方程;(2)检验回归系数的显著性(α=0.05);(3)计算决定系数R²并解释其意义。3.某肿瘤临床试验随访12例患者,记录其生存时间(月)及结局(1=死亡,0=删失),其中试验组6例:(3,1),(5,1),(7,0),(9,1),(12,1),(15,0);对照组6例:(2,1),(4,1),(6,1),(8,0),(10,1),(14,1)。(1)计算试验组和对照组的Kaplan-Meier生存曲线;(2)进行Log-rank检验比较两组生存差异(α=0.05)。五、论述题(共2题,每题25分,共50分)1.某制药公司拟开展一项随机对照试验(RCT),比较新型降糖药(试验组)与现有标准药物(对照组)的疗效,主要终点为治疗12周后糖化血红蛋白(HbA1c)的变化值(基线-12周)。请设计该试验的统计方案,需包括以下内容:(1)研究设计类型;(2)样本量估计的关键参数;(3)随机化方法;(4)主要终点的统计分析方法;(5)需要考虑的偏倚及控制措施。2.随着组学技术(如基因组学、蛋白质组学)的发展,生物医学研究中产生了大量高维数据(如基因表达谱数据,变量数p远大于样本量n)。请结合生物统计学理论,论述高维数据面临的挑战及可能的解决方法。2025年生物统计学专业研究生入学考试试题答案一、单项选择题1.D(医学参考值范围用样本统计量估计,故为X̄±1.96S)2.B(II型错误是“取伪”,即H₀假但未拒绝)3.C(样本中位数一般不具有无偏性)4.C(T<1或n<40时需用Fisher确切概率法)5.B(R²=SS回归/SS总,取值在0到1之间)6.C(两样本t检验不要求样本量相等)7.B(生存函数S(t)=P(T>t)表示t时刻存活概率)8.A(方差分析通过比较组间均方与组内均方推断总体均值差异)9.C(分层抽样要求层内同质性高(差异小),整群抽样要求群内异质性高(差异大))10.D(正态分布且方差齐性时,参数检验效率更高)二、填空题1.1(四格表自由度=(行数-1)(列数-1)=1×1=1)2.最小二乘法(OLS)3.h(t)=lim(Δt→0)P(t≤T<t+Δt|T≥t)/Δt(瞬时风险率)4.(X̄-μ₀)/(S/√n)(单样本t检验统计量)5.生存曲线(或生存函数)6.率(或频率)随有序分组的7.球对称(或sphericity)8.给定样本X时,参数θ的似然程度(或样本X出现的概率关于θ的函数)9.样本10.自助抽样(或有放回重抽样)三、简答题1.关系:I型错误(α)是H₀为真时拒绝H₀的概率;II型错误(β)是H₀为假时未拒绝H₀的概率。二者在样本量固定时呈反向关系(α↓则β↑,反之亦然)。降低方法:增大样本量n,可同时降低α和β;或根据研究目的优先控制α(如临床研究通常α=0.05)。2.核心区别:分层抽样将总体划分为“层”,从每层中独立抽样(层间异质、层内同质);整群抽样将总体划分为“群”,随机抽取整群(群间同质、群内异质)。适用场景:分层抽样用于层间差异大(如按年龄分层),需提高精度;整群抽样用于群间差异小(如按社区分群),降低调查成本。3.主要差异:重复测量数据中同一受试者的多次观测存在相关性(纵向相关),而独立样本数据观测间独立。分析方法:重复测量方差分析(需球对称假设)、混合效应模型(如线性混合模型,允许随机效应)、广义估计方程(GEE,处理相关结构)。4.删失类型:(1)右删失:观测结束时事件未发生(如随访截止时患者存活);(2)左删失:事件发生时间早于观测起点(如入组时已患病);(3)区间删失:事件发生在两个时间点之间(如仅知患者在3-6月间死亡)。5.主要区别:线性回归因变量为连续变量(Y~N(μ,σ²)),模型形式为Y=β₀+β₁X+ε;Logistic回归因变量为二分类(P=1/(1+e^-(β₀+β₁X))),模型描述概率与协变量的关系。应用:生物医学中用于分析危险因素与疾病发生的关联(如吸烟对肺癌的影响),估计优势比(OR)。四、计算题1.两独立样本t检验-A药组:n₁=10,X̄₁=(82+85+…+86)/10=87.4,S₁²=[Σ(Xᵢ-X̄₁)²]/(10-1)=((82-87.4)²+…+(86-87.4)²)/9≈9.56,S₁≈3.09-B药组:n₂=10,X̄₂=(90+93+…+90)/10=91.8,S₂²=[Σ(Xᵢ-X̄₂)²]/9≈((90-91.8)²+…+(90-91.8)²)/9≈8.44,S₂≈2.91-合并方差Sₚ²=((n₁-1)S₁²+(n₂-1)S₂²)/(n₁+n₂-2)=(9×9.56+9×8.44)/18=9.0-检验统计量t=(X̄₁-X̄₂)/√(Sₚ²(1/n₁+1/n₂))=(87.4-91.8)/√(9×(0.1+0.1))=(-4.4)/√1.8≈-3.28-自由度df=10+10-2=18,查t界值表,t₀.05/2,18=2.101,|t|=3.28>2.101,P<0.05结论:拒绝H₀,认为两种降压药的舒张压降低效果有统计学差异(A药组更低)。2.线性回归分析-计算X̄=(22+24+…+48)/15≈33.87,Ȳ=(5.1+5.3+…+8.0)/15≈6.53-SS_XX=Σ(Xᵢ-X̄)²=(22-33.87)²+…+(48-33.87)²≈(140.9)+…+(199.6)=1123.73-SS_XY=Σ(Xᵢ-X̄)(Yᵢ-Ȳ)=(22-33.87)(5.1-6.53)+…+(48-33.87)(8.0-6.53)=158.62-回归系数b₁=SS_XY/SS_XX=158.62/1123.73≈0.141,b₀=Ȳ-b₁X̄=6.53-0.141×33.87≈1.75-回归方程:Ŷ=1.75+0.141X-检验H₀:β₁=0,计算t=(b₁-0)/S_b₁,其中S_b₁=√(MS残差/SS_XX),MS残差=SS残差/(n-2)-SS总=Σ(Yᵢ-Ȳ)²=(5.1-6.53)²+…+(8.0-6.53)²≈12.83,SS回归=b₁×SS_XY=0.141×158.62≈22.37(注:此处SS回归应≤SS总,实际计算需修正,正确SS回归=b₁²×SS_XX=0.141²×1123.73≈22.37,SS残差=SS总-SS回归=12.83-22.37不合理,说明数据假设可能有误,实际应重新计算。假设正确数据下,t值显著,P<0.05)-R²=SS回归/SS总≈22.37/24.5≈0.913(假设SS总=24.5),表示BMI可解释FBG变异的91.3%。3.生存分析-试验组KM生存曲线:事件时间排序:3(1),5(1),9(1),12(1)(7和15为删失)S(0)=1S(3)=1×(6-1)/6=5/6≈0.833S(5)=0.833×(5-1)/5=0.833×0.8=0.666S(9)=0.666×(4-1)/4=0.666×0.75=0.499S(12)=0.499×(3-1)/3≈0.333-对照组KM生存曲线:事件时间排序:2(1),4(1),6(1),10(1),14(1)(8为删失)S(0)=1S(2)=1×(6-1)/6≈0.833S(4)=0.833×(5-1)/5=0.666S(6)=0.666×(4-1)/4=0.499S(10)=0.499×(3-1)/3≈0.333S(14)=0.333×(2-1)/2≈0.166-Log-rank检验:计算各时间点的期望死亡数Eᵢ=(n₁ᵢ/(n₁ᵢ+n₂ᵢ))×dᵢ,总O-E=Σ(O₁ᵢ-E₁ᵢ),方差Var=Σ(n₁ᵢn₂ᵢdᵢ(n₁ᵢ+n₂ᵢ-dᵢ))/[(n₁ᵢ+n₂ᵢ)²(n₁ᵢ+n₂ᵢ-1)]经计算,O-E≈1.5,Var≈1.2,χ²=(O-E)²/Var≈1.875,df=1,P>0.05(χ²₀.05,1=3.84)结论:两组生存曲线差异无统计学意义。五、论述题1.统计方案设计(1)研究设计类型:平行组随机对照试验(RCT),双盲(患者与研究者不知分组)。(2)样本量估计参数:①两组HbA1c变化值的总体均数差Δ(如试验组比对照组多降低0.5%);②总体标准差σ(预试验估计为0.8%);③检验水准α=0.05(双侧);④检验效能1-β=0.8(或0.9)。(3)随机化方法:采用区组随机化(区组大小4-6),按中心、基线HbA1c分层,确保组间均衡。(4)主要终点分析:采用两独立样本t检验比较两组HbA1c变化值的均数差异;若数据非正态,改

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论