版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年生物统计学专业研究生入学考试试卷及答案一、单项选择题(每题2分,共30分)1.在完全随机设计(CRD)的方差分析中,若处理数为k,重复数为n,则误差自由度为A.k−1 B.nk−1 C.n(k−1) D.k(n−1) E.nk−k答案:D2.对同一批小鼠先后给予低、中、高三种剂量,记录血糖值。若欲检验剂量效应,首选的统计模型为A.单因素ANOVA B.随机区组ANOVA C.重复测量ANOVA D.协方差分析 E.KruskalWallis检验答案:C3.设X~Poisson(λ),Y~Poisson(μ)且独立,则P(X=Y)等于A.e^{−λ−μ}∑_{k=0}^{∞}(λμ)^k/(k!)^2 B.e^{−λ−μ}∑_{k=0}^{∞}(λ+μ)^k/k! C.e^{−λ}λ^μ/μ! D.e^{−μ}μ^λ/λ! E.0答案:A4.在logistic回归中,若某连续自变量x的系数β=0.8,则x每增加1个单位,优势比OR为A.0.8 B.1.8 C.e^{0.8}≈2.23 D.ln0.8≈−0.22 E.无法计算答案:C5.下列关于多重比较校正的说法正确的是A.Bonferroni法比Holm法更容易拒绝原假设 B.FDR控制比族错误率控制更严格 C.TukeyHSD适用于所有两两比较且平衡设计 D.Scheffé法仅适用于事前比较 E.Dunnett法适用于与对照组的多重比较答案:E6.若随机变量T服从自由度为ν的t分布,则E(T²)等于A.0 B.1 C.ν/(ν−2)(ν>2) D.ν/(ν+2) E.不存在答案:C7.在生存分析中,若采用Cox比例风险模型,下列哪项不是比例风险假定的检验方法A.Schoenfeld残差图 B.时依协变量法 C.log−log生存曲线交叉法 D.KaplanMeier曲线法 E.加权残差scoreprocess答案:D8.对2×2列联表进行Fisher精确检验,其p值计算基于A.正态近似 B.t分布 C.超几何分布 D.二项分布 E.Poisson分布答案:C9.若线性回归模型存在异方差,下列方法中最直接修正标准误的是A.加权最小二乘 B.BoxCox变换 C.岭回归 D.主成分回归 E.增加二次项答案:A10.在随机效应meta分析中,τ²表示A.研究内方差 B.研究间方差 C.总方差 D.固定效应大小 E.合并标准误答案:B11.若X~N(0,1),Y~N(0,1)且独立,则Z=X/Y服从A.正态 B.t(1) C.χ²(1) D.F(1,1) E.Cauchy答案:E12.对高维数据p≫n,下列方法不能用于变量选择的是A.LASSO B.ElasticNet C.SCAD D.逐步回归 E.PCA答案:E13.在生物等效性试验中,平均生物等效性的置信区间通常为A.80%–120% B.80%–125% C.90%–110% D.95%–105% E.85%–115%答案:B14.若某基因表达量服从对数正态分布,则其几何均值的置信区间宜采用A.原始尺度t区间 B.对数尺度t区间后指数化 C.Wilcoxon区间 D.Bootstrap百分位区间 E.正态近似区间答案:B15.在群体药动学(NONMEM)中,εshrinkage主要影响A.固定效应估计 B.个体间变异估计 C.残差变异诊断 D.协变量筛选 E.收敛速度答案:C二、多项选择题(每题3分,共15分;每题至少2个正确答案,多选少选均不得分)16.下列属于广义线性模型(GLM)必备要素的有A.随机成分 B.系统成分 C.连接函数 D.方差函数 E.惩罚项答案:ABCD17.关于多重共线性,下列说法正确的有A.VIF>10通常认为严重 B.条件指数>30提示共线 C.岭回归可缓解 D.主成分回归可缓解 E.增加样本量可彻底消除答案:ABCD18.在临床试验中期分析中,需考虑A.Ⅰ类错误膨胀 B.效应量漂移 C.样本量重新估算 D.停止边界 E.随机化比例更新答案:ABCD19.下列可用于检验生存数据是否服从指数分布的方法有A.图示法:logTvs累积风险图 B.KolmogorovSmirnov检验 C.AndersonDarling检验 D.Likelihoodratio检验 E.Gray检验答案:ABCD20.在高通量测序差异表达分析中,下列属于归一化方法的有A.TMM B.RPKM C.DESeq2sizefactor D.voom E.FPKM答案:ABCDE三、填空题(每空2分,共20分)21.若X~Bin(n=100,p=0.02),用Poisson近似,则P(X=3)=__________。(保留4位小数)答案:e^{2}·2³/3!≈0.180422.在Cox模型中,若某协变量z满足比例风险假定,其Schoenfeld残差与时间的相关系数ρ应接近__________。答案:023.若随机变量F~F(5,10),则P(F>3.33)=__________。(查表或软件)答案:0.0524.对线性模型Y=Xβ+ε,ε~N(0,σ²I),若X为列满秩,则β的最小二乘估计方差协方差矩阵为__________。答案:σ²(X'X)^{1}25.在群体药动学中,指数随机效应模型的方差表达式为Var(η_i)=__________。答案:Ω26.若某2×2表四格频数分别为a=8,b=12,c=7,d=18,则其优势比OR=__________。答案:(8×18)/(12×7)=216/84≈2.57127.当样本量n→∞时,Wilcoxon秩和统计量Z的渐近分布为__________。答案:N(0,1)28.若某基因表达数据经log2转化后服从N(μ,σ²),则原始尺度几何均值的95%置信区间为__________。答案:exp[ln2·(μ̂±t_{α/2}·σ̂/√n)]29.在随机森林中,用于回归的默认节点分裂准则为__________。答案:均方误差减小量30.若KaplanMeier估计在t=30月时生存人数为25,死亡1人,删失2人,则S(30)=__________。答案:25/26≈0.9615四、简答题(每题8分,共40分)31.简述多重检验中FDR控制与族错误率(FWER)控制的区别,并说明BenjaminiHochberg步骤。答案:FWER控制的是至少一次拒绝真原假设的概率,通常用Bonferroni、Holm等;FDR控制的是被拒绝的原假设中错误拒绝的比例期望。BH步骤:(1)将m个p值升序排列p_{(1)}≤…≤p_{(m)};(2)找到最大的k使p_{(k)}≤k·α/m;(3)拒绝H_{(1)},…,H_{(k)}。32.解释Cox比例风险模型中“比例风险”含义,并给出两种检验该假定的方法。答案:比例风险指不同个体的风险函数之比随时间保持恒定。检验方法:(1)绘制Schoenfeld残差对时间图,若随机波动于0则满足;(2)加入时依协变量z·t,若其系数显著则违背。33.说明广义估计方程(GEE)与广义线性混合模型(GLMM)在纵向数据中的差异。答案:GEE是边际模型,估计总体平均效应,不指定随机效应分布,对缺失数据稳健;GLMM是条件模型,含随机效应,估计个体特定效应,需指定随机效应分布,对缺失数据敏感。34.写出LASSO回归的优化目标函数,并解释其变量选择机制。答案:min_β{‖Y−Xβ‖²+λ‖β‖₁};λ>0时,ℓ₁范数惩罚使部分系数精确压缩至0,实现变量选择。35.在RNAseq差异表达分析中,为何使用负二项分布而非Poisson分布?答案:Poisson假定均值等于方差,但RNAseq数据存在过度离散,即方差>均值;负二项分布引入离散参数处理过度离散,提高检验效能与可靠性。五、计算与综合题(共45分)36.(10分)某实验室测得10只大鼠给予新药后血药浓度(μg/L)如下:52,48,61,55,49,63,58,54,60,57(1)计算均值、标准差及标准误;(2)求总体均值的95%置信区间;(3)若历史对照均值为50μg/L,检验新药是否显著提高浓度(α=0.05)。答案:(1)x̄=55.7,s=4.875,SE=s/√10=1.542(2)t_{0.025,9}=2.262,CI=55.7±2.262×1.542=[52.21,59.19](3)H₀:μ=50,t=(55.7−50)/1.542=3.70>2.262,拒绝H₀,显著提高。37.(12分)一项生存研究随访12例患者,月数如下(+表示删失):3,5,6+,8,9+,11,14,15+,18,22+,26,30+(1)用KaplanMeier法估计S(t);(2)计算中位生存时间;(3)给出S(20)的Greenwood标准误。答案:(1)时间排序:3,5,6+,8,9+,11,14,15+,18,22+,26,30+S(3)=11/12=0.9167;S(5)=10/12×11/10=0.8333;S(8)=9/11×0.8333=0.6818;S(11)=8/10×0.6818=0.5455;S(14)=7/9×0.5455=0.4242;S(18)=6/8×0.4242=0.3182;S(26)=5/7×0.3182=0.2273(2)中位:S(t)=0.5介于0.5455与0.4242,线性插值:t≈11+(14−11)×(0.5455−0.5)/(0.5455−0.4242)=12.1月(3)Greenwood:Var[S(20)]≈S²∑d_i/[n_i(n_i−d_i)]=0.3182²×(1/12×11+1/12×10+1/11×9+1/9×8+1/8×7)=0.0103,SE=0.10138.(13分)为研究基因X表达与肿瘤分期关系,测得60例患者数据:分期I:表达量(相对单位)均值=0.8,s=0.15,n=20分期II:均值=1.1,s=0.20,n=25分期III:均值=1.4,s=0.25,n=15(1)进行单因素ANOVA,计算组间与组内平方和;(2)列出ANOVA表,检验表达差异(α=0.05);(3)若显著,用TukeyHSD进行两两比较,指出哪些组差异显著。答案:(1)总均值=(20×0.8+25×1.1+15×1.4)/60=1.108SSB=20(0.8−1.108)²+25(1.1−1.108)²+15(1.4−1.108)²=3.633SSW=19×0.15²+24×0.20²+14×0.25²=2.128(2)ANOVA:MSB=3.633/2=1.816,MSW=2.128/57=0.0373,F=48.7>F_{0.05}(2,57)=3.16,p<0.001,拒绝(3)TukeyHSD:q_{0.05,3,57}=3.44,SE=√(0.0373/2×(1/20+1/25))=0.058,临界值=3.44×0.058=0.199IvsII:|0.8−1.1|=0.3>0.199,显著;IvsIII:0.6>0.199,显著;IIvsIII:0.3>0.199,显著。39.(10分)一项病例对照研究调查基因型与疾病关联,结果如下:基因型GG:病例80,对照120基因型GA:病例50,对照90基因型AA:病例20,对照90(1)计算各基因型频率并检验HardyWeinberg平衡(对照组);(2)以加性模型进行趋势检验(CochranArmitage);(3)计算加性模型OR及95%CI。答案:(1)对照总数=300,f_G=(2×120+90)/600=0.55,f_A=0.45;期望AA=300×0.45²=60.75,GA=300×2×0.55×0.45=148.5,GG=90.75χ²=(120−90.75)²/90.75+(90−148.5)²/148.5+(90−60.75)²/60.75=58.2,p<0.001,偏离HWE(2)趋势:得分0,1,2,病例得分均值=(80×0+50×1+20×2)/150=0.6,对照=(120×0+90×1+90×2)/300=0.9Var=(150×300)/(450−1)×[150×(0²×80+1²×50+2²×20)+300×(0²×120+1²×90+2²×90)−(150×0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年国际传统医药国际城市渔业航空合同
- 2026年废疫病疫情波污染易发区保护保险合同中
- 2025年普陀区第二人民医院招聘财务收费岗位合同制员工1名备考题库及参考答案详解一套
- 2025年广州越秀区文联招聘合同制辅助人员备考题库及一套参考答案详解
- 嘉善县招聘协管员面试题及答案
- 劳保协管员面试题及答案解析(2025版)
- 2025国家公务员国家税务总局富顺县税务局面试试题及答案
- 2025年东光辅警招聘真题及答案
- 定西市陇西县招聘城镇公益性岗位工作人员考试真题2024
- 2025 九年级语文下册戏剧人物性格特点分析课件
- 高考复习专题之李白专练
- 对建筑工程施工转包违法分包等违法行为认定查处管理课件
- 中小学生励志主题班会课件《我的未来不是梦》
- 幼儿园户外体育游戏观察记录
- 红色国潮风舌尖上的美食餐饮策划书PPT模板
- 套筒窑工艺技术操作规程
- 某矿区采场浅孔爆破施工设计
- 果蝇遗传学实验
- 普夯施工方案
- 新饲料和新饲料添加剂审定申请表
- 你看起来好像很好吃教案
评论
0/150
提交评论