




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年生物统计学考试题及答案详解一、单项选择题(每题2分,共20分)1.以下关于参数检验与非参数检验的描述,正确的是()A.参数检验要求数据服从特定分布,非参数检验无需分布假设B.非参数检验的效能一定高于参数检验C.参数检验只能用于定量资料,非参数检验只能用于定性资料D.两独立样本比较时,若数据不满足正态性,应选择配对t检验2.假设检验中,若检验水准α=0.05,当实际H₀为真时拒绝H₀,此为()A.I型错误B.II型错误C.正确决策D.检验效能不足3.以下统计量中,属于参数的是()A.样本均数B.总体标准差C.样本中位数D.样本率4.若X~N(μ,σ²),则X的95%参考值范围为()A.μ±1.96σB.μ±1.96SC.±1.96σD.±1.96S(为样本均数)5.检验效能(Power)是指()A.拒绝H₀时H₀为假的概率B.不拒绝H₀时H₀为真的概率C.拒绝H₀时H₀为真的概率D.不拒绝H₀时H₀为假的概率6.四格表卡方检验中,若有1个理论频数T满足1≤T<5且n≥40,应采用()A.普通卡方检验B.连续性校正卡方检验C.Fisher确切概率法D.秩和检验7.某研究拟调查某地区糖尿病患病率,采用按城乡分层后分别随机抽样,这种抽样方法属于()A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样8.队列研究中,年龄可能成为混杂因素的条件是()A.年龄与暴露因素相关,但与结局无关B.年龄与结局相关,但与暴露因素无关C.年龄与暴露因素和结局均相关,且不是暴露-结局的中间变量D.年龄是暴露因素导致结局的中间变量9.似然函数L(θ|X)表示()A.在参数θ下观测到样本X的概率(密度)B.在样本X下参数θ的后验概率C.样本X的联合分布函数D.参数θ的先验分布10.生存分析中,终点事件(Event)是指()A.研究对象失访B.研究对象退出研究C.研究关注的结局发生(如死亡、疾病复发)D.研究结束时未观察到结局二、简答题(每题6分,共30分)1.简述检验效能(Power)的定义及其主要影响因素。2.配对t检验与两独立样本t检验的适用条件有何不同?请举例说明。3.Logistic回归模型中,OR值(优势比)的统计学意义是什么?如何通过回归系数计算OR值?4.卡方拟合优度检验与卡方独立性检验的区别是什么?各举一例说明其应用场景。5.Cox比例风险模型的基本假设是什么?如何验证该假设是否成立?三、计算题(每题10分,共40分)1.某研究测量了20名健康成年男性的血清总胆固醇(mmol/L),数据如下:4.2,4.5,4.8,5.1,5.3,4.7,4.9,5.0,4.6,5.2,4.4,4.3,5.4,5.5,4.1,4.0,5.6,5.7,4.9,5.0。(1)计算该样本的均数、中位数、标准差;(2)已知健康成年男性血清总胆固醇的总体均数为4.8mmol/L,试检验该样本是否来自总体均数为4.8的总体(α=0.05)。2.某临床试验比较两种降压药(A药vsB药)的疗效,将60例高血压患者随机分为两组,每组30例,治疗4周后血压达标(收缩压<140mmHg)的人数如下:A药组22例达标,8例未达标;B药组15例达标,15例未达标。(1)构建四格表;(2)采用卡方检验比较两组达标率是否有差异(α=0.05),并写出结论。3.某研究探讨体重指数(BMI,X,kg/m²)与空腹血糖(Y,mmol/L)的关系,收集了10名受试者的数据,计算得:∑X=220,∑Y=50,∑XY=1150,∑X²=5000,∑Y²=260,n=10。(1)计算BMI与空腹血糖的相关系数;(2)拟合线性回归方程,并解释回归系数的意义;(3)计算决定系数R²,并说明其含义。4.某肿瘤研究随访了12例患者的生存时间(月),其中8例观察到死亡(事件),4例失访(截尾),数据如下(+表示截尾):3,5,7+,9,12+,15,18,20+,22,25,28+,30。(1)用Kaplan-Meier法计算各时间点的生存率;(2)若另一组患者的生存数据经Log-rank检验得χ²=4.2,自由度=1,试判断两组生存时间是否有差异(α=0.05)。四、应用题(10分)某研究拟开展一项随机对照试验(RCT),比较新型靶向药物(试验组)与标准治疗(对照组)对晚期肺癌患者无进展生存期(PFS)的影响。请设计该研究的统计分析方案,需包括以下内容:(1)主要终点指标及类型;(2)样本量计算需考虑的主要参数;(3)组间基线均衡性的检验方法;(4)疗效评价的主要统计方法(需说明适用条件)。答案详解一、单项选择题1.A(参数检验依赖分布假设,非参数检验对分布要求低)2.A(I型错误即“弃真”)3.B(参数是总体的特征值,如总体标准差)4.A(参考值范围基于总体参数μ和σ)5.A(检验效能=1-β,即H₀为假时正确拒绝的概率)6.B(理论频数1≤T<5且n≥40时用连续性校正)7.C(分层后分别抽样为分层抽样)8.C(混杂因素需与暴露和结局均相关,且非中间变量)9.A(似然函数是给定参数下样本的概率密度)10.C(终点事件是研究关注的结局发生)二、简答题1.检验效能(Power)是指当备择假设H₁为真时,正确拒绝原假设H₀的概率,即1-β(β为II型错误概率)。主要影响因素包括:(1)总体间差异(效应量):差异越大,Power越高;(2)样本量n:n越大,Power越高;(3)检验水准α:α越大(如0.05vs0.01),Power越高;(4)数据变异度(标准差σ):σ越小,Power越高。2.配对t检验适用于配对设计数据,即同一受试对象前后测量(如治疗前后)、同一样品分成两份接受不同处理,或配对的两个受试对象(如双胞胎)。其核心是比较配对差值的均数是否为0,要求差值服从正态分布。例如:比较20名患者治疗前后的血糖值。两独立样本t检验适用于完全随机设计的两组独立样本,比较两组总体均数是否相等,要求两组数据均服从正态分布且方差齐性。例如:比较30名男性与30名女性的血红蛋白均数。3.OR值表示暴露因素(或自变量)每改变一个单位时,结局事件发生的优势(Odds)的倍数。OR=1表示无关联,OR>1表示正关联,OR<1表示负关联。Logistic回归模型为ln(Odds)=β₀+β₁X₁+…+βₖXₖ,其中OR=exp(βᵢ),即自变量Xᵢ每增加1单位,结局发生的优势变为原来的exp(βᵢ)倍。4.卡方拟合优度检验用于检验样本是否服从某一理论分布(如二项分布、正态分布),属于单样本检验;卡方独立性检验用于检验两个分类变量是否独立(如性别与疾病是否相关),属于双变量检验。举例:拟合优度检验:检验某地区新生儿性别比是否符合1:1(理论分布为二项分布,π=0.5);独立性检验:检验吸烟(是/否)与肺癌(有/无)是否相关。5.Cox比例风险模型的基本假设是比例风险假设(PH假设),即不同协变量水平下的风险比(HR)不随时间变化。验证方法:(1)图形法:绘制各亚组的对数负对数生存率曲线(log-log生存曲线),若曲线平行则满足PH假设;(2)统计检验法:将时间与协变量的交互项纳入模型,若交互项无统计学意义(p>0.05),则满足PH假设;(3)分层Cox模型:若PH假设不满足,可按协变量分层分析。三、计算题1.(1)计算均数、中位数、标准差:数据排序:4.0,4.1,4.2,4.3,4.4,4.5,4.6,4.7,4.8,4.9,4.9,5.0,5.0,5.1,5.2,5.3,5.4,5.5,5.6,5.7(n=20)均数=(4.0+4.1+…+5.7)/20=98.8/20=4.94mmol/L中位数=第10和11个数的平均值=(4.9+4.9)/2=4.9mmol/L标准差S=√[∑(Xᵢ-)²/(n-1)],计算得∑(Xᵢ-)²=(4.0-4.94)²+…+(5.7-4.94)²=6.328,故S=√(6.328/19)≈0.58mmol/L(2)单样本t检验:H₀:μ=4.8,H₁:μ≠4.8(双侧α=0.05)t=(-μ)/(S/√n)=(4.94-4.8)/(0.58/√20)=0.14/(0.129)=1.085自由度ν=20-1=19,查t界值表得t₀.05/2,19=2.093,|t|=1.085<2.093,p>0.05,不拒绝H₀,认为该样本来自总体均数为4.8的总体。2.(1)四格表:|分组|达标|未达标|合计||--||--|||A药组|22|8|30||B药组|15|15|30||合计|37|23|60|(2)卡方检验:理论频数Tᵢⱼ=(行合计×列合计)/总例数,如T₁₁=(30×37)/60=18.5,T₁₂=30-18.5=11.5,T₂₁=37-18.5=18.5,T₂₂=23-11.5=11.5。所有T≥5,n=60≥40,用普通卡方公式:χ²=∑(A-T)²/T=(22-18.5)²/18.5+(8-11.5)²/11.5+(15-18.5)²/18.5+(15-11.5)²/11.5=(12.25/18.5)+(12.25/11.5)+(12.25/18.5)+(12.25/11.5)=0.662+1.065+0.662+1.065≈3.454自由度ν=(2-1)(2-1)=1,查χ²界值表得χ²₀.05,1=3.841,χ²=3.454<3.841,p>0.05,不拒绝H₀,认为两组达标率无统计学差异。3.(1)相关系数r:SSₓₓ=∑X²-(∑X)²/n=5000-(220)²/10=5000-4840=160SSᵧᵧ=∑Y²-(∑Y)²/n=260-(50)²/10=260-250=10SSₓᵧ=∑XY-(∑X)(∑Y)/n=1150-(220×50)/10=1150-1100=50r=SSₓᵧ/√(SSₓₓ×SSᵧᵧ)=50/√(160×10)=50/√1600=50/40=1.25(错误!相关系数范围应为[-1,1],此处计算错误,正确应为:实际数据可能调整为∑XY=1100,则SSₓᵧ=1100-1100=0,r=0;或假设题目数据正确,可能存在笔误,假设∑XY=1050,则SSₓᵧ=1050-1100=-50,r=-50/40=-1.25,仍不合理。故修正题目数据为∑X=220,∑Y=50,∑XY=1120,则SSₓᵧ=1120-1100=20,r=20/√(160×10)=20/40=0.5。)(假设修正后数据合理,继续计算)(2)回归方程:b=SSₓᵧ/SSₓₓ=20/160=0.125,=∑X/n=22,=∑Y/n=5,a=-b=5-0.125×22=5-2.75=2.25,故回归方程为Y=2.25+0.125X。回归系数b=0.125表示BMI每增加1kg/m²,空腹血糖平均增加0.125mmol/L。(3)决定系数R²=r²=0.5²=0.25,说明空腹血糖变异的25%可由BMI的变异解释。4.(1)Kaplan-Meier生存率计算:按时间排序(去除截尾后事件时间):3,5,9,15,18,22,25,30(截尾时间7+,12+,20+,28+不影响事件顺序)。各时间点(t)的风险集(Nₜ)、事件数(dₜ)、生存率(S(t))计算如下:-t=3:N₁=12,d₁=1,S(3)=1-1/12≈0.9167-t=5:N₂=11(7+在t=5时仍在风险集),d₂=1,S(5)=0.9167×(1-1/11)≈0.9167×0.9091≈0.8333-t=9:N₃=10(12+在t=9时仍在风险集),d₃=1,S(9)=0.8333×(1-1/10)=0.8333×0.9=0.75-t=15:N₄=9(20+在t=15时仍在风险集),d₄=1,S(15)=0.75×(1-1/9)≈0.75×0.8889≈0.6667-t=18:N₅=8,d₅=1,S(18)=0.6667×(1-1/8)=0.6667×0.875≈0.5833-t=22:N₆=7(28+在t=22时仍在风险集),d₆=1,S(22)=0.5833×(1-1/7)≈0.5833×0.8571≈0.5-t=25:N₇=6,d₇=1,S(25)=0.5×(1-1/6)≈0.5×0.8333≈0.4167-t=30:N₈=5,d₈=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于J2EE架构的商业银行小微信贷管理系统:设计、实现与效能探究
- 钢结构测量及定位技术方案
- 制造企业能源节约技术方案
- 餐饮消费趋势分析报告
- 软件测试风险管理规定
- 电子商务平台交易规则制定
- 规范化设计规程
- 黑猫警长的侦探故事制度
- 维修工程监控方案
- 规范学术报告的要求
- 合肥市社会化工会工作者招聘考试真题2024
- 恐龙妈妈藏蛋课件
- 演讲与朗诵教学课件
- 《CSCO乳腺癌诊疗指南2025》更新要点解读
- 2025年教师师德师风考试题(附答案)
- 贵妃生态农业有限公司企业策划书
- 学堂在线 战场侦察监视技术与装备 章节测试答案
- 智慧产业园区AI大模型数字化平台建设方案
- 全球变暖与地缘冲突-洞察及研究
- 土壤隐患排查培训
- 垃圾分类可回收管理制度
评论
0/150
提交评论