生物统计考试试卷及答案_第1页
生物统计考试试卷及答案_第2页
生物统计考试试卷及答案_第3页
生物统计考试试卷及答案_第4页
生物统计考试试卷及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计考试及答案一、单项选择题(每题2分,共20分)1.某实验测量10只小鼠的体重(单位:g)为:22.3、24.1、23.5、21.8、25.0、23.7、22.9、24.5、23.2、24.0。该组数据的中位数是()A.23.55B.23.6C.23.7D.23.82.以下关于标准差(SD)和标准误(SE)的描述,错误的是()A.标准差反映数据的离散程度B.标准误反映样本均值的抽样误差C.当样本量增大时,标准差可能减小,标准误一定减小D.标准差的单位与原始数据一致,标准误的单位与均值一致3.若随机变量X服从正态分布N(μ,σ²),则P(μ-1.96σ≤X≤μ+1.96σ)约为()A.90%B.95%C.99%D.99.7%4.两独立样本t检验的应用条件不包括()A.两样本均来自正态分布总体B.两样本方差齐性C.两样本为随机抽样D.两样本量必须相等5.卡方检验中,若理论频数T<5的格子数超过总格子数的20%,合理的处理方法是()A.直接计算卡方值B.合并相邻类别以增大TC.增大显著性水平αD.改用t检验6.单因素方差分析中,组间变异的自由度为()A.k-1(k为组数)B.N-k(N为总样本量)C.N-1D.k7.线性回归分析中,决定系数R²的取值范围是()A.(-∞,+∞)B.[0,1]C.[-1,1]D.[0,+∞)8.某研究比较3种饲料对大鼠体重的影响,每组10只大鼠,若采用单因素方差分析,总自由度为()A.2B.27C.29D.309.对同一组数据进行Spearman秩相关分析和Pearson相关分析,若数据严格服从双变量正态分布,则两种相关系数的关系是()A.完全相等B.Spearman系数更接近1C.Pearson系数更接近1D.无必然联系10.某疾病发病率的95%置信区间为(3.2%,5.8%),其含义是()A.有95%的把握认为总体发病率在此区间内B.总体发病率有95%的概率落在该区间内C.样本发病率有95%的概率等于总体发病率D.该区间包含总体发病率的概率为95%---二、填空题(每空2分,共20分)1.描述一组偏态分布数据的集中趋势,最适合的统计量是__________。2.若随机变量X~Binomial(n=10,p=0.3),则其均值为__________,方差为__________。3.两独立样本t检验中,若方差不齐,可采用__________检验或__________方法处理。4.卡方拟合优度检验用于检验__________与__________是否吻合。5.单因素方差分析的基本思想是将总变异分解为__________和__________,通过比较两者的均方来推断各组总体均值是否有差异。6.线性回归方程ŷ=a+bx中,b表示__________。---三、简答题(每题6分,共30分)1.简述假设检验中Ⅰ型错误和Ⅱ型错误的区别,并说明如何降低两类错误的概率。2.请列举至少3种适用于分析分类变量的统计方法,并说明各自的适用场景。3.解释“中心极限定理”的核心内容及其在生物统计中的意义。4.比较完全随机设计方差分析与随机区组设计方差分析的异同。5.简述绘制散点图在回归分析中的作用。---四、计算题(共30分)1.(8分)某实验室测量15只家兔的血红蛋白含量(g/L)如下:125、132、128、135、129、131、130、127、133、134、126、136、124、137、123。(1)计算该组数据的均值、中位数和标准差;(2)判断数据是否服从正态分布(仅需通过偏度系数初步判断,偏度系数计算公式:g₁=[n/(n-1)(n-2)]×Σ[(xᵢ-x̄)/s]³,n=15时,g₁的标准误约为0.6)。2.(7分)为研究某新药对高血压患者的降压效果,将20名患者随机分为两组,对照组(n₁=10)服用安慰剂,试验组(n₂=10)服用新药。服药4周后,收缩压下降值(mmHg)如下:对照组:5、3、6、2、4、1、5、3、2、4试验组:12、10、8、15、9、11、7、13、14、10假设数据服从正态分布且方差齐性,试检验新药是否有显著降压效果(α=0.05)。3.(7分)某研究调查不同性别(男、女)对某疾病的易感性,结果如下表:|性别|患病|未患病|合计||------|------|--------|------||男|28|72|100||女|15|85|100||合计|43|157|200|试检验性别与疾病易感性是否相关(α=0.05)。4.(8分)某实验研究小鼠年龄(x,周)与体重(y,g)的关系,测得数据如下:x:3、4、5、6、7、8y:18、22、25、28、31、34(1)计算Pearson相关系数;(2)建立线性回归方程;(3)计算决定系数R²并解释其意义。---答案及解析一、单项选择题1.A解析:将数据排序:21.8、22.3、22.9、23.2、23.5、23.7、24.0、24.1、24.5、25.0,第5和第6个数的平均值为(23.5+23.7)/2=23.6?不,原题数据应为10个,正确排序后第5和第6位是23.5和23.7,中位数为(23.5+23.7)/2=23.6?但选项中A是23.55,可能我计算错了。重新核对原始数据:22.3、24.1、23.5、21.8、25.0、23.7、22.9、24.5、23.2、24.0。正确排序应为:21.8、22.3、22.9、23.2、23.5、23.7、24.0、24.1、24.5、25.0。第5位是23.5,第6位是23.7,中位数=(23.5+23.7)/2=23.6,对应选项B?可能题目选项有误,或我排序错误。但根据原始数据,正确中位数应为23.6,选B。(注:此处可能存在笔误,实际考试中需严格核对数据排序。)2.C解析:标准差反映数据本身的离散程度,与样本量无关;标准误=SD/√n,样本量增大时标准误减小。3.B解析:正态分布中,μ±1.96σ覆盖约95%的面积。4.D解析:两独立样本t检验不要求样本量相等。5.B解析:理论频数T<5的格子数超过20%时,需合并相邻类别以增大T。6.A解析:单因素方差分析中,组间自由度为k-1(k为组数)。7.B解析:决定系数R²是回归平方和占总平方和的比例,范围[0,1]。8.C解析:总自由度=N-1=30-1=29(每组10只,3组共30只)。9.A解析:若数据严格正态,Spearman秩相关系数等于Pearson相关系数。10.A解析:置信区间的含义是“有95%的置信度认为总体参数在此区间内”。---二、填空题1.中位数2.3;2.1(均值=np=10×0.3=3;方差=np(1-p)=10×0.3×0.7=2.1)3.Welch’st;数据变换(或非参数检验)4.实际频数;理论频数5.组间变异;组内变异6.自变量x每增加1个单位时,因变量y的平均变化量---三、简答题1.Ⅰ型错误(α错误):原假设为真时拒绝原假设的概率;Ⅱ型错误(β错误):原假设为假时接受原假设的概率。降低Ⅰ型错误需减小α(如从0.05到0.01),但会增大Ⅱ型错误;降低Ⅱ型错误可通过增大样本量、提高检验效能(1-β)实现。2.①卡方检验:用于两个或多个分类变量的独立性检验(如性别与疾病关联);②Fisher确切概率法:小样本(n≤40或T<1)的四格表资料;③Logistic回归:分析二分类或多分类因变量与多个自变量的关系(如疾病发生的影响因素)。3.中心极限定理指:无论总体分布如何,当样本量n足够大时,样本均值的抽样分布近似服从正态分布(均值为μ,方差为σ²/n)。在生物统计中,该定理是t检验、置信区间估计等方法的理论基础,允许对非正态总体进行近似正态分析。4.相同点:均用于多组均值比较,基本思想均为分解总变异。不同点:完全随机设计仅考虑处理因素,变异分解为组间和组内;随机区组设计引入区组因素(如个体差异),变异分解为处理、区组和误差,可减少误差,提高检验效能。5.散点图可直观展示两变量的关系:①判断是否存在线性趋势(若散点呈直线趋势则适合线性回归);②识别异常值(偏离趋势的点);③判断是否存在非线性关系(如曲线趋势);④观察数据分布是否满足回归分析的假设(如等方差性)。---四、计算题1.(1)均值x̄=(125+132+…+123)/15=1950/15=130(g/L);排序后数据:123、124、125、126、127、128、129、130、131、132、133、134、135、136、137,中位数为第8个数,即130(g/L);标准差s=√[Σ(xᵢ-x̄)²/(n-1)]=√[(49+4+…+49)/14]=√(280/14)=√20≈4.47(g/L)。(2)计算偏度系数g₁:Σ[(xᵢ-130)/4.47]³=[(123-130)/4.47]³+…+[(137-130)/4.47]³=(-7/4.47)³+(-6/4.47)³+…+(7/4.47)³计算得各项立方和为0(数据对称),故g₁=0,绝对值小于2倍标准误(0.6×2=1.2),初步认为数据近似正态分布。2.(1)计算两组均值和方差:对照组:x̄₁=(5+3+…+4)/10=35/10=3.5(mmHg),s₁²=[(5-3.5)²+…+(4-3.5)²]/9=18.5/9≈2.06,s₁≈1.43;试验组:x̄₂=(12+10+…+10)/10=109/10=10.9(mmHg),s₂²=[(12-10.9)²+…+(10-10.9)²]/9=44.9/9≈4.99,s₂≈2.23;(2)合并方差s_p²=[(n₁-1)s₁²+(n₂-1)s₂²]/(n₁+n₂-2)=[(9×2.06)+(9×4.99)]/18=(18.54+44.91)/18=63.45/18≈3.525;(3)t=(x̄₂-x̄₁)/√(s_p²(1/n₁+1/n₂))=(10.9-3.5)/√(3.525×0.2)=7.4/√0.705≈7.4/0.84≈8.81;(4)自由度df=10+10-2=18,查t界值表,t₀.05(18)=2.101,计算t=8.81>2.101,P<0.05,拒绝H₀,认为新药有显著降压效果。3.(1)建立假设H₀:性别与疾病无关;H₁:性别与疾病有关;(2)计算理论频数Tᵢⱼ=(行合计×列合计)/总合计:T₁₁=(100×43)/200=21.5,T₁₂=100-21.5=78.5;T₂₁=(100×43)/200=21.5,T₂₂=100-21.5=78.5;(3)卡方值χ²=Σ[(A-T)²/T]=(28-21.5)²/21.5+(72-78.5)²/78.5+(15-21.5)²/21.5+(85-78.5)²/78.5=(42.25/21.5)+(42.25/78.5)+(42.25/21.5)+(42.25/78.5)≈1.965+0.538+1.965+0.538≈5.006;(4)自由度df=(2-1)(2-1)=1,查χ²界值表,χ²₀.05(1)=3.84,5.006>3.84,P<0.05,拒绝H₀,认为性别与疾病易感性相关。4.(1)计算Pearson相关系数r:x̄=(3+4+5+6+7+8)/6=5.5,ȳ=(18+22+25+28+31+34)/6=26;SS_xx=Σ(xᵢ-x̄)²=(3-5.5)²+…+(8-5.5)²=6.25+2.25+0.25+0.25+2.25+6.25=17.5;SS_yy=Σ(yᵢ-ȳ)²=(18-26)²+…+(34-26)²=64+16+1+4+25+64=174;SS_xy=Σ(xᵢ-x̄)(yᵢ-ȳ)=(3-5.5)(18-26)+…+(8-5.5)(34-26)=20+8+0+2+10+20=60;r=SS_xy/√(SS_xx×SS_yy)=60/√(17.5×174)=60/√3045≈60/55.18≈1.08?(显然错误,重新计算)正确计算:(3-5.5)(18-26)=(-2.5)(-8)=20;(4-5.5)(22-26)=(-1.5)(-4)=6;(5-5.5)(25-26)=(-0.5)(-1)=0.5;(6-5.5)(28-26)=(0.5)(2)=1;(7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论