2025年大学《生物统计学》专业题库- 生物统计学对生物进化理论的支持_第1页
2025年大学《生物统计学》专业题库- 生物统计学对生物进化理论的支持_第2页
2025年大学《生物统计学》专业题库- 生物统计学对生物进化理论的支持_第3页
2025年大学《生物统计学》专业题库- 生物统计学对生物进化理论的支持_第4页
2025年大学《生物统计学》专业题库- 生物统计学对生物进化理论的支持_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学《生物统计学》专业题库——生物统计学对生物进化理论的支持考试时间:______分钟总分:______分姓名:______一、简答题(请简要回答下列问题)1.根据进化论的观点,生物种群中遗传变异的存在是自然选择发生的基础。请用统计学原理解释遗传变异为何是进化的原材料,以及如何定量描述种群的遗传变异程度。2.什么是系统发育树?简述距离法、最大似然法和贝叶斯法这三种构建系统发育树的统计学方法的基本原理和主要区别。3.简述Tajima'sD统计量在种群遗传学中的应用目的及其如何被用于推断种群历史事件(如扩张或瓶颈)。4.什么是中性进化模型?为什么在系统发育和种群遗传学分析中,检验数据是否符合中性进化模型是一个重要的统计步骤?5.解释“分子钟”假说的概念,并简述基于核苷酸替换模型进行分子钟校正的基本思路和其中涉及的统计学考量。二、计算与分析题(请根据要求进行计算或分析)6.假定在一个二倍体种群的基因座上,等位基因A和等位基因a的频率分别为p=0.7和q=0.3。请计算该种群在这个基因座上的Hardy-Weinberg平衡状态下的预期杂合子(Aa)频率和纯合子(AA,aa)频率。如果实际观察到的杂合子频率为0.48,请计算该种群偏离Hardy-Weinberg平衡的统计量(如卡方值),并简要说明其生物学意义。7.某研究者在三个不同的地理种群(种群1、种群2、种群3)中收集了某基因片段的DNA序列。经比对,发现种群间的核苷酸差异(以替换数计)如下:种群1vs种群2=5,种群1vs种群3=7,种群2vs种群3=8。请基于这些数据,使用邻接法(Neighbor-Joining)的基本思想,大致描述如何构建这三个种群之间的距离矩阵,并推测得到的系统发育树拓扑结构可能是什么样?(无需实际计算,只需阐述思路和结果预测)。8.假设你获得了一组物种的DNA序列数据,并使用最大似然法构建了它们的系统发育树。树的拓扑结构如下(简化表示):((A,B),C);其中A、B、C代表不同物种。软件输出的结果显示,连接(A,B)这一支的Bootstrap支持率为90%,而连接((A,B),C)这一支的支持率为85%。请解释这两个支持率数值的含义,并说明它们对理解这三个物种进化关系有何指示作用。9.某研究假设一个基因在某个古老的种群扩张事件中经历了快速的人口增长。研究者收集了该基因在不同现代种群中的频率数据,并计算了各个种群的π(π=平均核苷酸差异)值。他们计划使用Tajima'sD统计量来检测这种种群扩张。请解释为什么Tajima'sD适用于这种情况?如果计算得到的Tajima'sD值显著偏离零(例如,显著为正),这通常支持什么样的种群历史解释?10.给定一段基因序列,研究者发现其中某个密码子位置的核苷酸组成明显偏离随机预期(例如,某个碱基出现频率远超25%)。研究者使用基于似然比检验的方法,旨在判断这种核苷酸组成偏差是由于中性进化中的偶然性造成的,还是由于该位点受到了正选择。请简述这种统计检验的基本逻辑:如何设置零假设和对立假设?如何通过比较似然值来做出统计推断?如果检验结果显著拒绝了零假设,研究者可以得出什么结论?试卷答案一、简答题1.遗传变异是进化的原材料,因为自然选择只能作用于已经存在的不同性状(由基因型决定),并选择其中适应性更强的个体。统计学上,变异可以用基因频率、等位基因频率、杂合度等指标量化。例如,较高的杂合度(Heterozygosity,H)意味着种群中有更多的基因型变异,这为选择提供了更多可选择的材料,从而可能加速进化进程。遗传变异可以通过突变、重组等过程产生,并通过遗传在世代间传递。2.系统发育树是表示物种(或其他生物单元)之间进化关系的一种树状图,树的节点代表共同祖先,枝条代表进化分支。距离法(如Neighbor-Joining)基于种群间或基因序列间的距离(通常是核苷酸或氨基酸差异)构建树,通过逐步连接距离最近的节点。最大似然法(MaximumLikelihood)寻找能产生观测数据的最佳进化模型和拓扑结构组合,需要预先设定进化模型(如替换速率矩阵、时间纲等)。贝叶斯法(BayesianInference)基于先验概率和观测数据,通过马尔可夫链蒙特卡洛(MCMC)等算法迭代计算后验概率,得到树的拓扑结构和参数分布。主要区别在于构建树的基础(距离、似然、概率)、所需参数和计算复杂度。3.Tajima'sD统计量用于衡量实际观测的核苷酸多样性(π)与基于中性进化模型预测的核苷酸多样性之间的差异。中性进化模型假设没有选择、群体大小稳定、随机遗传漂变和突变。Tajima'sD统计量考虑了样本大小和变异格局。当种群经历扩张时,历史上较低的种群大小会导致更高的遗传漂变,使得实际观测的π低于中性模型预测值,预期Tajima'sD值偏向正值。反之,种群经历瓶颈时,历史上较高的有效种群大小会导致较低的遗传漂变,使得实际观测的π高于中性模型预测值,预期Tajima'sD值偏向负值。因此,通过比较观测Tajima'sD值与中性分布的期望值(通常为零),可以推断种群历史事件。4.中性进化模型假设绝大多数核苷酸替换是中性的,即对生物体的适应性没有影响,其发生主要是由随机遗传漂变和突变-选择平衡驱动的。在系统发育和种群遗传学中,检验数据是否符合中性进化模型至关重要,因为:①它提供了一个简洁的基准线,用以比较观察到的遗传模式。如果数据显著偏离中性,则暗示可能存在选择、群体结构、历史事件等非中性因素。②许多统计推断方法(如分子钟校正、选择检测)都基于中性进化假设或需要先剔除中性进化的影响。③中性测试本身可以提供关于种群历史(如有效种群大小变化)的信息。5.分子钟假说认为,对于进化速率相对恒定的基因位点,核苷酸序列的替换速率近似线性,并且可以通过比较物种间的序列差异来估算它们分化的时间。基于核苷酸替换模型进行分子钟校正的基本思路是:①选择一个合适的进化模型(如Jukes-Cantor,Kimura2-parameter)来描述序列间的替换关系。②利用至少两个物种的序列数据,根据其已知的分化时间(如化石记录或系统发育关系),估计该模型下的平均替换速率(λ,通常用每年替换的核苷酸位点数表示)。③将这个估计的替换速率λ应用于具有未知分化时间的多个物种对或种群对,通过计算序列差异与λ、时间乘积的关系,来校正或推断它们的分化时间。统计学考量包括选择恰当的进化模型、处理模型不确定性、确保用于估计速率的物种对具有可靠的时间信息等。二、计算与分析题6.根据Hardy-Weinberg平衡,预期频率:*AA频率=p²=0.7²=0.49*aa频率=q²=0.3²=0.09*Aa频率=2pq=2*0.7*0.3=0.42*总和:0.49+0.09+0.42=1.00*预期杂合子频率H=0.42,纯合子频率(AA+aa)=0.49+0.09=0.58。*观察到杂合子频率H_obs=0.48。*卡方检验统计量χ²=Σ[(O-E)²/E],其中O为观察频率,E为预期频率。*χ²=(0.48-0.42)²/0.42+(0.49-0.49)²/0.49+(0.09-0.09)²/0.09*χ²=(0.06)²/0.42+0+0*χ²=0.0036/0.42≈0.0086*该卡方值远小于其自由度(df=1)的临界值(如α=0.05时,临界值约3.841),因此没有足够的统计证据拒绝Hardy-Weinberg平衡假设。生物学意义:该种群的基因频率在统计上没有偏离Hardy-Weinberg平衡,暗示可能没有受到选择、突变、迁移、遗传漂变或种群大小变化等干扰,或者这些因素的综合效应不显著。7.根据邻接法(Neighbor-Joining)原理,首先计算种群间的距离矩阵(以核苷酸替换数计):*D(A,B)=5*D(A,C)=7*D(B,C)=8*然后,选择距离最近的两个种群对。这里A和B之间的距离(5)最短。*将A和B连接起来,形成一个“超种群”或临时的“物种”(记为AB),此时计算这个“超种群”与其他种群(C)的距离。根据Neighbor-Joining的公式(或直观理解),这个距离通常不是简单的替换数之和,而是基于它们与第三个种群的距离加权平均。但在此简化描述中,可以理解为连接AB与C的枝长需要能合理解释它们之间的总差异(8),同时AB内部的距离趋于0。*构建的树拓扑结构大致为:一个节点连接A和B,然后从这个节点再连接到C。即((A,B),C)。*需要注意,这只是基于给定差异值的粗略推断,实际NJ算法有更精确的计算方式。8.Bootstrap支持率是基于自展法(Bootstrap)计算得到的。Bootstrap支持率为90%,意味着通过重复有放回地抽样原始数据点(通常是位点),构建大量(如1000次)虚拟树,其中恰好有90%的树与原始最大似然树具有相同的拓扑结构(即连接A和B的分支存在于90%的虚拟树上)。这个值反映了原始树的拓扑结构在统计上的稳定性或可靠性。高支持率(如>70%-90%)通常表明该分支所代表的进化关系具有较强的证据。在本例中,((A,B),C)这一支的支持率为85%,表明“物种A和物种B首先聚合,然后与物种C聚合”这一进化顺序关系有较强的统计支持,但略低于最高标准。相比之下,连接(A,B)这一支的90%支持率非常高,说明“A与B亲缘关系最近”这一关系非常稳健。9.Tajima'sD适用于检测种群历史变化,特别是有效种群大小(Ne)的变化。种群扩张会导致历史上Ne减小,这会使得遗传漂变增强,导致现代种群间的核苷酸差异(π)相对于中性模型预测值偏低。Tajima'sD统计量在扩张模型下倾向于正值。因此,研究者使用Tajima'sD来检测扩张事件,是因为一个显著的正值结果(相对于零的期望值)可以支持种群扩张的假设。如果计算得到的Tajima'sD值显著偏离零(例如,显著为正),这通常意味着观测到的遗传多样性低于中性模型预测,这符合种群扩张后遗传漂变增强的预期,从而支持该种群经历了古老或近期的人口扩张事件。10.基于似然比检验(LikelihoodRatioTest,LRT)检测正选择的逻辑如下:*零假设(H0):序列进化是中性的,即所有观察到的替换都是中性的。*对立假设(H1):序列进化是非中性的,至少有一个位点受到了正选择。*使用一个中性进化模型计算观测数据出现的似然值(L0)。*使用一个包含正选择位点的模型(通常是中性模型加一个或多个受选择位点的参数,如选择系数σ²)计算观测数据出现的似然值(L1)。L1通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论