分子标记遗传图谱构建方法-完整_第1页
分子标记遗传图谱构建方法-完整_第2页
分子标记遗传图谱构建方法-完整_第3页
分子标记遗传图谱构建方法-完整_第4页
分子标记遗传图谱构建方法-完整_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/15型,记为5。对于BC1、DH和RI群体,每个分离的基因座都只有两种基因型,不论是共显性标记还是显性标记,两种基因型都可以识别,加上缺失数据的情况,总共只有3种类型。因而用3个数字就可以将标记全部带型数字化。在分析质量性状基因与遗传标记之间的连锁关系时,也必须将有关的表型数字化,其方法与标记带型的数字化相似。例如,假设在DH群体中,有一个主基因控制株高,那么就可以将株系按植株的高度分为高秆和矮秆两大类,然后根据亲本的表现分别给高秆和矮秆株系赋值,如1和2。将质量性状经过这样的数字化处理,就可以与DNA标记数据放在一起进行连锁分析。DNA标记数据的收集和处理应注意以下问题:(1)应避免利用没有把握的数据。由于分子多态性分析涉及许多实验步骤,很难避免出现错误,经常会遇到所得试验结果(如X-光片)不清楚等问题。如果硬性地利用这样没有把握的数据,不仅会严重影响该标记自身的定位,而且还会影响到其它标记的定位。因此,应删除没有把握的数据,宁可将其作为缺失数据处理,或重做试验。(2)应注意亲本基因型,对亲本基因型的赋值(如P1型为1,P2型为2),在所有的标记座位上必须统一,千万别混淆。如果已知某两个座位是连锁的,而所得结果表明二者是独立分配的,这就有可能是把亲本类型弄错引起的。(3)当两亲本出现多条带的差异时,应通过共分离分析鉴别这些带是属于同一座位还是分别属于不同座位。如属于不同座位,应逐带记录分离数据。二、遗传图距与物理距离对应关系的估计不同生物的1cM图距所对应的实际物理距离(碱基对数量)存在很大差异。一般而言,生物越低等或越简单,1cM图距平均对应的碱基对数量就越少(表3.1)。表3.1中给出的各种生物中遗传图距与物理距离之间的对应关系只是一个大约的平均值,实际上它变化很大。在一条染色体上,由于不同区域上发生交换的频率存在差异,因而遗传图距与物理距离之间的对应关系可以有很大的变化。例如,在着丝粒附近,染色体交换受到抑制,因而所估计的遗传图距小于平均对应的物理距离。在同一种生物中,两个特定基因座之间的遗传图距会因遗传背景的不同而改变,甚至有时由同一对亲本所产生的遗传背景相同的不同群体间也存在很大差异。表3.1不同生物中单位图距所相当的平均物理距离

物种基因组大小(kb)遗传图距(cM)kb/cM嗜菌体T41.6X1028000.2大肠杆菌4.2X1031,7502.4酵母2.0X1044,2004.8真菌2.7X1041,00027.0线虫8.0X104320250.0果蝇1.4X105280500.0水稻4.5X1051,500300.0小鼠3.0X1061,7001,800.0人类3.3X1063,3001,000.0玉米2.5X1062,5001,000.0三、构建DNA标记图谱的计算机软件遗传图谱的构建需要对大量标记之间的连锁关系进行统计分析。随着标记数目的增加,计算工作量常常呈指数形式增加,这是手工无法完成的。因此,必须借助计算机进行分析和处理。许多学者为构建遗传图谱设计了专用程序包,通过Internet网址/soft/list.html可以获得各种专用程序的相关信息,如软件的名称及简要介绍,源程序编码语言、支持的操作系统、执行程序的名称、参考文献以及获取软件的网址等。应用于植物遗传连锁分析和遗传图谱构建的常用软件有LINKAGE、MAPMAKER/EXP等。LINKAGE软件可通过/software/linkage获得,该软件是利用最大似然法估计两座位或多座位间的重组率和LOD值;MAPMAKER/EXP可通过/distri-bution/software/mapmaker3获得,该软件可以应用于各种类型的实验群体进行遗传作图,是目前应用最为广泛的作图软件之一。第四节DNA标记连锁图谱的完善一、DNA标记连锁群的染色体定位把分子标记所建立的连锁群与经典遗传图谱联系起来,并将其归属到相应的染色体上,是构建了一个比较饱和的分子图谱之后十分重要的工作。通常根据分子标记与已知染色体位置的形态标记的连锁关系来确定分子标记连锁群属于哪条染色体。还可以利用非整倍体或染色体结构变异材料,如水稻中利用三体、玉米中利用A/B易位系、小麦中利用缺体/四体染色体代换系等,将分子标记连锁群归属到相应的染色体上。以水稻为例,目前已获得全套12条染色体的初级三体(2n+1)。在水稻某种三体中,由于三体染色体有一式3份,其DNA含量为其它11条染色体的1.5倍。在DNA定量相当准确的条件下,用已知能检测某一连锁群的探针分别与12种三体的总DNA杂交。根据剂量效应,杂交强弱与同源序列的含量成正比,杂交后对应三体的DNA滤膜放射自显影显带强度将明显高于其它11种,由此可以判定该标记所对应的序列就在该三体染色体上。随着技术的进步,原位分子杂交的灵敏度已可以揭示单拷贝序列的杂交位点,因此采用原位分子杂交可以容易地将连锁群的分子标记定位到染色体上。要得到一个完整的遗传图谱,必须知道染色体上的标记与着丝粒之间的距离。一个完整的染色体具有以下几个主要部分:着丝粒、缢痕、随体及端粒,这些基本结构在生物染色体的运动与复制等方面起着重要的作用,其结构也是遗传图谱制作中不可忽视的重要部分。由于着丝粒并不是一个基因,不能从表型测知,因此采用常规的两点、三点乃至多点分析方法是无法确定标记与着丝粒之间的关系的。在经典遗传图谱的构建中,一般采用近端着丝粒染色体来对基因与着丝之间的距离进行定位。近端着丝粒染色体是正常染色体在着丝粒附近断裂形成的异常染色体。目前已获得小麦全部42条染色体的近端着丝粒染色体。利用染色体易位材料也可以判断着丝粒在染色体上的位置。一般易位点和着丝粒所在部分的交换被抑制,因而推算位于着丝粒两旁的易位点与标记基因间的重组率时一般都偏小。利用这个现象可以推算连锁图上着丝粒的位置。在细胞学上,利用已知易位点的易位系统进行基因分析也可知道着丝粒的位置。早在1945年,在玉米中就利用易位分析的结果推测了全部染色体的着丝粒位置。染色体上的端粒是指染色体的自然末端。在遗传图谱的构建中,端粒位置的确定就意味着为染色体的全长设定界标。传统的凝胶电泳方法由于分辨能力有限,大多数情况下无法将具有多态性的端粒片段区分开来。一般要借助具有高分辨率的脉冲场凝胶电泳(PFGE)才能将有差异的端粒片段分离开来。利用PFGE与切割位点稀少的限制性酶相结合,Wu和Tanksley(1993)研究了水稻端粒结构的特征,采用来自拟南芥的端粒探针,将三个水稻的端粒DNA电泳条带分别定位在第8、9、11染色体上,并证实了多态性的端粒片段不仅在遗传上而且在物理上与遗传图谱上最远端的RFLP标记相连锁。目前,在日本水稻基因组研究计划所构建的包含2275个标记的水稻分子连锁图中,除第9染色体之外,其余11条染色体的着丝粒(区)都已定位(Harushimaetal.1998)。另外,该图中的第5染色体短臂、第11染色体两臂以及第12染色体短臂的端粒也已定位。二、饱和DNA标记连锁图的制作遗传图谱饱和度是指单位长度染色体上已定位的标记数或标记在染色体上的密度。一个基本的染色体连锁框架图大概要求在染色体上的标记平均间隔不大于20cM。如果构建连锁图谱的目的是为了进行主基因的定位,其平均间隔要求在10〜20cM或更小。用于QTL定位的连锁图,其标记的平均间隔要求在10cM以下。如果构建的连锁图谱是为了进行基因克隆,则要求目标区域标记的平均间隔在1cM以下。不同生物基因组大小有极大差异,因此满足上述要求所需的标记数是不同的。以人类和水稻为例,它们的基因组全长分别为3.3X106kb和4.5X105kb,如果构建一个平均图距为0.5cM的分子图谱,则所要定位的标记数就要分别达到6600和3000个。几种生物不同图谱饱和度下所需定位的标记数如表3.2所示。表3.2遗传图谱达到特定饱和度所需的标记数生物人类水稻玉米拟南芥番茄(kb)3.3X1064.5X1052.5X1067.0X1047.1X105基因组(cM)3300150025005001500大小kb/cM10003001000140473图20cM165751252575谱10cM33015025050150饱5cM660300500100300和1cM3300150025005001500度0.5cM66003000500010003000Tanksley等(1988)以假设拥有12条染色体,每条长100cM,全长1200cM的生物为例,研究了所需标记数与图谱饱和度之间的关系,发现影响所需标记数的主要因素有两个。一个是标记间的平均距离,即图谱总长度除以定位的标记数,它反映了标记图谱的平均密度。对于染色体全长1200cM的生物,如果定位了120个标记,则标记间的平均距离为10cM。另一个因素是标记间的最大距离。标记在基因组上的分布是不均匀的。即使在一张平均密度很高的图谱上,仍然可能存在较大的间隙区。例如,据理论推算,如果用于作图的标记是随机选择的,则当标记平均距离为1cM时,仍有可能存在10cM的间距。而若要将最大可能间距从10cM减小到5cM,则需要另外增加1000个标记。因此,通过提高图谱平均密度的方法来缩小最大标记间距是很困难的。在实际研究中,为了填补间隙,应有针对性地在间隙区上寻找标记,或寻找该间隙所在区域上有差异的亲本构建作图群体。没有一种标记在基因组中分布是完全随机的。如着丝粒区通常以重复序列为主,因而以单拷贝克隆为探针的RFLP标记就不可能不覆盖这些染色体区域。从这一点考虑,利用特性上互补的不同DNA标记进行遗传作图,将有助于提高遗传图谱的饱和度。三、DNA标记连锁图与经典遗传连锁图的整合从1987年报道玉米和番茄的RFLP遗传图谱以来,具有重要经济价值的栽培植物几乎都已构建了以RFLP为主的DNA标记遗传图谱,其中水稻分子图谱上所定位的RFLP标记数已超过2000个(Harushimaetal.1998)。为了充分利用现有的分子和遗传的信息,必须将分子遗传图谱与经典遗传图谱结合起来,成为一张综合的遗传图谱。将两类遗传标记综合到一张遗传图谱中去,不仅是重要经济性状准确定位的需要,也是以图位克隆方法分离目的基因的需要。但是,由于两类图谱的构建是相互独立的,使用的作图群体是不同的,且它们之间缺乏共有的遗传标记,因而整合起来并不容易。另外,经典遗传图谱本身就是一张依据许多由不同研究者利用不同作图群体在不同条件下完成的实验结果而绘制成的综合图谱,其中有的标记基因间的相对位置不一定十分精确,因此,在与分子图谱整合时,不能简单地根据标记间的相对图距进行推论。鉴于上述原因,分子图谱与经典图谱的整合只能通过将传统的遗传标记基因一个一个地定位到分子图谱中去的策略来进行。为此,可以选择各种传统的遗传标记材料来建立作图群体,并用适当的方法快速地找到与传统的遗传标记紧密连锁的分子标记(参见第四章),再根据分子标记在分子图谱上的位置来确定传统遗传标记的位置。在栽培植物中,水稻的经典连锁图谱和分子连锁图谱的整合工作进展较快,这主要受益于水稻在经典连锁图谱上的长期累积性工作,目前至少已将47个形态标记和11个同工酶标记定位到了分子连锁图上(Causse等1994)。第五节比较作图比较作图(ComparativeMapping)就是利用一种物种的DNA标记对另一物种进行遗传或物理作图。比较作图的分子基础就是物种间DNA序列尤其是编码序列的保守性。通过比较作图可揭示不同物种基因组或基因组区域同线性或共线性的存在,从而了解不同物种基因组结构的相似性及基因组进化的历程。所谓同线性是指定位在一个物种的染色体上的两个或多个标记又被定位于另一物种的同源染色体区域上,但这些标记间的相对排列顺序可变化;而共线性则指定位在同源染色体区域上的标记,其标记间的相对排列顺序是保守的。比较作图始于人-鼠间的基因组同源性比较。至今许多植物之间也进行了比较作图研究,如番茄、马铃薯和辣椒(Tanksleyetal.1988;1992);水稻、小麦和玉米(Ahnetal.1993;1994);小麦、大麦和黑麦(Devosetal.1993);高粱和玉米(Pereiraetal.1994);拟南芥和芸苔属(Kowalskietal.1994)以及大麦和水稻(Maroofetal.1996)等。Moor等(1995)对水稻、小麦、玉米、谷子、甘蔗及高粱等6种主要禾本科物种的比较作图研究表明,这些禾本科植物基因组的保守性可归结到水稻基因组的19个连锁区段上,由这19个区段可实现对所研究的全部禾谷类作物进行染色

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论