家蚕第12连锁群EST-SSR的信息分析_第1页
家蚕第12连锁群EST-SSR的信息分析_第2页
家蚕第12连锁群EST-SSR的信息分析_第3页
家蚕第12连锁群EST-SSR的信息分析_第4页
家蚕第12连锁群EST-SSR的信息分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2微卫星标记技术及其在蚕学研究中的应用前景21微卫星DNA的定义与结构微卫星DNA,也称为简单序列SIMPLESEQUENCEDNA、简单序列重复SIMPLESEQUENCEREPEAT,SSRDNA或简单串联重复SIMPLETANDEMREPEAT,STRDNA。微卫星DNA在结构上由重复不同次数的核心模体COREMOTIF组成,根据核心模体的不同长度,将微卫星DNA与其它被称为小卫星MINISATELLITEDNA和卫星SATELLITEDNA的重复DNA区别开来。小卫星DNA有更长的核心重复单元,常在十几个碱基到几百个碱基之间。微卫星DNA的核心结构是由16个核苷酸为重复单位串联组成的长达几十个核苷酸的序列24。按照重复结构的不同可将微卫星DNA分为3种类型25完全重复型PERFECTREPEATS,重复单元之间没有被打断,如CAN不完全重复型IMPERFECTREPEATS,重复单元之间被打断,如CANCCACAM复合型COMPOUNDREPEATS,邻近的串联重复序列不同,如CANTGM。普遍认为双核苷酸微卫星重复单元类型对杂合度没有影响,但重复次数却很重要。双核苷酸微卫星的多态信息含量POLYMORPHISMINFORMATIVECONTENT,PIC在0N或NM10到10N或NM24之间26。作为有用的遗传标记只有超过16个双核苷酸重复单元的微卫星会有可靠的高PIC,但是一些在1016个重复单元之间的微卫星也可能有用27。三核苷酸重复比双核苷酸少10倍左右,最常见的形式是AABNBC,G或T。四核苷酸更少,最常见的形式是AAABNBC,G或T。三核苷酸与四核苷酸微卫星DNA的PIC的高低与重复单元的序列有很大关联,AT丰富的重复和多态性相对高一些28。微卫星DNA的两侧是相对保守和专一的单拷贝序列。利用侧翼序列设计引物可以特异性扩增微卫星位点,使微卫星DNA以PCR的形式从基因组中被选择性地扩增出来。这就是微卫星标记MICROSATELLITEMARKER。22微卫星标记221微卫星标记的主要特征2211SSR标记具有高度的多态性微卫星DNA本身重复单位数的变异是形成微卫星多态性的基础。对微卫星变异的机制有多种假设,比较一致的观点是微卫星的重复序列在复制过程中容易滑动错配而产生不同长度的重复序列。这种多态性常常表现为复等位性,在不同的基因型间广泛存在。重复次数的多少与该位点等位基因数呈正相关。遗传标记物如果具有高度选择性,就不再具有广泛的标记作用,因为它只能代表其自身如果选择性太低,则多态性低,起不到标记的作用。微卫星核心结构的突变频率约102106/代位点,这样的突变率使微卫星呈现高多态性,而又具有一定的稳定性30。2212SSR标记在真核生物基因组中数量多且分布均匀微卫星DNA存在于所有已检测过的真核生物的基因组中,并在整个基因组中都有分布,其均一性比其它标记高,并且是唯一的一个分布在着丝粒CENTROMERES区域附近的多态性标记。在哺乳动物中几乎每个基因都存在至少1个微卫星标记31。2213SSR标记遵循孟德尔式遗传规律和共显性遗传模式多位点的指纹图谱和RAPD通常仅可被解释为显性标记,杂合子看起来就象纯合子,不能看到父源染色体与母源染色体上等位基因的差异。用显性标记来估计表现型参数更困难。而微卫星标记是共显性标记,并且遵循孟德尔式遗传法则30,31。2214SSR标记在相关物种中具有保守性和通用性由于用于设计微卫星标记特异性引物的序列是微卫星位点两侧的侧翼序列,该序列在相关物种中是高度保守的,这使微卫星标记也具有相同的保守性。目前许多物种的微卫星标记来源之一就是相关物种微卫星标记的直接应用32,33。2215SSR标记可利用PCR检测SSR标记是一个PCR标记,需要的样品量非常少。行为学家用SSR标记调查个体非常小的有机体交配关系保护遗传学家用SSR标记对濒危物种进行非损伤取样研究。SSR标记扩增序列短,最多500BP左右,可以用于已经降解DNA如古生物的研究34。微卫星标记引物是特异性引物,重复性强,稳定性好,所得的数据可以在不同实验室之间交流和比较。2216SSR标记可以进行高度自动化分析SSR标记是特异性PCR标记,在基因组中只有1个扩增位点,扩增片段长度也在200500BP,通过聚丙烯酰胺凝胶电泳分离扩增片段检测,十分适合高度自动化分析。随着技术的发展,越来越多的研究利用荧光标记微卫星进行多重PCR,通过DNA测序仪和自动探测器进行电泳及数据分析35。2217微卫星标记可作为序列示踪位点SEQUENCETAGGEDSITE,STS微卫星标记与其它的分子标记如RAPD、VNTR、RFLP、AFLP、ISSR不同,它得到的引物可以直接用于基因组的特异性扩增,理论上每个样品的PCR产物电泳只产生1条带或2条同样深度的带在实际应用中要复杂些,可直接作为STS,这一特点将拓宽其应用前景。23SSR标记获得的途径获得SSR标记主要有3条途径一是从公共序列数据库如EMBL,GENBANK各EST数据库中寻找已存在的SSR标记二是使用与所研究物种亲缘关系较近物种的SSR标记三是用经典分子生物学方法克隆所需要的微卫星位点,建立DNA文库如基因组文库、富集文库ENRICHEDLIBRARY、BAC/YAC库,CDNA文库,用重复数目为1020的CAN或其它SSR寡核苷酸探针通过杂交法从文库中筛选出来,再经DNA测序,由微卫星DNA的侧翼序列设计引物,获得SSR标记36。大量的SSR标记需通过建库、测序的第3种方法获得。当一个新的微卫星标记发现后,需进行多态性分析及杂合度测定。通过对某物种几十个不同品系的PCR扩增,根据聚丙烯酰胺凝胶电泳分离的扩增产物片段大小来鉴定该微卫星标记的多态性情况,最后还需通过与已知微卫星位点的连锁分析来确定其在染色体上的位置。24SSR标记数据的统计分析法241SSR标记多态水平的评估方法分子标记多态性描述的术语有两个第一是杂合度HETEROZYGOSITY,表示研究群体中任意位点的两个等位基因彼此不同的可能性,计算公式,PI为等位基因基因频率第二个是多态信息含量POLYMORPHISMINFORMATIVECONTENT简称PIC,其考虑了杂合父母在同样杂合的后代的连锁分析时不能提供信息的事实,在家系分析中能更好的反映标记的值。BOTSTEIN推导的公式如下,PI和PJ为等位基因基因频率。一个可能有用的信息标记的杂合度大于60,或者PIC值大于060。对SSR标记而言,还有一个重要的参数,即等位基因的频率。等位基因的频率是计算基因型分布频率的基础。根据HARDY2WEINBERG原理,由于每一个体任何常染色体位点的等位基因均呈二项分布,假定该个体某一位点基因型为M、N,等位基因频率为P和Q,并且PQ1,其基因型分布可按PQ2来计算,即PQ2P22PQQ2。假定人群中某一位点有3种类型的等位基因,其频率为P、Q和R,则该位点基因型分布为PQR2。以此类推,可计算出任何已知基因型和等位基因数目的基因频率。242遗传距离GENETICDISTANCE为了能够更全面地反映亲本品种间的遗传差异,需要对多个性状综合考虑,从而引伸出遗传距离的概念。按多元统计分析方法计算品种间多个性状基因型值构成的多维空间的几何距离,就叫做品种间的遗传距离。在SSR标记中常用到NEI氏标准遗传距离和绝对距离38。NEI氏相关系数SIJ2NIJ/NINJNEI氏遗传距离GDIJ1SIJ。NIJ是指材料I和J之间共同的等位基因数目NINJ是两个材料所有的等位基因数目。因为SSR标记是用的测序胶分离片段的,等位基因的大小可以直接用其碱基数来表示,因而可以用绝对距离ABSOLUTEDISTANCE来计算遗传距离和AKJ分别是第I和第J个品种在第K个位点的重复序列大小碱基数,L是所分析的位点总数。计算NEI氏遗传距离的软件可采用GENEPOPVERSION34,JUNE2003,能反映微卫星标记的杂合子或纯合子状况计算绝对距离的软件可以采用MICROSATV15EMINCH,STANFORDUNIVERSITY,USA。243系统发生树PHYLOGENETICTREESSSR标记常用的构建系统树的方法有两种。应用最广泛的是平均连接聚类法AVERAGELINKAGECLUSTERING或称UPGMA法应用算术平均数的非加权成组配对法,UNWEIGHTEDPAIR2PROUPMETHODUSINGANARITHMETICAVERAGE。该法将类间距离定义为两个类的成员所有成对距离的平均值。NEI等39模拟了构建树的不同方法,发现当沿树上所有分枝的突变率相同时,UPGMA法一般能够得到较好的结果,但必须强调有关突变率相等或几乎相等。另一些模型研究证实当各分枝的突变率不相等时,这一方法的结果不尽人意。当各分枝突变率相等时,认为分子钟MOLECULARCLOCK在起作用。比较经典的是由SAITOU和NEI提出的邻接法NEIGHBORJOININGMETHOD40。该方法以NEI氏标准遗传距离为参数,通过确定距离最近或相邻的成对分类单位来使系统树的总距离达到最小,通过循序地将相邻点合并成新的点,就可以建立一个相应的拓朴树。其中相邻树枝间的亲疏关系可通过BOOTSRRAPPING数位的大小显示。25辅助育种通过一些与性状连锁的微卫星标记,可以在生命早期对该性状进行选择,也可以在两种性状中同时选择。这样,世代间隔缩短,选择强度提高,将大大简化育种工作。1999年REDDY等58做了家蚕基因组SSR标记的相关研究,分离出28个微卫星位点,其中用13个家蚕的品系对15个SSR标记进行了多态性分析。家蚕分子标记的研究还有RFLPRESTRICTIONFRAGMENTLENGTHPOLYMORPHISMS30,59,BKM探针60,M13探针62。REDDY等44在家蚕基因组SSR标记的研究中,从插入片段为018KB,基因组覆盖率为0153的家蚕不完全基因组文库中用传统的杂交法得到GTN和CTN的阳性克隆,估计家蚕基因组中平均每49KB出现1个GTN,每104KB出现1个CTN,总共约有10000个GTN和5000个CTN。GTN重复序列的丰富度与其它物种类似,而CTN重复序列与大黄蜂和蜜蜂相比却少得多。从中分离出28个微卫星位点,其中的15个SSR标记用13个家蚕的品系进一步分析SSR标记的多态性水平。等位基数的范围在317个,杂合度01660190。鉴定滞育和非滞育品系特有的SSR标记,证明家蚕中的SSR标记的共显性遗传。但是发现其微卫星重复片段的长度与多态性水平没有关系,而在其它许多物种中的这种关系却是非常明确的。这项研究也是家蚕SSR标记研究的开始。家蚕微卫星标记的发展将着眼于以下几个方面开发家蚕微卫星标记,构建高密度遗传连锁图谱联合微卫星标记遗传连锁图谱和其它遗传图谱组合成高饱和图谱寻找与性状紧密连锁的微卫星标记,用于遗传辅助育种、基因定位和QTL分析开发后的微卫星标记可用于家蚕的个体、品系、品种的鉴定,种质资源保存与利用,演变追踪,系谱确证,杂种优势判定,亲缘关系及起源研究,等等。33家蚕QTL的基因定位研究质量性状的基因定位相对简单,它可在己经知道目标基因位一于某一染色体或连锁群上的前提下,选择该连锁群上不同位置的标记与目标基因进行连锁分析。也可以构建近等基因系NILS或通过连锁分析的方法去寻找与目的基因相近的分子标记。除了质量性状外,家蚕的主要经济性状和生理性状大多都是数量性状,如茧丝长,茧层率等。数量性状的表型变异是呈连续的正态分布,受微效多基因控制,并受环境条件影响,一般只能通过统计分析方法来确定其遗传座位9GOQTL定位实际上就是对数量性状的主基因定位,它将影响数量性状的多个基因一一剖分并将其定位在染色体上L。目前家蚕的数量性状定位也正在开展中,如2004年赵爱春,鲁成等利用407个AFLP标记构成了含33个连锁群的遗传图并对家蚕的全茧重、茧层重、茧层率及蚕蛹重等经济性状进行了QTL定位。在定位中一共得到了11个数量性状位点,分别位于7个连锁群中,并且在其中的两个连锁群中有集中分布的趋势【OO,OY。另外中科院上海植物生理生态研究所也在开展利用SSR标记作图,对家蚕的茧质性状进行QTL定位的研究。相信以上的研究成果会对家蚕的分子标记辅助育种奠定良好基础。34家蚕SSR的基因定位研究2005年,中科院上海植物生理生态研究所、中国农科院蚕业研究所和西南大学蚕学重点实验室共同构建了家蚕SSR标记连锁图,该图含518个SSR标记,总图距为34319CM,每条连锁群上分布有740个标记。该图的构建为家蚕的基因定位提供了一个非常方便的研究平台,利用SSR标记可大大缩短基因定位的研究周期。目前对家蚕的SSR分子标记定位也取得了不少的成果,比如国内镇江蚕业研究所保存有一个株系,不同于DNY1及DNV2型浓核病,命名为DNVZ,其抗病基因为NSDZ。目前己利用SSR标记对NSDZ基因进行了定位IO2。另外同样由SSR标记进行定位的家蚕基因还有绿茧的基因GA,GB和GC,以及MLNXAN等,其中GA定位到20号连锁群,GB和GC定位到28号连锁群,这与之前的经典遗传图定位结果有一定的出入,在定位中与三个基因最近的SSR标记分别为OOCM,22CM和41CMG4O家蚕的分子标一记定位工作由于起步较晚,并且受到遗传图谱的影响,并未开展到定位克隆的水平,所以虽然在经典遗传图上己经定位的家蚕突变位点有240多个,但目前仅将其中的抗病基因或与经济性状相关的基因进行了定位。家蚕分子遗传图与经典的连锁遗传图的整合方面也取得了一些重要的进展,特别是YUJIYASUKOCHI等先后将经典连锁图上多个形态、生理突变基因定位在分子标记图谱上,从而建立了两类遗传图谱间的部分联系。但总体上家蚕分子标记连锁图谱与经典连锁图谱以及几种分子标记图谱彼此之间,仍然处于孤立的状态。3ESTSSR标记及其研究进展31ESTSSR标记及其发展根据SSR的来源可将其分为基因组SSR和ESTSSRCHEN等,2006。传统基因组SSR标记的开发需要经过构建基因组DNA文库,探针杂交,克隆测序等繁琐步骤RODER等,1998,不仅费时耗力,而且成本也很高。此外,通过这种方法所获得的SSR还受到开发过程中所用探针SSR重复单元种类的限制,而后者大多数情况下是以两个或者三个核苷酸为重复单元CHEN等,2006,使SSR的应用受到了很大的限制。【1】ESTSEXPRESSEDSEQUENCETAGS,ESTS,中文直译为表达序列标签的出现为SSR的开发带来了新的契机,近年来快速增长的ESTS数据已成为SSR标记的重要来源KOTA等,2001为了与传统的基因组SSR标记相区别,一般将源于EST库的SSR称为ESTSSR标记ESTMICROSATELLITEMARKER毕业设计代做平台580毕业设计网是专业代做团队也有大量毕业设计成品提供参考WWWBYSJ580COMQQ3449649974作为一种新的SSR标记,ESTSSR标记已经在许多植物种类中得到开发和应用,例如葡萄SCOTT等,2000、甘蔗CORDEIRO等,2001、小麦EUJAYL等,2001、黑麦HACKAUF和WEHLING,2002、大麦THIEL等,2003、大豆SONG等,2004、水稻KANTETY等,2002、高粱KANTETY等,2002、松树LIEWLAKSANEEYANAWIN等,2004以及高羊茅SAHA等,2004等物种。32ESTSSR技术的原理EST是指通过对CDNA文库中随机挑取的克隆进行大规模测序所获得的CDNA的5或3端序列,长度一般为1505OOBP骆蒙和贾继增,2001不断增长的ESTS数据成为开发SSR的丰富资源,而ESTSSR技术正是建立在这样的基础上,其基本原理同基因组SSR分子标记是一样的,即根据简单重复序列两端的保守序列设计引物进行PCR扩增,由于植物上不同物种间微卫星重复单元的碱基组成和拷贝数不同而显现出多态性,在此基础上再进行后续的研究工作BOUCK和VISION,2007。ESTSSR技术原理及开发方法可简单地总结为图11。图11ESTSSR技术简单原理FIG11SIMPLEPRINCIPLEOFESTSSRTECHNIQUE利用EST库开发SSR引物首先要从ESTS中搜索合适的简单重复序列,通常使用SSRS鉴定软件例如SSRITHTTP/ARSGENOMECORNELLEDU/CGIBINRICE/SSRTOOLMISAHTTP/PGRCJPKGATERSLEENDE/MISSSRFINDERHTTP/MAIZEMAPORG/BIOINFORMATICS/SSRFINDER对所需种类的单一ESTS数据库单一的ESTS数据库可以避免冗余的序列进行ESTS的可利用性筛选。对于筛选的标准,不同的研究者基于各自具体的研究会有不同的选择。BECKER和HEUN1995所用的依据是单核苷酸重复N10,两核苷酸重复N5,三核苷酸重复4和四核苷酸重复3。而SCOTT等2000在对葡萄EST文库筛选微卫星过程中所采用的标准是单核苷酸N10,两核苷酸重复次数N7,三核苷酸重复次数5。一般查找到的微卫星重复次数越多,相关的多态性也就越高。之后用PRIMER30或PRIMER50等引物设计软件对筛选出的SSR序列设计引物图12。获得引物后,对研究材料进行PCR扩增,PCR产物经过电泳或者测序等方法检测,最终对所获数据进行处理和分析,从而得出相关结论。图12单一ESTS数据库SSR引物设计BOUCK等,2007FIG12PRIMERDESIGNINGFORSSRFROMUNIGENEESTSBOUCKETAL200733ESTSSR技术的特点与源于基因组的SSR标记相比,ESTSSR在某些方面更具有优势。首先,从EST数据库中直接电子筛选获得SSRVARSHNEY等,2005后建立ESTSSR标记要经济得多,可以说这只是ESTS测序计划的副产品,虽然不同植物中SSR分布的频率差异很大,但其中2以上的EST序列中都含有SSRCORDEIRO等,2001其次,ESTSSR来源于基因本身,因此是一种有功能的分子标记。它的开发无疑使无功能分子标记向可揭示基因转录功能的分子标记转化,将为基因提供“绝对”的标记朱振东和贾继增,2003。此外,由于ESTSSR来源于基因组编码序列,保守程度更高,转移频率较大,在不同物种之间可以通用,同时也为比较基因组学和发掘同源基因提供新的途径。34ESTSSR的多态性与遗传多样性研究遗传多样性是指生物种内不同群体之间或群体内不同个体间遗传变异的总和,它是生物多样性的基础和重要组成部分李永强等,2004。对植物自然群体和人工培育品系的遗传多样性评价是有效保护、开发和利用种质资源的基础。尽管EST来源的SSR的多态性明显低于来源于基因组的SSRCHO等,2000CHABANE等,2005EUJAYL等,2001PILLEN等,2000RUSSELL等,2004SCOTT等,2000THIEL等,2003,但利用ESTSSR标记进行遗传多样性研究时,由于它是对基因内部变异的一种直接评价,因此将有可能和某些形态性状、生理生化特征或某个特定的环境适应型相联系。CHEN等2006从柑橘的EST库中开发设计了100对SSR引物用于检测柑橘两个不同属甜橙CITRUSSINENSISLOSBESK和构橘PONCIRUSTRIFOLIATELRAF的遗传多样性和杂合度。其中87对能够扩增出预期产物,在甜橙和构橘上显示杂合性位点的引物分别为35对和20对,各占扩增总位点的40和23而前者较高的杂合性和甜橙杂种起源的说法是完全一致的。江东等2006在用25对ESTSSR引物对6个柑橘CITRUSL品种的遗传多样性进行分析时发现,所有引物在这6个品种间都能扩增出多态性条带。这些都证实了柑橘的EST数据库可以有效地用来开发SSR标记,还将为进一步了解柑橘SSR的分布和出现频率及开发分子辅助育种标记提供宝贵的资源,从而大大加快柑橘基因图谱工程的进程SCOTT等2000从葡萄的ESTS中选择设计了16对SSR引物用于7个葡萄品种的遗传多样性检测,其中10对引物可在这些供试材料中扩增出多态性条带另外,研究还表明来自EST不同区域的引物在相关属间,不同种间和品种之间表现出不同水平的差异性,来自3非转录区3UTR的SSRS在品种CULTIVAR间多态性最高5非转录区5UTR的SSRS在品种间和种SPECIES间多态性最高而来自编码区的SSRS在种间和属GENERA间多态性最高在其他植物上GAO等,2003GUPTA等,2003也有类似的报道,3非转录区的ESTSSRS的多态性要比S非转录区的ESTSSRS的高。这是由于在CDNA的合成过程中POLYT的剪切往往发生在3非转录区,以致其表现出更大的变异XIE等200616对SSR引物8对基因组SSR,8对ESTSSR评价了23个中国扁桃栽培品种、15个来自世界其他地方的扁桃栽培品种、2个桃和杏子的杂交种以及3个桃品种的遗传多样性其中8对基因组SSR引物在这43份供试材料中共检测到61个等位变异,平均每对引物扩增出76个等位基因,每个位点的观察杂合度HO为0628,而8对ESTSSR引物共检测到62个等位变异,平均每对引物扩增出78个等位基因,每个位点的观察杂合度HO为0678。两种SSR的多态性基本相同。这一结果与一般认为的ESTSSR较基因组SSR多态性为低的说法稍有不同这可能与所选的SSR在EST上的位置有关,而来自EST不同区域的SSR多态性水平不一样SCOTT等,2000。随后通过聚类分析表明,中国品种和世界其他地方品种分别聚成单独的两个群,而两个桃和杏子的杂交种在遗传关系上更接近桃,并且共同聚成一个外群这说明ESTSSR在亲缘关系的研究中也有高度的可靠性因此,在进行种质资源遗传多样性分析时,同样可以利用ESTSSR的多态性,从而为揭示不同品种或材料间的差异提供了一条新途径,也为检测适应性差异的功能多样性提供了机遇EUJAYL等,2001RUSSELL等,2004O35ESTSSR的保守性与物种间的通用一个物种的SSR引物在不同物种间的通用性,主要取决于SSR侧翼序列的保守程度和SSR本身进化的稳定性不同物种间SSR引物的通用可以显著提高标记的利用价值,从而有效地弥补物种分子标记的不足,丰富标记数量但传统基因组来源的SSR在物种之间的通用性很差RODER等,1998,而作为基因的一部分,ESTSSR的侧翼序列在物种之间高度保守,因此ESTSSR引物在物种间具有较高的通用性HOLTON等,2002DECROOCQ等2003分别用葡萄和杏子的ESTSSR引物检测其在整个葡萄科和蔷薇科的转移性,并对其中的一些ESTSSR位点进行测序。分析结果发现亲缘关系越近,扩增条带质量就越好,多态性也越高,这在两个科上都得到了证实另外,相对于葡萄的ESTSSR引物在葡萄科内不同种属间较高的转移性,杏子的ESTSSR引物只适用于与它相近的李子亚属PRUNOPHORAL的种,这或许反映出蔷薇科内种属间较大的遗传差异。VENDRAMIN等2007从桃果皮的EST库中开发设计了21对SSR引物,并用于22个桃基因型的检测结果显示,有18对在所有供试材料中均可以扩增出所需产物,其中10对具有多态性。将这18对引物在李属PRUNUSL的其他6个种上进行扩增,也都成功扩增出预期条带ESTSSR在桃上的多态性以及在李属不同种间较高的转移性表明其将在桃和相近种的指纹图谱,遗传连锁分析和系统进化研究等方面发挥重要的作用BASSIL等2006在欧洲草毒FRAGARIAVESCALYELLOWWONDER,品种的EST库中选择开发了14对SSR引物,将其用于其他13个不同草筹品种染色体包含了4个水平的倍性的多态性分析,与二倍体的草毒品种相比,这些SSR位点在多倍体上的多态性更高。之后进一步选取扩增效果好的8对引物鉴定14个欧洲草毒基因型,结果发现多态性和杂合性相对较低,无法将其中三个基因型区分开来。综上所述,ESTSSR在物种间的通用性不仅为不同物种间的标记开发提供了一种新的途径,也使物种间比较图谱的绘制更为便捷36ESTSSR技术的发展前景尽管ESTSSR标记的研究尚处于初级阶段,开发的时间还不长,使用的范围也有限,但EST数据资源的不断丰富使得利用EST库建立SSR标记成为一条简便快速而有效的途径,加上其本身所具有的独特优点,这种标记已经开始受到广泛的重视和应用目前,研究者在许多植物种类上已开展通过EST发展SSR标记的研究工作随着ESTSSR标记的不断开发和研究的进一步深入,相信这项技术将在果树的遗传作图、种质资源分析、品种鉴定及比较基因组学等研究领域有一定的应用前景,并为果树的遗传育种研究提供新的分子标记。1EST标记类型和特点11EST与EST计划表达序列标签EXPRESSEDSEQUENCETAG,EST是美国国立卫生研究院NATIONALINSTITUTEOFHEALTH,NIH的生物学家ADAM等于1991年提出的ADAMSETX1,1991EST是将MRNA在体外反转录成CDNA并克隆到载体构建成CDNA文库,大规模随机挑取CDNA克隆,对其5端或3端进行一步法测序后获得的长约300500BY的表达序列片段骆蒙等,2001EST技术是将MRNA反转录成CDNA并克隆到质粒或噬菌体载体构建成CDNA文库后,大规模随机挑选CDNA克隆,对其5端或3端进行一步法测序,所获序列与基因数据库中己知序列进行比较,从而获得对生物体生长、发育、代谢、繁殖、衰老死亡等一系列生理生化过程认识的技术HATEYETA1,1998。由于一段短的EST序列就可以反映出基因的性质,因此EST技术是发现新基因的好方法,逐渐引起了世界各著名实验室的重视,并相继开展了不同物种的EST计划。EST计划由美国科学家VENTER于1989年提出ADAMESETX1,1991,并首先应用于人类基因组研究,之后被广泛用于植物基因组研究。1998年8月由美国、澳大利亚、英国三国科学家发起,正式成立了国际小麦族EST协作组织INTERNATIONALTRITICEAEESTCOOPERATIVE,1TEC,拉开了国际麦类作物EST研究的序幕,共有12个国家的35个实验室注册参加了该研究计划HTTP/WHEATPWUSDAGOV/GENOME/PARTICIPANTS。注册成员将所获得的EST数据输入该组织的数据库,成员可以共享数据资源骆蒙等,20000由于DNA测序技术的进步,EST序列的数目也急剧增长。1991年各个公共数据库中的EST数目不足2000条邱咏梅等,200201993年NCBINATIONALCENTEROFBIOTECHNOLOGYINFORMATION建立T一个专门的EST数据库DBESTHTTP/NCBINLMNIHGOV/DBEST/INDEXHTML来保存和收集所有的EST数据。DBEST刚建立的时候,仅包括22,537个EST序列,来自7种不同生物徐鹏等,2003。到2006年10月NCBI数据库中的EST共有38,953,178条,其中小麦ESTS855,066条HTTP/WWWNCBI家蚕第12连锁群ESTSSR的信息分析微卫星MICROSATELLITEDNA标记又称SSRSIMPLESEQUENOEREPEATS标记或STRSIMPLETANDEMREPEAT标记,是近年来发展起来的第二代分子标记技术。SSR具有以下优点SSR标记在真核生物基因组中数量多且分布均匀;SSR标具有高度的多态性;SSR标记遵循孟德尔式遗传规律和共显性遗传模式,可鉴别杂合子和纯合子;SSR标记可利用PCR检测,需要的样品量少;一般检测到的是一个单一的多等位基因位点;SSR标记可以进行高度自动化分析;微卫星标记可作为序列示踪位点SEQUENCETAGGEDSITE,STS;SSR标记在相关物种中具有保守性和通用性。因此,SSR标记被认为是较理想的遗传标记之一而得到越来越广泛的应用。利用微卫星标记,科学工作者已经构建了人类、老鼠、狗、鸡和多种植物的遗传连锁图谱。1999年REDDY等报道了从家蚕基因组中分离出28个微卫星位点,用其中的15个微卫星标记对13个家蚕品种进一步分析微卫星标记的多态性。NAGARAJU等比较RFLP、RAPD、SSR、ISSR在家蚕中的运用,结果认为SSR最适合作家蚕连锁图谱。目前在家蚕中构建了包含518个SSR标记、覆盖34319CM的连锁图。应用SSR技术研究家蚕遗传多样性,寻找具有重要经济价值的基因资源,特别是用SSR标记构建家蚕高密度的遗传连锁图谱,定位有重要经济价值的基因,对选育高产优质蚕扮品种具有极为重要的意义。EST是CDNA序列的一部分,而后者正是MRNA反转录产物,其中蕴涵着基因表达的种种信息,例如不同生物体对密码子使用的偏性,转座子活动的线索,以及生物进化过程中留下痕迹,其中特别是一些单位点的突变信息SNP,因为这些突变直接或者间接影响着其翻译产物蛋白质的结构,从而影响其功能,这些为我们对基因功能乃至生物个体表现性如生物的品质性状的研究而言是必不可少的材料。根据建立SSR标记来源的序列性质的不同,SSR标记可分为GSSR标记和ESTSSR标记。但从基因组文库中开发SSR标记,由于需知道重复序列两端的序列信息,因此其开发有一定困难,费用也较高,这限制了其被广泛应用于研究。近年来,随着EST计划在不同物种间的扩展和研究内容的深入,在很多有重要经济价值的植物、动物和模式生物中都积累了大量的EST。可从公共数据库中下载这些EST序列,从中经电子筛选鉴别出SSR和SNP等,并可进一步开发成ESTSSR和ESTSNP等分子标记。利用EST开发的分子标记,比起一般的分子标记如RFLP,AFLP,RAPD和GSSR等有广泛的优势1具有较高的信息量;2通用性好;3开发简单,快捷,费用低。快速增长的EST数据为SSR标记的开发提供了丰富的来源,在大麦、黑麦、甘蔗、小麦、水稻、高羊茅、猕猴桃、葡萄、棉花、甘蔗、黑麦草、云杉等植物中都建立了ESTSSR标记,己有的研究表明其为一种有多方面利用价值的分子标记。截止2009年5月26日,NCBI数据库中已有245,901条家蚕ESTHTTP/WWWNCBINLMNIHGOV/DBEST/INDXHTML,但目前这些序列中的ESTSSR的情况还未明晰,更无利用这些序列来建立SSR标记的报道。这些EST是家蚕分子遗传研究的宝贵资源,为充分合理地利用它们并建立ESTSSR标记,在搜索出SSR后,有必要对SSR的频率、特点和长度等信息进行统计,以便进行全面分析和准确评价。故本研究将对现有家蚕第12连锁群中的ESTSSR信息进行全面分析,以期了解家蚕EST资源的特性,为利用家蚕EST建立SSR标记和探索其在家蚕遗传育种中的应用奠定基础。1材料与方法11家蚕EST来源本文所分析的家蚕EST来自HTTP/SILKWORMSWUEDUCN/SILKDB,共245,901条。用已筛选的与耐氟基因连锁的SSR标记(S1214、S121201),搜索SILKWORMGENOME数据得到SCAFFOLD2993,下载SCAFFOLD2993的所有数据共计688758BP,再与245,901条EST比对,选择比对的长度不小于该EST的50,一致性90,得1801条相关EST。12EST前处理采用ESTTRIMME软件HTTP/PGRCIPKGATERSLEBENDE/MISALDOWNLOAD/ESTRIMMERP1除去5端或3端50BP的POLYT或POLYA以及那些长度小于200BP的EST序列;对于长度大于700BP的EST则保留其5端400BP。13去冗余聚类前处理后的EST通过软件PHRAPGORDONETAL,1998;GORDONETAL,2001进行片段重叠群分析和聚类。拼接时设定的初始装配参数为最小匹配碱基数MISMATCH为20,最小分值MINSCORE为40。对错误拼接序列设置比较高的装配参数再次进行拼接、判别,共进行了3次。14聚类拼接序列的注释运用BLASTX程序在EST数据库中对处理过的的EST数据进行同源性比较,参数比对分值SCORE为大于等于80,且序列同一性IDENTITY大于等于35的序列。15家蚕ESTSSR的发掘利用REPEATMASKER程序HTTP/REPEATMASKERORG/CGIBIN/WEBREPEATMASKER,结合人工搜寻,对1589条无冗余EST中所含有的SSR进行查找。搜索的单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重复次数分别为13次、6次、5次、3次、3次、3次,包括完全重复、不完全重复和低复杂重复只存在于单核苷酸重复和二核苷酸重复中三种类型。2结果与分析21家蚕EST的碱基信息表211589条无冗余家蚕EST的碱基信息TABLE21THEBASEINFORMATIONOF1589NONREDUNDANTESTS用软件DNATOOLS6对己下载的1989条家蚕EST进行分析,其总长为96179KB,GC含量为4584,平均长度为484BP。经利用软件STADENPACKAGE做聚类和拼接处理后,共得到1589条无冗余家蚕EST,共计73454KP,平均长度为462BP,其碱基组成情况见表21。22家蚕ESTSSR频率在搜索的1589个EST中,共发现了分布于246个EST中的281个SSR,占全部EST的1548,这表明家蚕EST中的SSR数量很丰富。在246条含有SSR的EST中,只含有1个SSR的有212条,含有2个SSR的EST有33条,含3个SSR的EST有1条。在出现2个SSR的33条EST中,有8条序列两SSR串联出现,有2条序列两SSR之间小于10BP。从分布情况来看,平均每261KB就出现1个SSR,但不同重复类型间差异很大表22。家蚕的ESTSSR类型也较为丰富,一至六核苷酸重复都能看到,但频率各不相同表22。二核苷酸重复最为常见,共有182个,在全部EST中的出现频率为1150,所占SSR比例达到6477;其次是三核苷酸重复和单核苷酸重复,出现频率分别为308和176;而四、五、六核苷酸重复在家蚕EST中的出现频率较低,共计只有138,占SSR的比例不足7。可见,在家蚕ESTSSR中,二核苷酸重复占主导。表22SSR在家蚕无冗余EST的出现频率TABLE22OCCURRENCEFREQUENCVOFSSRSINASETOFNONREDUNDANTTEAESTS23家蚕ESTSSR的特性在搜索出的家蚕ESTSSR中,共观察到30种重复基元表23。其中,单核苷酸的重复基元只有A/T,未见G/C重复;二、三、四、五、六核苷酸重复基元分别有3,8,5,9,4种,尽管四、五、六核苷酸重复基元类型占重复基元总数的一半以上,但出现频率很低。从出现的频率来看,各种不同的重复基元出现最多的是AG/CT,其次分别是AT和A/T重复;其它较多的重复基元有AC/TG,ATG/CAT,CCA/TGG,CTG/GAC,TTC/GAA,AGG/CCT,CAA/TTG,都不少于5次。二核苷酸重复基元中,AG/CT出现的次数最多,占二核苷酸重复的69图21;在三核昔酸重复基元中,TTC/GAA出现最多11个,占三核苷酸SSR的225图22。从表23中所列的不同重复基元可以看出,家蚕ESTSSR中没有单核苷酸G/C重复基元,二核苷酸重复中也未出现GC重复基元,三核苷酸重复中CCG/GGC重复基元的数目也较少,说明家蚕EST中缺乏连续的GC碱基区域;相比而言,AT连续区域则较多。表23家蚕无冗余EST的SSR重复的长度和性质TABLE23THESSRSLENGTHANDATTRIBUTEINASETOFNONREDUNDANTTEAESTS从各重复基元的重复特性来看,家蚕ESTSSR分完全重复、不完全重复、低复杂性重复三类,分别有123,84,74个表23。总体上完全重复多于不完全重复和低复杂重复,但在三、四、五、六核苷酸重复中,不完全重复要多于完全重复。只有AG/CT,A/T和AT这3种重复基元中出现低复杂重复,且AT重复绝大多数是低复杂的,占AI,重复总数的91744/48,占全部低复杂SSR的近60C44/74O家蚕ESTSSR平均长度为3306BP,但不同SSR的长度却有很大差异,最短为14BP而最长达到了159BP。低复杂重复SSR的平均长度大于完全重复和不完全重复SSR,不完全重复SSR的平均长度大于完全重复SSR在完全重复和不完全重复SSR中,单核苷酸和二核苷酸SSR的平均长度均小于30BP,而其它四种核苷酸则大于30BP具体数据未列出。在全部的完全重复SSR的中,长度都未超过33BP。3讨论家蚕ESTSSR的出现频率高,重复基元类型也较为丰富。在1548的家蚕无冗余性EST中搜索到281个SSR,平均长度为3306BP,平均分布频率是1/261KB,均高于水稻、小麦、黑麦、大麦、番茄、棉花、拟南芥、大豆和杨树等植物5,充分表明家蚕中ESTSSR非常丰富。当采用不同的搜索SSR长度标准时,ESTSSR的分布频率及特点会变化很大。为和一些其它的物种用同一标准比较,本研究又以SSR最小长度不小于20BP为检出标准对家蚕ESTSSR的频率重新分析。其分布频率由1/261KB降至1/51KB,但仍高于水稻、黑麦和大豆三个物种分别是1/1181KB,1/1742KB,1/2380比6家蚕含SSR的EST比例则由1548降至7,依然高于大麦、水稻、黑麦分别是5,6,47。由此比较也不难看出,家蚕EST中含有非常丰富的SSR。与已经报道的其它物种相比,家蚕ESTSSR既与它们有相似性,又具有自身的特点。从目前报道的结果来看2、51,大多数植物的ESTSSR都是以三核苷酸重复为主,而家蚕ESTSSR则以二核苷酸重复为主,与对中国对虾8猕猴桃9、杏树和桃树10的研究结果相一致。家蚕ESTSSR中二核苷酸重复以AG/CT重复为主,与多数植物中已报道的情况相同5。家蚕ESTSSR的三核营酸重复以AAG/TTC重复最多,与GAO等7对大豆和CURDLE等11对拟南芥的报道一致,进一步验证了GAO等7认为在双子叶植物中AAG/TTC重复丰度很高的推测。这些占优势的重复基元可能与其编码相应蛋白质的使用频率较高有关,如在拟南芥中就存在此情形12。若ESTSSR数目足够大和无偏倚性,四种不同的碱基随机组合,将可能产生2种单核苷酸、4种二核苷酸、10种三核苷酸、33种四核苷酸、102种五核苷酸和350种六核苷酸基本重复基元类型7。分析的结果显示,1种单核苷酸基元G/C,1种二核苷酸基元GC,2种三核苷酸基元AGT/ACT,AGC/GCT和大多数的四、五、六核苷酸重复基元在家蚕ESTSSR均未出现,表现出明显的偏倚性。但是,目前可获得的家蚕EST数量还不足2000条,所出现碱基偏倚性是家蚕ESTSSR的真实反映,还是由于分析EST的数量较少,或者二者兼而有之,还需要进一步研究。但根据对拟南芥、杏树、桃树10、水稻、玉米、大豆13的研究,发现这些植物中也未出现GC重复,而在小麦13中只以很低的频率009/100KB出现。因此可推测,这种SSR的碱基偏倚性似乎在大多数植物中都存在,且出现与否与物种有关。在所构建的CDNA文库中,高表达基因的转录本过于丰富,测序后将产生冗余REDUNDANCYEST;随机或鸟枪法测序也产生了很多冗余的EST;再者,数据库中的EST是由不同的研究者登记的,也会导致同一表达基因的EST重复出现。冗余的数据往往是无用的,反而由于可能存在大量的错误而难以处理,对分析SSR信息也会产生重要的影响。因此,为了准确分析和反映家蚕基因表达部分序列中SSR的信息,本研究利用STADENPACKAGE软件进行处理,在1989条家蚕原始EST中共得到1589条无冗余EST,为进一步明确家蚕ESTSSR的信息提供了保障。在使用STADENPACKAGE软件聚类去冗余时,应尽量注意减少漏拼和错拼。己有的研究结果表明,ESTSSR标记在遗传作图、资源多样性、功能基因的发现与定位、物种起源与进化、通用性和比较基因组学研究等方面有重要的利用价值,是一种有效的分子标记2、5。与其它基于DNA的分子标记相比,ESTSSR标记具有其显著的优点141ESTSSR可以从EST数据库中得到,不需额外费用,而建立基因组SSR成本很高;2ESTSSR标记可以检测出基因表达区域的变化,是真正与性状连锁的标记;(3具有通用性,一经建立可以用于相近物种,进行比较基因组学研究。本研究明确了家蚕ESTSSR的基本特性,同时也表明家蚕EST中含有丰富的SSR,这对家蚕ESTSSR标记建立及其在家蚕遗传育种中的应用有重要的意义。参考文献7REDDYKD,ABRAHAMEGANDNAGARAJUJMICROSATELLITESINTHESILKWORM,BOMBYXMORIABUNDANCE,POLYMORPHISM,ANDSTRAINCHARACTERIZATIONJGENOME1999,421057106560NAGARAJUJETALCOMPARISONOFMULTILOCUSRFLPSANDPCRBASEDMARKERSYSTEMSFORGENETICANALYSISOFTHESILKWORM1,BOMBYXMORIJHEREDITY2001,8658859788OSTRANDERE,PJONG,JRINEETALCONSTRUCTIONOFSMALLINSERTGENOMICDNALIBRARIESHIGHLYENRICHEDFORMICROSATELLITEREPEATSEQUENCESJPROCNATLACADSCI1992,893419342367DIBC,FAURES,FIZAMESCETALACOMPREHENSIVEGENETICMAPOFTHEHUMANGENOMEBASEDON5264MICROSATELLITESJNATURE1996,38015215468DIETRICHWF,MILLERJ,STEENRETALACOMPREHENSIVEGENETICMAPOFTHEMOUSEGENOMEJNATURE1996,38014915269OSTRANDEREA,SPRAGUEJF,RINEJIDENTIFICATIONANDCHARACTERIZATIONOFDINUCLEOTIDEREPEATCANMARKERSFORGENETICMAPPINGINDOGJGENOMICS1993,1620

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论