




已阅读5页,还剩74页未读, 继续免费阅读
(植物学专业论文)禾本科cns—aflp标记开发与通用性检测.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 本研究利用生物信息学的基础,采用g e v o ( g e n o m ee v o l u t i o n a n a l y s i s ) 软件对来 自玉米、小麦、高粱、水稻和珍珠粟5 种作物的1 2 9 个基因进行了c n s 发掘,1 2 9 个基 因中有1 1 1 个基因来自于玉米,1 2 个基因来自于小麦,3 个基因来自高梁,1 个基因( t b l ) 来自于珍珠粟,2 个基因来自于水稻。在c n s 共线性较好的有7 9 个基因,3 7 个为编码 酶的基因,c n s 共线性百分率为5 0 6 4 ;2 7 个为编码调控蛋白的基因,c n s 共线性百 分率为4 6 5 0 ;1 5 个为其他类型的基因,c n s 共线性百分率为7 0 1 1 。c n s 在禾本科 作物中较高的共线性有利于禾本科作物比较遗传学的研究,而且成为本研究开发禾本科 通用引物的理论依据。 在分析这些基因的c n s 数量和共线性程度的基础上,选择其中共线性好的p h y b 、 p g p l 、t b l 、1 9 2 等基因为模板,设计了c n s - - c n s 和c n s - - e x o n 不同类型的引物共1 2 4 对。后期又从c o g e 上下载的包含1 6 5 7 1 对高粱和水稻同源序列的数据,利用g e v o 发 掘这些序列中的c n s ,选取共线性较好的序列,以高粱序列为模板设计了8 6 对c n s c n s 引物。 利用来自禾本科不同亚科的l o 种重要农作物的基因组d n a 为模板,检验了这2 1 0 对引物的特异扩增性及通用性,扩增产物及其酶切片段的多态性表现。结果表明,所设 计的引物中有7 4 对在禾本科不同物种中具有较好的通用性,扩增产物及其酶切片段表 现了较丰富的多态性,其他引物也表现了不同程度的跨物种应用。 筛选出的引物又在狗尾草属材料中进行了检测,检测的结果表明,这些引物不但在 禾本科不同属的材料中通用,而且在禾本科同一属的不同种间能够通用,而且效果更好, 这样可以利用c n s 引物进行种间进化分析。 c n s - - a f l p 标记不仅能分析同一基因不同部位在进化过程中所承受的选择压力有 何不同,还能分析不同基因在进化过程中的保守性,是研究生物进化的有力工具。c n s a f l p 最大特点是利用已知物种中已克隆分析的基因来设计引物,在较大的范围( 如 禾本科) 进行跨物种应用,这对遗传和基因组研究较薄弱的种属提供了极大的方便。同 s s r 标记相比,c n s - - a f l p 在标记开发上省时省功且基本没有投入,利用公共数据库 的信息即可。 本结果说明c n s - - a f l p 是一种可行的新型分子标记,对于无特异标记开发的物种 i i i 进行遗传多样性和进化研究,是一种可靠且简便经济的办法,也对禾谷类作物比较遗传 学研究有促进作用。 关键词:禾本科作物共线性c n 旷a f l p 分子标记 a b s t r a c t u s i n gt h eb i o i n f o r m a t i cs o t l w a r eo fg e v o ( g e n o m ee v o l u t i o na n a l y s i s ) ,12 9g e n e s e q u e n c e sf r o mm a i z e ,w h e a t ,s o r g h u m ,f l e ea n dp e a r lm i l l e tr e s p e c t i v e l yw e r ec o n d u c t e dt o i d e n t i f ym e i rc n s ( c o n s e r v e dn o n c o d i n gs e q u e n c e s ) c o n t a i n i n gp a t t e r n o ft h e12 9g e n e s , 111g e n e sa r ef r o mm a i z e ,12g e n e sa r ef r o mw h e a t ,3g e n e sa r ef r o ms o r g h u m ,o n eg e n e ( t b1 ) i sf r o mp e a r lm i l l e ta n d2g e n e sa r ef r o md e e t h e r ea r e7 9g e n e sh a v eah i g hc n s s y n t e n y , o fw h i c h3 7g e n e sa r ee n z y m ec o d i n gg e n e sa n dt h e i rp e r c e n t a g eo ft h ec n ss y n t e n yo n a v e r a g ei s5 0 6 4 ;2 7g e n e sa r es t r u c t u r a lp r o t e i nc o d i n gg e n e sa n dt l l e i rp e r c e n t a g eo ft h e c n ss y n t e n yo na v e r a g ei s4 6 5 0 ;15g e n e sa r eo t h e rt y p e s ,t h ep e r c e n t a g eo ft h ec n s s y n t e n yo na v e r a g ei s7 0 11 t h eh i g hs y n t e n yo fc n s i no r t h o l o g so fc e r e a lc r o p si si n f a v o ro ft h ec o m p a r a t i v es t u d yo fc e r e a lc r o p s ,i ta l s oe a t a b l i s h e dt h et h e o r e t i cb a s ef o rt h e d e v e l o p m e n to fap a n - g r a s sm a r k e r ss y s t e m b a s e do nt h e i rc n sd e n s i t ya n dd e g r e eo fs y n t e n y , 2 7g e n es e q u e n c e si n c l u d i n gp h y b , p g p l ,t b la n d1 9 2w e r ec h o s e na st e m p l a t e st od e s i g np r i m e r sb a s e do nc n s a t o t a lo f1 2 4 p a i r so fp r i m e r s ,i n c l u d i n gc n s - - c n sa n dc n s - - e x o nc o m b i n a t i o n s ,w e r ed e s i g n e d f o r m o r ec n s - - a f l pp r i m e r sd e s i g n i n g , w ed o w n l o a dad a t a b a s ei n c l u d i n g1 6 5 7 1p a i r so f h o m o l o g o u ss e q u e n c e sf r o mc o g e ,i d e n t i f i e dm e i rc n sf r o mt h eh o m o l o g o u ss e q u e n c e s u s i n gg e v od e v e l o p ,s e l e c t e ds e q u e n c e sw h i c hh a v eah i g hs y n t e n y , a n du s e ds o r g h u mg e n e s a st e m p l a t e sd e s i g n e d8 6p a i r so fc n s - - c n sp r i m e r s t e ni m p o r t a n tc e r e a lc r o p s ,w h i c hr e p r e s e n td i f f e r e n ts u b f a m i l i e so ft h eg r a s ss p e c i e s , w e r ec h o s e nt ot e s tt h ef e a s i b i l i t ya n dt h ea m p l i f i e df r a g m e n tl e n g t hp o l y m o r p h i s mo ft h e d e s i g n e dp r i m e r s t h er e s u l ts h o w st h a t7 4p a i r so ft h e2 10p r i m e rp a i nd e s i g n e dc a nb eu s e d a sp a n - g r a s sp r i m e r s ,a n dm o s to t h e r sc a nb eu s e di ns o m eo fc e r e a lc r o p s t h ea m p l i f i e d f r a g m e n t sa n dt h e i re n z y m ed i g e s t e dp r o d u c t sw e r ea l s op o l y m o r p h i ca m o n gd i f f e r e n t s a m p l e s t h e n ,w eu s et h es e t a r i am a t e r i a l st ot e s tt h ep r i m e r sw h i c hs c r e e n e do u tf r o ma l lo ft h e p r i m e r s t h er e s u l ts h o w st h a tt h ep r i m e r sn o to n l yc a r tb eu s e da sp a n - g r a s sp r i m e r s ,b u ta l s o c a nb eu s e di nt h es a m ec a t e g o r yo fd i f f e r e n ts p e c i e s ,a n dh a v eab e t t e rr e s u l t ,t h e r e f o r e ,w e v c a nu s et h ec n s p r i m e r sa n a l y z et h ee v o l u t i o nb e t w e e ns p e c i e s t h em o l e c u l a rm a r k e r so fc n s - - a f l pn o to n l yc a na n a l y z et h ed i f f e r e n c e so ft h e s e l e c t i o np r e s s u r ei ne v o l u t i o nb e t w e e nd i f f e r e n tp o s i t i o n so fh o m o g e n e i t yg e n e ,b u ta l s oc a l l a n a l y z et h ec o n s e r v a t i o nb e t w e e nd i f f e r e n tg e n e si ne v o l u t i o n ,s oc n s - - a f l p i sap o w e r f u l t o o lf o rs t u d y i n gb i o l o g i c a le v o l u t i o n t h ec h a r a c t e r i s t i co fc n s a f l pi st h a tp r i m e rp a i r s w e r ed e s i g n e da c c o r d i n gt oe x i s t e dg e n e sa n a l y z e di nk n o w ns p e c i e sa n dt h e yc a l la l s ob e t r a n s f e r a b l yu s e di no t h e rs p e c i e s c n s - - a f l pi ss u i t a b l ef o rg e n e t i cd i v e r s i t ya n d e v o l u t i o n s t u d yo ft h o s es p e c i e st h a tl a c ks s ra n do t h e rs p e c i f i cm a r k e r s ,a n dt h em e t h o dc a l la l s oh e l p t h ec o m p a r a t i v es t u d yo fc e r e a lc r o p s t h i sr e s e a r c hi n d i c a t e dt h a tc n s - - a f l pi san e wk i n do fm o l e c u l a rm a r k e r , w h i c hi s s u i t a b l ef o rg e n e t i cd i v e r s i t ya n de v o l u t i o ns t u d yo ft h o s es p e c i e st h a tl a c ks s ra n do t h e r s p e c i f i cm a r k e r s ,a n dt h em e t h o dc a n a l s oh e l pt h ec o m p a r a t i v es t u d yo fc e r e a lc r o p s k e y w o r d s :c e r e a l c r o p ss y n t e n y c n s - - a f l pm o l e c u l a rm a r k e r s v i 学位论文原创性声明 本人所提交的学位论文禾本科c n s a f l p 标记开发与通用性检测,是在导师 的指导下,独立进行研究工作所取得的原创性成果。除文中已经注明引用的内容外,本 论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出重要 贡献的个人和集体,均已在文中标明。 本声明的法律后果由本人承担。 指鬻藩磊勿 砷年户月加么刀 学位论文版权使用授权书 本学位论文作者完全了解河北师范大学有权保留并向国家有关部门或机构送交学 位论文的复印件和磁盘,允许论文被查阅和借阅。本人授权河北师范大学可以将学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保 存、汇编学位论文。 ( 保密的学位论文在年解密后适用本授权书) 警作者( 签名) 训,稃1 缈7 年夕月秘日川。 指导铡币( 签名) : 舻7 年朋2 琴日 i i 以叫 j2 嗽 ) 衽珠签月 者步 俐年 史1, 论缈 引言 分子标记是生物进化关系分析、基因定位、基因克隆、基因功能分析和标记辅助育 种的基础。在众多类型的分子标记中,s s r 等特异引物p c r 分子标记,具有简捷、稳 定而准确可靠的特点,已成为目前分子标记的主流,并广泛应用在各类作物的分子生物 学和功能基因组研究中。但s s r 标记的引物设计是以简单重复序列两端的编码区为模 板,一方面需要预先知道该序列,开发费时费工投入大;另一方面基因编码区物种特异 性强,导致s s r 标记跨物种应用受到限制,如从水稻( o r y z as a t i v a ) 中开发的s s r 很 难在玉米( z e am a y s ) 、小麦( t r i t i c u ma e s t i v u m ) 和谷子( s e t a r i ai t a l i c a ) 等其他作物 中利用。 特异引物p c r 分子标记的发展趋势之一是引物的通用性,即设计一套引物可在不 同物种、不同属、甚至不同科之间共用,公用的范围越宽,效率越高,为遗传研究带来 的方便就越多,同时提供的信息越系统、越深入,就越便于比较,这在禾本科植物 ( g r a s s e s ) 比较遗传学研究中尤为突出。c n s ( c o n s e r v e dn o n c o d i n gs e q u e n c e s ,非编 码保守序列) 的发现为开发这种跨物种应用的特异p c r 标记提供了理论基础。c n s 是 指同源物种中存在于非编码区的保守序列,已有研究表明其保守程度高于编码区,表现 了跨物种的高度保守,而两c n s 之间、以及c n s 与编码区之间的非保守区则为多态性 提供了基础,由此可以建立一种新的跨物种应用的特异标记羽s a f l p 标记。 禾本科包括小麦、水稻、玉米、谷子、高粱、珍珠粟等重要粮食作物和多种主要牧 草、农田杂草等,人类食物能量的7 0 来自禾本科,其经济和生态价值突出。禾谷类作 物比较遗传学研究已证明它们是单起源类群,在5 0 0 0 到6 0 0 0 万年是一个原始共同祖先, 其物种同源性为禾本科c n s 发掘和c n s - - a f l p 开发奠定了基础。本研究以发掘禾本 科c n s 为基础,设计c n s - - a f l p 标记引物,并检测这些引物的通用性和多态性表现, 试图验证建立禾本科通用c n s - - a f l p 标记的可行性。 1 文献综述 1 1 分子标记概述 d n a 分子标记是d n a 水平上的遗传多态性的直接反映,是继形态学标记、细胞学 标记及生化标记之后,在近二十年来广泛应用的一种新的遗传标记,其多态性表现为核 酸序列的差异。d n a 分子标记具有不受环境和生长时期限制、标记数量大、稳定可靠等 众多优点,是遗传标记应用最多的,也是发展的方向。 d n a 分子标记大多以电泳谱带的形式表现个体之间的d n a 差异,常也称为d n a 指 纹。目前,d n a 标记已广泛地应用于种质资源研究、遗传图谱构建、目的基因定位和分 子标记辅助育种等多个方面。依据d n a 水平上多态性的检测手段,d n a 分子标记可分 为四大类:( 1 ) 基于d n a d n a 杂交的分子标记技术。( 2 ) 基于p c r 技术的分子标记技 术。( 3 ) 基于限制性酶切和p c r 技术的d n a 标记,如a f l p 。( 4 ) 基于单核苷酸多态性 的d n a 标记,如s n p 标记,它是由d n a 序列中因单个碱基的变异而引起的遗传多态性【1 1 。 1 1 1 基于d n a - - d n a 杂交的分子标记技术 此类标记技术是利用限制性内切酶解及凝胶电泳分离不同的生物d n a 分子,然后 用经标记的特异d n a 探针与之进行杂交,通过放射自显影或非同位素显色技术来揭示 d n a 的多态性,其中最具代表性的是i 强l p ( r e s t r i c t i o nf r a g m e n tl e n g t hp o l y m o r p h i s m s ) 标记。 r f l p 标记 r f l p ( r e s t r i c t i o nf r a g m e n tl e n g t hp o l y m o r p h i s m s ) 出现最早,也称为第一代d n a 分 子标记,r f l p 技术的原理是检测d n a 在限制性内切酶酶切后形成的特定d n a 片段的大 小。此技术包括以下基本步骤:d n a 的提取、用限制性内切酶酶切d n a 、用凝胶电泳 分开d n a 片段、把d n a 片段转移到滤膜上、利用放射性标记的探针显示特定的d n a 片 段( 通过s o u t h e r n 杂交) 和分析结果。r f l p 位点的多态性源自于点突变、插入、缺失或置 换等,在变性梯度胶( d g g e ) 上电泳,r f l p 分析可检测到仅几个碱基对差异的d n a 多态性【2 1 。r f l p 是反应d n a 差异的标记,而且这种差异是可遗传的,所以r f l p 是生物 的遗传标记。 r f l p 的等位基因具有共显性特点,r f l p 标记位点数量不受限制,通常可检测到的 基因座位数为l 4 个【3 1 。r f l p 技术的缺点主要是克隆可表现基因组d n a 多态性的探针 2 较为困难,实验操作较繁琐,检测周期长,成本费用高【1 1 ,而且对d n a 质量要求高,需 要量大,操作复杂,通常要接触放射性。 1 1 2 基于p e r 技术的分子标记技术 常用的主要包括r a p d ( r a n d o m a m p l i f i e dp o l y m o r p h i s md n a ,随机扩增的多态性 d n a ) ,s s r ( s i m p l es e q u e n c er e p e a t ,简单序列重复) 又称微卫星( m i c r o s a t e l l i t e ) ,i s s r ( i n t e r - s i m p l es e q u e n c er e a p e a t sp o l y m o r p h i s m ,简单序列重复间区) 【4 】。 r a p d 标记 随机扩增多态性d n a ( r a n d o m l ya m p l i f i e dp o l y m o r p h i cd n a ,r a p d ) 标记技术是 1 9 9 0 年由w i l l i a m s 和w e l s h 等人利用p c r 技术发展的检测d n a 多态性的方法【5 ,6 1 。 r a p d 基本原理是利用随机引物( 一般为8 , - 1 0 b p ) 通过p c r 反应非定点扩增d n a 片段, 然后用凝胶电泳分析扩增产物d n a 片段的多态性,扩增片段多态性便反映了基因组相 应区域的d n a 多态性 6 1 。r a p d 的优点是:技术简单,检测迅速:只需少量的d n a 样 品;不依赖于种属特异性和基因组结构,一套引物可用于不同生物基因组分析;成本较 低。r a p d 存在的缺点:是显性标记,不能鉴别杂合子和纯合子;存在共迁移问题,不 能分开长度相同但碱基序列不同的d n a 片段;稳定性和重复性差 7 1 。 s s r 标记 s s r 即简单重复序列( s i m p l es e q u e n c er e p e a t ,s s r ) 或微卫星序列( m i c r o s a t e l l i t e , m s ) ,s s r 标记是利用真核生物基因组中存在的大量串联重复序列( 微卫星序列) 来设 计引物,通过p c r 扩增串联的重复序列,依据微卫星寡核甘酸的重复次数在同一物种 不同基因型间的差异,揭示长度多态性i s , 9 1 。 s s r 作为一种应用最多的分子标记,广泛存在于整个基因组中,分布均匀,所需 d n a 量少,且呈共显性,并具有多态性丰富、遵循孟德尔分离定律、共显性遗传、易 于快速检测等特点,可应用于基因定位、遗传作图、遗传多样性分析、品种鉴定、种质 资源保存利用等研究中【1 1 。但是s s r 标记必须依赖测序设计引物,所以开发成本高、工 作量大【刀。 i s s r 标记 i s s r ( i n t e r - s i m p l es e q u e n c er e p e a t ) 标记技术是由z i e t k i e w i c z 等( 1 9 9 4 ) 提出的, 该技术检测的是两个s s r 之间的一段短d n a 序列上的多态性【1 0 1 。i s s r 标记技术利用 真核生物基因组中广泛存在的s s r 序列设计与其结合的引物,对两个相距较近、方向相 反的s s r 序列间的d n a 区段进行扩增。一般在引物的3 或5 端加入2 4 个嘌呤或嘧 啶碱基,对s s r 座位筛选,使最终扩增出的i s s r 片段不致太多,i s s r 技术所用p c r 引物长度在2 0 个核苷酸左右,可采用与常规p c r 相同的反应条件,稳定性比r a p d 好, 在所用两端引物中,可以一个为锚定引物,另一个为随机引物【7 , 1 0 。i s s r 标记技术呈孟 德尔式遗传,具显性或共显性。i s s r 标记技术自发明以来广泛应用于遗传图谱的构建、 q t l 分析、遗传多样性分析、品种鉴定等多个研究领域【1 1 , 1 2 】。 1 1 3 基于限制性酶切和p c r 技术的d n a 标记 p c r 与限制性酶切技术结合的分子标记分为两种类型:一种是对限制性酶切片段的 选择性扩增,如a f l p 标记;一种是对p c r 扩增片段的限制性酶切,如c a p s 标记。 a f l p 标记 a f l p ( a m p l i f i e df r a g m e n tl e n g t hp o l y m o r p h i s m ,扩增片段长度多态性) 是其中最 重要的一类,是由荷兰科学家z a b e a u 和v o s 发展起来的一种检测d n a 多态性的方法1 1 3 , 1 4 1 。 a f l p 技术的基本原理是首先设计针对某种限制性内切酶的通用接头( a d a p t o r ) 以及可 与接头序列和限制性内切酶酶切位点序列配对的专用引物,然后将基因组d n a 用限制性 内切酶进行酶切,用专用引物扩增连接后的限制性片段的混合物,扩增结果通过电泳显 示。a f l p 技术是在r f l p 和r a p d 的基础上发展起来的,既克服了r f l p 的多态性低和 r a p d 的稳定性不好的缺点,又具有r f l p 的可靠性和r a p d 的方便性,被认为是较为有 效的分子标记【1 4 】。 a f l p 是r f l p 与p c r 相结合的产物,结合了r f l p 和r a p d 两种技术的优点,具 有分辨率高、稳定性好、效率高的优点。但它的技术费用昂贵,对d n a 的纯度和内切 酶的质量要求很高。尽管a f l p 技术诞生时间较短,但可称之为分子标记技术的又一次 重大突破,被认为是目前一种十分理想、有效的分子标记【1 5 ,1 6 1 。 c a p s 标记 酶切扩增片段多态性序列( c l e a v e da m p l i f i e dp o l y m o r p h i s ms e q u e n c e ,c a p s ) ,又称 为p c r i 强l p ,是p c r 与r f l p 相结合的一种方法,当p c r 扩增产物间无多态性时采 用限制性内切酶酶切产物,以进一步揭示样品间的多态性【1 7 1 。其引物通常来自基因库染 色体组d n a 克隆、c d n a 克隆或r a p d 谱带克隆的测序。c a p s 标记是一种共显性的 标记,优点是避免了r f l p 分析中膜转印这一步骤,又保持了r f l p 分析的精确性【1 8 】。 另外,由于很多限制性内切酶均可对扩增d n a 酶切,所以检测到多态性机会较大【1 9 】。 1 1 4 基于单核苷酸多态性的d n a 标记一s n p 标记 单核苷酸多态性( s i n g l e n u c l e o t i d ep o l y m o r p h i s m ,s n p ) 标记被称为“第三代d n a 遗 4 传标记 ,主要是指在基因组水平上由单个核苷酸的变异所引起的d n a 序列多态性,由 转换、倒换、插入、缺失等形式引起。1 9 9 8 年,w a n g 等利用d n a 芯片技术对人类基因 组的2 3 m bd n a 进行检测,鉴别出3 2 4 1 个候选s n p ,并将其中2 2 2 7 个s n p 定位到了遗传 图谱中【2 0 1 。d n a 芯片技术是目前检测s n p 最为有效的方法。s n p 标记具有以下优点:( 1 ) 它在基因组中分布广泛;( 2 ) 与s s r 相比,s n p 高度稳定;( 3 ) 易于进行自动化分析, 缩短了研究时间。虽然s n p 标记技术和d n a 芯片技术在植物中的研究刚起步,但是也将 在植物基因组研究领域发挥重要的作用【2 l 】。 d n a 分子标记技术和基因组作图研究一直处于飞速发展中,随着分子生物学理论 与技术的快速发展,必将不断开发出分析速度更快、信息量更大、准确度更高、成本更 低的分子标记技术。虽然目前有些分子标记适用于各种生物,但是扩增产物没有特异性, 使得其在不同物种( 特别是远缘物种) 间缺乏可比性,不能作为不同物种间的通用型分 子标记。因此本研究重在开发一种新型的特异的,而且在禾本科中通用的分子标记,即 c n s a f l p 。 1 2 非编码保守序列( c o n s e r v e dn o n c o d i n gs e q u e n c e s ,c n s ) 概述 c n s ( c o n s e r v e dn o n c o d i n gs e q u e n c e s ,非编码保守序列) ,有的文章中也称之为 c n c n ( c o n s e r v e dn o n c o d i n gn u c c l e o t i d e ) 2 2 1 是指基因序列中非编码区在同源物种中 保守的序列。c n s 最早是在人一鼠同源基因比对中发现的,目前已有工作证明c n s 在 鱼类、果蝇、拟南芥、禾本科等生物中也广泛存在。在生物的基因组中,编码蛋白质的 序列仅占总序列的很少一部分,我们暂时还不知道其它部分的功能或对这部分序列的了 解还很不够。分析非编码区d n a 序列需要大胆的想象和崭新的研究思路和方法。d n a 序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。 1 2 ic n s 的发现 l o o t s ( 2 0 0 0 ) 等【2 3 】通过人一鼠序列比对鉴定调控元件时检测到了9 0 个c n s ,其 中有1 0 个c n s 在除人和鼠之外的至少两种哺乳动物中是高度保守的,9 0 个c n s 的长 度不等,最大的c n s 长度为4 0 1 b p ( b a s ep a i r s ) 。 k a p l i n s k y 和b r a u n 2 4 】首次将c n s 应用于禾本科作物的研究中,通过比较水稻和玉 米的l i g u l e s sl ( e n c o d e sam e m b e ro ft h es q u a m o s ap r o m o t e rb i n d i n gp r o t e i n ( s b p ) f a m i l y ) 、 w x l 、a d h l ( a l c o h o ld e h y d r o g e n a s e ) 、1 9 3 o s h 6 等基因,发现植物基因中也存在c n s , 只是长度较哺乳动物的短,频率也低。植物c n s 的碱基序列和不同c n s 的排列顺序也 5 表现保守性,碱基的同源性在9 0 以上甚至更高,而其同一基因编码区的同源性为7 0 左右,说明c n s 的保守程度远高于编码序列。 在生物的进化过程中,由于蛋白质结构功能的限制,编码蛋白的d n a 区域表现了序 列的保守性。过去五年的研究发现,一些非编码序列也表现了功能的限制。通过种间直 向同源基因( o r t h o l o g s ) 的比对可以检测到除外显子以外的保守区,这种非编码d n a 区域在亲缘关系较远的生物体间表现很强的序列同源性,被称为“系统发生足迹 ( p h y l o g e n e t i cf o o t p r i n t s ) 2 s 】。系统发生足迹技术认为:由于环境选择的压力,基因上 的功能因子比那些非功能序列进化的速率慢。因此,对于同源物种而言,那些保守区域 将成为功能调控因子的主要侯选者。因此,系统发生足迹被用来检测人类【2 3 】,酵母【2 6 】, 以及拟南芥【2 4 】启动子中包含调控元件的c n s 。 当使用遗传距离较远的相关物种的基因组d n a l k , 较时,在这些序列中保守的功能元 件能够与非编码序列区分开来,所以系统发生足迹的效率就更强 2 6 2 7 ,2 8 2 9 1 。对于系统发 生足迹来说,禾谷类植物基因组是植物基因组中最稳定的。禾谷类植物基因组表现了高 度的共线性【3 0 3 1 】以及编码序列的同一性,这促进了直向同源基因序列的鉴定。然而,非 编码序列几乎不表现从头到尾的保守性,这表明处于非自然选择压力下的序列改变的积 累已有很长一段时间了。主要的禾谷类作物玉米、水稻、小麦、大麦、以及高梁在5 0 , 0 0 0 ,0 0 0 年前起源于一个共同的祖先【3 2 】,它们的进化距离小于人一鼠基因组的进化距离。 人们已经知道了这些禾谷类植物的系统发生关系【3 2 】,各个禾本科亚族中至少有一个代 表,早熟禾亚科( p o o i d e a e ) 代表植物为小麦( t r i t i c u ma e s t i v u m ) 和大麦( h o r d e u m v u i g a r e ) ,稻亚科( o r y z o i d e a e ) 代表植物为水稻( o r y z a s a t i v a ) ,以及黍亚科( p a n i c o i d e a e ) 代表植物为玉米( z e am a y s ) 和高粱( s o r g h u mb i c o l o r ) 。在早熟禾亚科中,小麦和大 麦在1 0 ,0 0 0 ,0 0 0 - 1 4 ,0 0 0 ,0 0 0 年前就已分化【3 3 】,然而在黍亚科中,玉米和高粱在1 6 , 5 0 0 ,0 0 0 年前已分化【3 4 】,这可以用来比对以追寻c n s 的进化方向。重要的是,两张不同 基因型的水稻基因组序列的草图已经可用【3 5 , 3 6 】,而且在无专门的测序工程的资助的情况 下,大量的玉米基因组序列已经被得到。高粱的基因组测序也已完成并公布【3 7 1 ,谷子的 基因组测序即将完成【3 8 1 ,大麦以及小麦基因组的测序和分析也在不断地推进【3 9 1 。另外, 在结构和功能基因组方面的日益增加的成果加速了我们对表达基因以及它们在禾谷类 ( 尤其是玉米和水稻) 基因组中的功能的认识 4 0 , 4 。 在哺乳动物中,利用人一鼠的序列比对,j a r e b o r g ( 1 9 9 9 ) 等【4 2 】计算出大的系统发 生足迹( c n s 长度大于1 0 0 b p 且相似性高于6 0 ) 组成了非编码d n a 的很大一部分:3 6 6 的启动子序列,5 0 的5 t i t r ,2 3 的内含子,以及5 6 的y u t r 序列。事实上,不管用 什么检测方法,一个典型的哺乳动物基因中包含很多大的同源区域。迄今为止,所公布 的哺乳动物的直向同源基因中都有c n s 。k a p l i n s k y 等( 2 0 0 2 ) 等【2 4 】在禾本科基因检测中 发现了短的c n s ,并且将结果与关于哺乳动物的文献进行比较,利用禾本科c n s 的参数 分析哺乳动物中的六个基斟2 4 1 ,他们发现哺乳动物基因有更多更大的c n s 。 1 2 1 1 c n s 在基因组中的分布 通过对人一鼠同源基因的c n s 的检测发现c n s 在调控序列元件中含量很高【4 3 1 。经实 验证实,系统发生足迹已经成为一种有效的从人类、线虫、果蝇、酵母的基因中鉴定转 录调控区域的方法,同样在拟南芥和芸苔属植物基因组比对以及不同禾本科物种的比对 中检测到了c n s 。 c n s 在基因的不同区域不均等分布。长度大于1 0 b p 的c n s 在m r n a 起始密码子的上 游5 端非翻译区分布最多,终止密码子的转录序列下游次之,在i n t r o n 区最少。c n s 以最 低频率( 8 7 ) 出现在转录起始位点上游的启动子序列中【3 1 1 。在每个非编码序列中, c n s 多出现在靠近编码序列的区域,这种分布可能反映了对外显的编码序列强大的选择 压力,这样就间接地保留了其附近的未翻译序列,或者能够表明在转录起始位点、外显 子一内含子连接点,或者多聚腺苷酸化信号等周围序列功能上的保守。启动子序列中 c n s 出现频率的减少是由于5 端到转录起始位点或起始密码子之间距离的增大。据检测, 在转录起始位点上游1 0 0 0 b p p a 上有很少的c n s 。这种分布符合植物基因启动子紧密的本 性,在植物基因中,通常 1 0 0 0 b p 的启动子序列足以促使合适的转录调控模式以及调控 元件聚集到转录起始位点附近【3 1 】。 由于编码有功能的酶的禾本科基因有很少而且较小的c n s ,但是所有的人一鼠基因 比对显示了大量的比较大的c n s ,k a p l i n s k y ( 2 0 0 2 ) 掣2 4 】猜想哺乳动物持家直向同源基 因的比对将会展现相对丰富的c n s 。g u oa n dm o o s e ( 2 0 0 3 ) 4 4 】利用l a g a n ( b r u d n oe t a 1 ,2 0 0 3 ) 4 s 1 和av i s t ad i s p l a y ( m a y o re ta 1 ,2 0 0 0 ) 1 4 6 开发禾本科* f f 0 c n s ,尤其是在玉 米和水稻间的,推断c n s 上有转录因子结合位点以及c n s 在不同的禾本科中均有分布 【4 7 】 o d a nc h o f f n e si n a d ae ta l t 4 8 】通过比较玉米和水稻的5 2 对不同功能的基因发现禾本科 作物的c n s 具以下几个特点:( 1 ) 在同一基因的不同部位c n s 的出现频率有着显著的差 别,通常5 u t r 频率最高,其次是启动子区域和内含子区。( 2 ) 富含c n s 的基因往往是 编码调控蛋白的基因,而编码结构蛋白或酶的基因只含很少或不含c n s 。( 3 ) 与哺乳动 7 物相比,禾本科植物中的c n s 长度更短,一般在1 5 5 0 b p 之间,而哺乳动物一般都大于 1 0 0 b p t 4 9 1 ,禾本科植物同一基因q b c n s 的数量也更少,这一点与k a p l i n s k y 和b r a u l l 【3 】的研 究结果相一致。 1 2 1 2c n s 的功能 在生物进化过程中,功f l 邑d n a 序列比非功能d n a 序列改变的比率低。外显子序列 趋向于保守,然而无功能的序列通过置换,转换造成的缺失或者完全缺失而随机产生。 所以,如果两个基因或染色体区域是由一个共同的祖先分化来的,它们分布在不同的物 种中形成直向同源基因( o r t h o l o g s ) 或者重复区域在同一物种的染色体组的不同位点形 成重复基因( p a r a l o g s ) ,那些少数保留了序列高度相似性的非编码区域为非编码d n a 的功能的研究提供了一种可能,它们的功能性可以从其保守性作出推论。但这种功能并 不能保证非编码序列是保守的,有些序列进化很快,而有些则能经受得住检验。c n s 是 一类有功能的非编码序列【4 7 1 。 c n s 已经被广泛的研究,尤其是在哺乳动物中。l o o t s ( 2 0 0 0 ) 等人【2 3 】发现通过基 因敲除试验将找到的c n s 去除会导致被测基因功能出现异常甚至丧失,这说明c n s 在基 因中执行某种功能。接下来他们又发现c n s 与一些已知的基因功能位点在空间上是一致 的。此外,其他研究人员还发现c n s 在某些基因上的位置与d n a s e i 超敏感位点一致【5 0 1 , 并且包含一定数量的转录因子结合位点【4 3 1 。因此,研究人员认为在哺乳动物中c n s 是一 种基因表达的调控元件【5 1 , 5 2 。除此之外,在鱼类【5 3 】、果蝇【删、拟南芥【5 5 】等的同源基因研 究中,c n s 也被认为与表达调控有关,是研究物种进化的重要工具。 既然在哺乳动物中c n s 已经被确认是一种基因表达的调控元件,那么在禾本科植物 中c n s 是否也执行同样的功能呢? 推定的c n s 功能包括模板结合区域,单个或多个转录 因子结合位点,染色体水平调控区域,d n a s ei 敏感位点以及脊椎动物基因的增强子。 在植物中对玉米的k n l 基因的一个内含子c n s 的功能分析表明,该c n s 功能是阻止同源 异型基因l ( i l l 的异常表达。 g r e e n e 等【5 6 】研究发现,分别将九个m u 转座子插入玉米的k n l ( k n o t t e d lh o m e o b o x t r a n s c r i p t i o nf a c t o r ) 基因,每个转座子的插入都可引起玉米叶子的表现型发生变化 ( e c p o t i ce x p r e s s i o n ) 。这九个转座子共产生了八个插入位点,全部集中在k n l 的i n t r o n 3 中部靠近5 端,长约3 0 0 b p l 躯域,而d a nc h o f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业管道的自动化焊接技术优化
- 工业自动化技术发展与应用研究
- 工业设计与可持续发展战略
- 工作场所运动和身体健康关系的探究及实践建议
- 工业节能的技术改造
- 工作效率提升的智能穿戴设备研究
- 工作效率提高的饮食和运动建议
- 工厂企业消防安全实务
- 工程机械设备维修与管理研究
- 工程勘查质量与安全管理手册
- 统计学原理试题与答案
- (妇产科学)第十八章 女性生殖系统炎症课件
- 立式加工中心的基本操作专题培训课件
- 一例慢阻肺病人护理个案
- 建平中学自招真题解析
- 阿克苏地区生态环境准入清单
- 产品创新设计与实践完整版课件全套ppt教学教程电子教案讲义最全(最新)
- 汉字起源和发展
- 试运行方案计划-
- 法兰规格尺寸表国标,美标
- 动物疫病流行病学调查表诊断送检用
评论
0/150
提交评论