(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf_第1页
(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf_第2页
(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf_第3页
(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf_第4页
(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(作物遗传育种专业论文)橡胶树甲基化过滤文库的构建与生物信息学分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文版权使用授权说明 本人完全了解海南大学关于收集、保存、使用学位论文的规定,即:学校有权保留并向 国家有关部门或机构送交论文的复印什和电子版,允许论文被查阅和借阅。本人授权海南大 学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。本人在导师指导下完成的论文成果,知识产权归属海 南大学和中国热带农业科学院。 保密论文在解密后遵守此规定。 做作者虢奶 日期:d 刃矿年月日 导师签名 本人已经认真阅读“c a l l s 高校学位论文全文数据库发布章程”,同意将本人的学位论 文提交“c a l l s 高校学位论文全文数据库”中全文发布,并可按“章程”中规定享受相关 论文作者签名: 日期:j 巾年 日 导师签名: 日期占b 汐年多月2 日日期。渺年疹月2 日 橡胶树甲基化过滤文库构建与生物信息学分析 摘要 橡胶树( h e v e ab r a s i l i e n s i ) 是大戟科的木本经济植物,所生产的天然橡胶是一 种重要的战略物资,在我国国民经济中具有不可替代的地位。随着我国经济社会的快速 发展,天然橡胶需求量大幅度增加,我国天然橡胶供不应求。与水稻小麦等农作物相比, 橡胶树分子生物学研究较为滞后。如何有效获取大量的基因组信息,高效筛选缩短育种 周期、高产、优质、抗性等与育种密切相关基因,及其功能基因组学研究是今后橡胶树 基因组学研究的重点。 基因组文库是进行基因组研究的基础工作之一,其主要应用于重要基因的克隆,基 因的转录和调控的研究,探索基因的结构和组成,基因组物理图谱的构建及基因组的测 序。橡胶树基因组结构复杂,重复序列含量高达5 2 ,用常规构建基因组文库法( 如 s h o t g u n ) 则会增加测序成本,增加拼接错误率及降低筛选基因效率。e d n a 文库则由于 组织特异性和时空表达特异性,需要构建多个e d n a 文库才能覆盖整个基因组信息。 甲基化过滤文库是近几年发展起来的一项基因富集技术,本研究利用大肠杆菌 m c r b c 限制修饰系统构建了巴西橡胶树基因组甲基化过滤文库,并对大规模测序后所得 数据进行生物信息学分析。获得主要结果如下: 该文库未扩增和扩增后的滴度分别为2 6 x 1 0 6 p f u m l 和9 1 0 9 p f u m l ,随机挑选2 2 个克隆进行菌落p c r 鉴定,d n a 片段大小在1 0 2 5 k b 之间,阳性克隆率为8 6 4 。适 合大规模测序需要,是开展橡胶树功能基因组学研究的宝贵资源。 试验从文库中随机挑选白色克隆进行测序,去除低质量序列,共获得有效序列4 8 1 9 条。将这些序列进行拼接,获得9 1 3 个c o n t i g s 和1 7 4 8 个s i n g l e t s ,共计2 6 6 1 条独立基 因( u n i g e n e ) ,其中拼接最长的序列长为1 7 9 5 4 b p 。g c 含量统计表明,所得序列中g c 碱基平均含量为3 5 8 6 ,低于a t 碱基含量( 6 4 1 4 ) ,推测与大肠杆菌m c r b c 限制 修饰系统有关。 将获得的2 6 6 1 条非冗余序列进行b l a s t 相似性搜索,结果表明5 4 3 1 序列与n c b i 公共生物信息数据库中功能基因序列和e s t 序列等基因编码序列高度同源,重复序列降 低为7 4 ,胞质d n a 占6 0 5 ,未知新序列,占3 2 1 0 。基因功能注释表明,该文 库含有众多与能量物质代谢、蛋白质合成与降解、转录与信号转导、抗病及防御相关基 因,证实了构建基于甲基化过滤技术构建橡胶树基因富集文库的策略是可行的。 关键词:橡胶树,甲基化过滤,基因富集,生物信息学,功能分析 a b s t r a c t t h er u b b e rt r e e ( h e v e ab r a s i l i e n s i s ) i sa ne c o n o m i cw o o d y c r o pi nf a m i l ye u p h o r b i a c e a e a n dn a t u r a lr u b b e ri sa ni m p o r t a n ti r r e p l a c e a b l e s t r a t e g i cm a t t e rt od e v e l o p m e n to fo u r c o u n t r y w i t ht h er a p i dd e v e l o p m e n to fe c o n o m ya n ds o c i e t yi nc h i n a , t h e r eh a sb e e na t r e m e n d o u si n c r e a s ei nn a t u r a lr u b b e r t h es u p p l yo fn a t u r a lr u b b e rf a l l ss h o r to fd e m a n di n r e c e n ty e a r s c o m p a r e dt ow h e a t ,r i c ea n do t h e rc r o p s ,m o l e c u l a rb i o l o g yo fr u b b e rt r e ei s r e l a t i v e l yb a c k w a r d i tw i l lb ef o c u s i n go nh o wt oo b t a i nal a r g en u m b e ro fg e n o m i c i n f o r m a t i o ne f f i c i e n t l y , s c r e e n i n gt h eg e n eo fs h o r t e nt h ep e r i o do fb r e e d i n g ,h i g hq u a l i t y , h i g h y i e l d ,s t r o n gr e s i s t a n c ee f f i c i e n t l ya n dt h ep r o g r e s si nt h ef u n c t i o n a lg e n o m e sr e s e a r c h t h eg e n o m i cd n a l i b r a r yi st h eb a s i ct o o lf o rt h eg e n o m er e s e a r c h i ti si m p o r t a n tf o r t h eg e n o m ep h y s i c a lm a p p i n g ,g e n o m es e q u e n c i n ga n dm a p - b a s e dg e n ec l o n i n g t h er u b b e r t r e ep o s s e s s e sac o m p l e xg e n o m es t r u c t u r e ,r e p e t i t i v es e q u e n c ec o n t e n to fu pt o5 2 a c o n v e n t i o n a lg e n o m i cl i b r a r yc o n s t r u c t i o n m e t h o d ( s u c ha ss h o t g u n ) w i l li n c r e a s et h e s e q u e n c i n gc o s t sa n di n c r e a s et h ee r r o rr a t ea n dr e d u c et h es p l i c i n ge f f i c i e n c yo fs e l e c t e d g e n e s a sw i t ht i s s u es p e c i f i c i t ya n dt e m p o r a la n ds p a t i a lg e n ee x p r e s s i o no ft h en e e dt ob u i l d m o r et h a ncd n a l i b r a r yt oc o v e rt h ew h o l eg e n o m ei n f o r m a t i o n i no r d e rt oe n r i c hg e n ee n c o d i n gr e g i o no fh e v e a b r a s i l i e n s i s ,t h em e t h y r l a t i o nf i l t r a t i o n l i b r a r yw a sc o n s t r u c t e db yu s i n ge c o l im c r b cr e s t r i c t i o n m o d i f i c a t i o n s y s t e m a f t e r s e q u e n c i n ga n db i o i n f o r m a t i c sa n a l y s e s ,t h ef o l l o w i n gm a i nr e s u l t sa r eo b t a i n e d : t h et i t e r so ft h en o n - a m p l i f i e dl i b r a r ya n dt h ea m p l i f i e dl i b r a r yw e r e2 6x10 6 p f u m la n d 9 0 10 r e s p e c t i v e l y 2 2r a n d o m l ys e l e c t e dc l o n e sw e r ei d e n t i f i e dc o l o n yp c r t h el e n g t ho f d n a s e q u e n c er a n g e df r o m1k bt o2 5 k b ,a n dt h er a t eo fp o s i t i v ec l o n e sw a s8 6 4 t h e l i b r a r yn e e d sf o rl a r g e s c a l es e q u e n c i n g i ti sar u b b e rt r e et oc a r r yo u tf u n c t i o n a lg e n o m i c s s t u d i e so fv a l u a b l er e s o u r c e s t h i se x p e r i m e n tr a n d o m l ys e l e c t e df r o mt h el i b r a r yo fw h i t ec l o n e sw e r es e q u e n c e d ,t o r e m o v el o wq u a l i t ys e q u e n c e s ,4 819s e q u e n c e sw e r eo b t a i n e de f f e c t i v e l y s p l i c i n go ft h e s e s e q u e n c e st oo b t a i n9 13c o n t i g sa n d17 4 8s i n g l e t s ,t o t a lo f2 6 61 u n i q u eg e n e s ( u n i g e n e ) ,o f w h i c ht h el o n g e s ts e q u e n c el e n g t ho f s t i t c h i n g17 9 5 4 b p t h ec o u n ts h o w e dt h a tg cb a s ep a i r s e q u e n c e d e r i v e df r o mt h e a v e r a g e c o n t e n to f35 8 6 1 0 w e r t h a nt h ea tb a s e c o n t e n t ( 6 4 14 1 t h e2 6 61u n i g e n e sw e r eb l a s t e da g a i n s tt h en o n - r e d u n d a n tn u c l e o t i d ea n dp r o t e i na n d e s td a t a b a s eo f n c b i t h er e s u l t ss h o w e dt h a t5 4 31 s e q u e n c eo f n c b i p u b l i cd a t a b a s eo f b i o l o g i c a lf u n c t i o n ss u c ha sg e n es e q u e n c e sa n de s ts e q u e n c e sh i g h l yh o m o l o g o u sg e n e c o d i n gs e q u e n c e ,r e p e a ts e q u e n c e sr e d u c e dt o7 4 ,p l a s t i dd n aa c c o u n t e df o r6 0 5 i l t l n k n o w nn e ws e q u e n c e ,a c c o u n t i n gf o r3 2 10 i ts h o w e dt h a tt h el i b r a r yc o n t a i n sal o to f e n e r g ym e t a b o l i s m ,p r o t e i ns y n t h e s i sa n dd e g r a d a t i o n , t r a n s c r i p t i o na n ds i g n a lt r a n s d u c t i o n , d i s e a s er e s i s t a n c ea n dd e f e n s er e l i e dg e n e sb yg e n ef u n c t i o na n n o t a t i o n c o n s t r u c t i o no fa m e t h y l a t i o nf i l t r a t i o nl i b r a r yi nh e v e a b r a s i l i e n s i sh a sb e e na p p r o v e df e a s i b l e k e yw o r d s :r u b b e rt r e e ; m e t h y l a t i o nf i l t r a t i o n ;g e n ee n r i c h m e n t ; b i o i n f o r m a t i c s ; f u n c t i o n a la n a l y s i s i i i 1 文献综述1 1 1 橡胶树概况1 1 2 国内天然橡胶供需矛盾1 1 3 橡胶树分子生物学研究进展2 1 3 1 构建遗传图谱方面2 1 3 2 橡胶树基因克隆2 1 3 3 橡胶树文库构建3 1 3 4 基因与蛋白功能组学6 1 4 植物基因富集技术研究进展7 1 4 1 基因富集的意义7 1 4 2 基因富集的方法7 1 4 3 甲基化过滤文库法在橡胶树中的应用1 3 1 5 生物信息学研究进展1 3 1 5 1 生物信息学简介1 3 1 5 2 生物信息学研究内容1 4 1 6 研究目的及意义1 6 2 橡胶树甲基化过滤文库的构建1 8 2 1 技术路线18 2 2 实验材料1 8 2 2 1 植物材料1 8 2 2 2 所需主要试剂1 8 2 2 3 主要试剂的配制。1 9 2 2 4 主要仪器设备1 9 2 3 试验方法o 1 9 2 3 1 高质量核d n a 的制备1 9 2 3 2d n a 片段化及回收2 0 2 - 3 3 连接与转化2 0 2 3 4 文库扩增2 2 2 3 5 阳性克隆鉴定及插入大小的检测2 2 i v 橡胶树甲基化过滤文库构建与生物信息学分析 2 3 6 克隆的挑取与保存2 3 2 3 7 测序。2 3 2 4 结果与讨论2 4 2 4 1 基因组总核d n a 的鉴定2 4 2 4 2 基因组总核d n a 用超声波切断处理及切胶回收2 4 2 4 3 基因组文库滴度检测及库容量计算2 5 2 4 4 插入片段大小及阳性克隆率的检测结果2 6 2 4 5 克隆稳定性的检测结果2 6 2 5 讨 沧2 6 2 5 1 核d n a 分离是甲基化文库构建的关键步骤2 6 2 5 2d n a 断裂方式的选择2 7 2 5 3 断裂片段大小的选择2 7 2 5 4 菌株的选择2 7 2 5 5 连接转化效率的保证2 7 2 5 6 文库的保存方法比较2 7 2 6 ,j 、结2 8 3 橡胶树基因组甲基化过滤文库大规模测序和生物信息学分析2 9 3 1 技术路线:2 9 3 2 本地化生物信息学平台构建3 0 3 2 1 硬件配置与l i n u x 操作系统的安装3 0 3 2 2 相关程序的获取与安装3 0 3 2 3 构建本地化b l a s t 数据库:3 0 3 2 4 数据处理过程及b l a s t 分析自动化31 3 3 结果与分析3 2 3 3 1 测序数据的初步处理结果3 2 3 3 2b l a s t 注释结果3 3 3 3 3 序列同源分析结果j 。3 4 3 4 讨论3 5 3 4 1 聚类前处理3 5 3 4 2 序列拼接3 6 3 4 3 功能注释3 6 3 5 小结。3 6 参考文献3 7 附录4 5 致j 射4 5 v 橡胶树甲基化过滤文库构建与生物信息学分析 文献综述 1 橡胶树概况 橡胶树在植物学分类系统中属于木兰i - j m a g n o l i o p h y t a ,木兰纲 m a g n o l i o p s i d a , 薇亚纲 r o s i d a e ,大戟目 e u p h o r b i a l e s ,大戟科 e u p h o r b i a c e a e ,大戟亚科,橡胶树 e a u t od es o u z ag o n c a l v e s 】,属高大落叶乔木。巴西橡胶树有较大的变异性和适应性。 国的植胶区主要在海南省和云南省西双版纳。三出复叶,又名三叶橡胶树。是2 0 0 0 种产胶植物中天然橡胶含量最高,质量最好的产胶植物,是天然橡胶的主要来源。 巴西橡胶树是一种比较典型的热带雨林树种,喜高温、高湿、静风和肥沃土壤,一 般每年开花两次,3 4 月为主花期,称春花,开花最多,5 7 月第二次开花,称夏花。也 有在8 - 9 月第三次开花的。分别结成秋果和冬果。花粉粒长球形或扁球形,具3 沟,沟 长而阔,具沟盖;外壁两层,外层较厚,表面具细致的网状雕纹,网眼圆,大小较一致, 轮廓线不平。染色体数为3 6 的四倍体( 2 n = 4 x = 3 6 ) 。种子易丧失发芽力,宜随采随播。 种子繁殖或芽接繁殖。栽植6 8 年即可割取胶液,实生树的经济寿命为3 5 4 0 年,芽接 树为1 5 2 0 年,生长寿命约6 0 年【l j 。 1 2 国内天然橡胶供需矛盾 天然橡胶与钢铁、石油、煤炭并列为现代社会四大工业原料,而且是唯一一种可再 生的原料,不仅民用工业大量需要,军用工业更离不开它。随着国家汽车产业的发展, 轮胎的需求量逐渐增加,这增加了我国天然橡胶的供应压力,不光我国是这样,在世界 范围内天然橡胶都出现这样的局面。新华社援引中国橡胶工业协会主席范仁德的话称, 中国2 0 0 9 年橡胶消费量增加6 9 至5 8 8 万吨。已经连续第八年稳坐全球橡胶消费的头 把交椅。其中天然橡胶的消费量为2 6 0 万吨。( 文华财经,2 0 1 0 ) 另据天然橡胶生产国 协会介绍,七个成员国在截止2 0 0 9 年9 月底的过去一年中,天然橡胶产量为8 6 7 万吨, 比去年同期的9 1 3 万吨下降5 1 。其中,马来西亚是天然橡胶产量下降最大国家,今 年1 - 9 月的天然橡胶产量从去年同期的1 0 7 吨下降2 3 6 至8 6 5 万吨。印度下降1 0 8 , 泰国下降8 3 ,印尼下降6 3 ,斯里兰卡与上年持平为1 2 9 万吨,中国则增长2 8 5 至6 4 6 万吨( 天然橡胶生产国协会,2 0 0 9 ) 。据中国海关总署公布的最新数据显示,中 国2 0 0 9 年共进口天然橡胶1 , 7 1 0 ,6 7 8 吨,同比增1 7 4 。其中2 0 0 9 年1 2 月进口量为 1 8 1 ,9 0 5 吨,同比激增6 7 6 ,较1 1 月的1 2 0 ,6 4 1 吨增加5 0 7 8 。中国海关总署4 月1 0 r 公布的初步数据显示,2 0 1 0 年1 至3 月,中国进口天然橡胶( 包括胶- 孚l ) 4 9 万吨,较 2 0 0 9 年同期的3 8 万吨增长3 0 3 ,增幅收窄,而由于国际天然橡胶价格持续攀涨,进 口金额同比大增1 4 5 4 。其中3 月天然橡胶进口量为1 9 万吨,环比激增4 6 1 5 ( 海关 总署,2 0 1 0 ) 。可以计算出现阶段超过3 4 的天然橡胶要依赖于进口,严重的供需不平衡 使中国天然橡胶的生产形式十分严峻,如何提高国内橡胶产量是一个巨大的研究课题。 橡胶树甲基化过滤文库构建与生物信息学分析 要提高天然橡胶产量,主要从以下三方面入手:一是提高种植面积,在国内天然橡胶价 格高至2 万吨的情况下,民营胶园的种植面积大幅度增加,据预测已经达到了4 0 万公 顷( 李雪涛,2 0 0 7 ) ,2 0 0 5 年我国然橡胶投产面积为4 7 万公顷居世界第六位,目前我国 橡胶种植面积为6 3 万公顷,尚有3 4 万公顷宜胶地( 许海平,2 0 0 7 ) ,即使全部种上橡 胶,全面开割,按照正常年景下平均产量1 3 吨公顷来计算,年产也才约1 3 0 万吨,而 2 0 1 0 年的需求量是2 3 0 万吨。所以,单靠提高国内种植面积以提高产量也不太现实。但 是,我们也可以大力发展境外胶园面积,以解决供需之间的矛盾;二是大力支持橡胶科 研,加大对橡胶科研的投入,以从生理学,生物学乃至分子等各方面阐明橡胶树的产胶 机制,为橡胶生产提供理论和生产依据,加大新胶种的研发力度,联合下游企业和科 技部门,开发适销对路的胶种;三是加大对橡胶树重要病虫的防治以增加橡胶树单产, 如死皮病、白粉病、炭疽病、割面条溃疡病及根病等的防治技术研究和应用。四是大力 推广橡胶栽培和割胶技术,强化胶乳田间凝固技术、丰产栽培技术、微割与导胶技术把 科技成果转化成生产力,以最大程度地解决生产方面遇到的难题,扩展我国的天然橡胶 技术服务体系通过“科研单位一技术服务网络一胶农组织一胶农”,这条组织路径,加强天 然橡胶生产技术服务。 1 3 橡胶树分子生物学研究进展 1 3 1 构建遗传图谱方面 l e s p i n a s s e 等以橡胶树p b 2 6 0 x r 0 3 8 的1 0 6 株f l 群体为材料,利用同工酶、r f l p 、 s s r 和a f l p 对两个不同世代进行作图,构建了首张橡胶树遗传图谱,该图谱由1 8 个 连锁群组成,包含3 0 1 个r f l p 标记、3 8 8 个a f l p 标记、1 8 个微卫星标记和1 0 个同 工酶标记,覆盖基因组的总图距为2 1 4 4 c m ,平均两个相邻标记之间的距离为3 c m t 2 1 。 王慧君等用抗寒高产魏克汉g t l 无性系和抗寒高产但不抗风的i a n 8 7 3 这对非近交亲本 进行授粉杂交得到1 8 0 个f 1 代群体为材料,绘制了一张基于s r a p s s r 的包含6 8 个分 子标记的橡胶分子遗传图谱,其中有6 1 个s r a p 标记和7 个s s r 标记。该连锁群总遗 传图距为7 7 4 c m ,相邻标记间的平均距离为11 3 8 c m 。连锁群长度集中在5 1 8 5 c m 之间, 连锁群上标记数为2 8 个,平均图距为o 5 2 5 5 c m 。连锁群中包含1 8 个偏分离标记,所 占比例为2 6 4 7 t 3 1 。 和丽岗等用橡胶树g t i x l a n 8 7 3 人工授粉组合的f 1 代群体构建了a f l p 连锁遗传 图谱。图谱可以分为1 8 个连锁群体,共有2 6 1 个标记,1 8 个连锁群中,第一群的图距 最长,图距为1 2 5 6 4 c m ,含有4 3 个标记;第1 6 群的图距最短,图距为4 7 5 5 c m ,含有7 个标记。第9 、1 1 连锁群标记最少,均为5 个。连锁图谱的总图距为1 4 5 5 5 7 c m ,各标 记间平均图距为5 5 8 e m t 4 1 。 1 3 2 橡胶树基因克隆 从2 0 世纪9 0 年代开始,随着分子生物学的研究发展,从橡胶树中克隆的基因或 2 橡胶树甲基化过滤文库构建与生物信息学分析 c d n a 也不断增多。主要有:与橡胶树合成关键酶和限速酶,如法尼基焦磷酸合成酣5 1 、 橡胶延长因子【6 】、3 羟基3 甲基戊二酸单酰辅酶a 还原酶( h m g r ) 【7 8 】、橡胶转移酬9 】 和小橡胶粒子蛋白【1 0 1 ,与抗性相关基因,如:i v l n s o d 基因( 1 1 ) ,几丁质酶( c h i t i n a s e ) 基 因【1 2 1 ( 目前认为几丁质酶具有抗病原作用,可抑制胶乳凝固,与橡胶树的排胶有关) ,b 1 ,3 葡聚酶( 目前认为是抗真菌酶) 1 1 3 】等。我们把近两年已从橡胶树中克隆的基因或e d n a 分类列表( 表1 ) 表1 1 近年从橡胶树中克隆的基因或c d n a t a b l e1 1t h ec l o n e dg e n eo rc d n af r o mt h er u b b e rt r e ei nr e c e n ty e a r s 1 3 3 橡胶树文库构建 文库可被定义为所有可能组合的集合或者关于集合的研究。d n a 文库是指某一特 定来源d n a 通过细胞d n a 克隆技术构建呈含有所用d n a 片段的重组d n a 分子,并 转化至细菌内,构成d n a 文库【2 9 】。依据d n a 的来源不同,可分为,基因组d n a 文库 3 橡胶树甲基化过滤文库构建与生物信息学分析 和e d n a 文库。基因组文库。是某种特定的生物所含有的、能够涵盖所有该物种基因的、 足够数目的d n a 片断克隆的集合。e d n a 文库是以特定的组织或细胞m r n a 为模板, 经反转录酶催化,在体外反转录成e d n a ,与适当的载体( 常用噬菌体或质粒载体) 连 接后转化受体菌,则每个细菌含有一段e d n a ,并能繁殖扩增,这样包含着细胞全部 m r n a 信息的e d n a 克隆集合称为该组织或细胞的e d n a 文库。e d n a 文库特异地反映 某种组织或细胞中,在特定发育阶段表达的蛋白质的编码基因,因此e d n a 文库具有组 织或细胞特异性。基因组含有的基因在特定的组织细胞中只有一部分表达,而且处在不 同环境条件、不同分化时期的细胞其基因表达的种类和强度也不尽相同,所以e d n a 文 库具有组织细胞特异性。但对真核细胞来说,从基因组d n a 文库获得的基因与从c d n a 文库获得的不同,基因组d n a 文库所含的是带有内含子和外显子的基因组基因,而从 e d n a 文库中获得的是已经过剪接、去除了内含子的c d n a 。 基因组文库( g e n o m i el i b r a r y ) 研究目的和使用的载体不同,可以分为以随机测序 为目的的质粒s h o t g u n 文库,c o s m i d 文库和噬菌体文库,以及以基因作图定向测序为目 的的酵母人工染色体文库( y a c 文库) 和细菌人工染色体文库( b a c 文库) 等。其中 以s h o t g u n 文库和b a c 文库最为常用。s h o t g u n 文库也成“鸟枪法文库”是随机先将整个 基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组 装,并确定它们在基因组中的正确位置【3 0 1 。“鸟枪法”优点是速度快,简单易行,成本较 低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断。但是用它来 测序,最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。 b a c 文库可用于基因作图,但要获得精细的物理图谱和完成图,技术难度相对较高, 由于插入片段大,通常大于8 0 k b ,测序费用相对于鸟枪法要稍高一些,完成整个基因组 测序周期也要长些。 e d n a 文库以研究目的和获得e d n a 的方法的不同,可以分为全长e d n a 文库,均 一化e d n a 文库,e d n a 抑制消减杂交文库。全长e d n a 文库是采用一些方法,使提高 含有全长e d n a 比例,避免筛选得到的e d n a 片段后还要采取r a c e 或电子拼接方法 获取全长e d n a 序列。包括完整编码区和两端非编码区的全长e d n a 有助于大规模的挖 掘新基因及进行功能研究。全长e d n a 文库可用于以下多方面的研究工作:开展大规模 测序挖掘新基因,可以进行基因功能预测,了解转录的机制和转录后的加工、修饰机理; 可以进行全基因作图等工作。构建全长e d n a 文库的方法主要有o l i g o c a p p i n g 法( s u z u k i e ta l ,1 9 9 7 、2 0 0 3 ) 、s m a r t 法( z h ue ta l2 0 0 1 ) 、c a p t u r e 法( e d e r ye ta l ,1 9 9 5 ) 、c a p - j u m p i n g 法( e f i m o ve ta l ,2 0 0 1 ) 以及c a p t r a p p e r 法( c a m i n c ie ta l ,1 9 9 6 ) 。所有的这些方法都 着眼于真核生物m r n a 5 端帽子结构,但有各有各的独到之处p 。 均一化主要就是降低高丰度基因的拷贝数,使不同丰度的基因的拷贝数趋于一致, 相对提高了低丰度基因的拷贝数。这种文库主要有三方面的优点:第一,增加克隆低丰 度m r n a 的机会,适用于分析分化发育阶段的基因表达及突变检查;第二,等量化的 4 橡胶树甲基化过滤文库构建与生物信息学分析 c d n a 可做探针来发现基因组序列中的转录区,尤其是普通探针所不能发现的稀有转录 区;第三,与原始丰度的m r n a 拷贝数相对应的c d n a 探针与标准化的c d n a 文库作 杂交,可估计出大多数基因的表达水平及发现一些组织表达特异的基因。在构建均一化 的c d n a 文库中有2 种方法比较常用复性式均一化技术【3 2 】和与基因组饱和杂交的方法 p 3 】 o 抑制消减杂交文库是一项可以快速获取两个不同生物材料中差异表达基因的分子 生物学技术,是快速筛选差异表达基因的有效方法,也是寻找新基因的重要手段。该技 术尤其适合以基因组尚不完全清晰的物种或者以特殊材料为研究对象的科研工作者。该 技术主要是利用抑制p c r 对差减杂交后丰度一致的目的材料中两端连有不同接头的差 异表达片段进行指数扩增,而两端连接上同一接头的同源双链片段仅呈线形扩增,从而 达到富集差异表达基因的目的。与传统的d d p c r 、s a g e 及c d n a r n a 等技术相比, 具有低丰度m r n a 富集效率高、假阳性低、灵敏度高重复性好等特点。现己广泛应用 于动植物发育和分化、疾病易感性差异、抗药性差异和组织差异及微生物基因分型差异 的研究【3 4 1 。 程汉等【3 5 】利用s m a r t 技术构建了低温诱导的全长c d n a 文库,文库库容为 1 4 1 0 6 ,插入片断平均大小为l k b 左右,通过文库筛选和r t - p c r 技术从橡胶树中克隆 了c b f 基因家族的保守区,并通过r a c e 技术克隆了全长为1 1 2 1 b p 的c d n a 序列,通过 b l a s t 比对分析表明,该c d n a 序列同其他植物中的c b f 家族基因高度同源,认为该 c d n a 序列就是橡胶树中的c b f 基因。段翠芳【3 6 j 等构建了未经扩增的橡胶树胶乳c d n a 初级文库。随机对文库的3 2 0 0 个克隆进行了e s t 测序,序列比对分析的结果,该c d n a 文库适合包括低丰度表达基因在内的橡胶树胶乳功能基因的筛选,并在此基础上,采用 抑制性消减杂交技术,构建了外源茉莉酸刺激条件下橡胶树胶乳与未处理橡胶树胶乳差 异表达的c d n a 消减文库。并通过p c r 和测序,只有1 0 条e s t 片断可找到碱基序列相 似性大于8 0 以上的同源基因序列,为开展茉莉酸调控橡胶树胶乳代谢和橡胶生物合成 的分子机理研究打下基础。邓柳红等【3 7 】采用巴西橡胶树常割树胶乳的r n a 为t e s t e r , 叶片r n ad r i v e r ,通过抑制消减杂交法( s u p p r e s s i v es u b t r a c t i v eh y b r i d i z a t i o n ,s s h ) 构建 了一个胶乳特异表达基因差减文库,通过筛选鉴定阳性差异片段,获得7 9 个胶乳特异 表达阳性克隆。这些克隆与橡胶物质代谢运输、信号传导、生物合成以及形态建成等有 关,部分阳性克隆还通过r t p c r 及n o r t h e mb l o t 杂交进一步验证。挑选部分阳性克隆 进行序列比对分析,结果表明与巴西橡胶树中已知的基因相同。刘宽灿【37 j 等应用抑制性 消减杂交技术( s s h ) 成功构建了乙烯刺激条件下橡胶树胶乳与未处理橡胶树胶乳差异 表达的c d n a 消减文库。经过测序,并对获得的e s t 序列进行b l a s t x 分析,发现3 个 与已知功能的基因具有较高的同源性。应用半定量p c r 技术证明乙烯利诱导特异表达 基因的存在。闰洁等【38 j 应用s s h 技术成功构建了橡胶树死皮病植株与健康植株的橡胶 树胶乳差异表达的c d n a 消减杂交文库。利用抑制差减杂交技术和微阵列相结合,共获 橡胶树甲基化过滤文库构建与生物信息学分析 得9 7 个差异表达的非重复的与死皮相关基因的e s t 片段,在9 7 个差异表达的e s t 中, 除功能未知和已知功能而未分类及无同源序列外,其余约4 0 的e s t 分属于橡胶基本 生命过程的各个环节;次生代谢、抗病防御、物质和能量代谢、细胞生长分化、转录调 控、信号传导、蛋白合成修饰力口工、细胞骨架、核酸代谢等。这些参与橡胶死皮发生 过程的e s t 的预测功能表明,这些e s t 的对应基因涉及到病程反应的基本过程,包括 信号识别、信号传导和转录调控、过敏反应、系统获得抗性及抗病防御等。 1 3 4 基因与蛋白功能组学 在转录组研究方面,李德军带领的研究小组构建了健康和死皮橡胶树e d n a 文库, 鉴定到2 3 7 个非重复死皮相关基因。对部分基因的表达模式进行了验证,完成了死皮相 关基因的功能注释和分类工作。完成橡胶树死皮o l i g o 芯片设计、点制和杂交工作,对 芯片结果进行了初步分析【3 9 1 。 在蛋白组研究方面,闰洁等完成了8 2 个橡胶树死皮相关蛋白的鉴定和功能分类工 作。对转录组和蛋白组数据生物信息学分析表明:橡胶树死皮是一个十分复杂的生物学 过程,参与基因涉及多个功能分类和调控途径。其中,活性氧产生和清除、泛素蛋白体 降解、细胞程序化死亡、橡胶生物合成等途径在橡胶树死皮发生中发挥重要作用。在橡 胶树死皮防治方面,继续高成本死皮防治复合制剂田间小试实验,统计结果表明:死皮 率从18 6 3 降低到5 8 8 t 邛j 。 l 露摩 i g 漱勰耐蹦哮 i 聱2 倒辨; f 磬筇僦 $ 鳓城f 醋鼢 i 密鬻织穗 l 劭矽翰黝 1 钰。 辔 觞 l f 静# 彩档缮,剡 # 耙嗡 i 蜘嬲# 群蹴 图1 12 3 7 个橡胶树死皮相关基因功能分类 图1 28 2 个橡胶树死皮相关蛋白功能分类图 f i g 1 1f u n c t i o n a lc l a s s i f i c a t i o nm a po f2 3 7t a p p i n gp a n e ld r y n e s s ( t p d ) r e l a t e dg e n e so fr u b b e rt r e e s 图1 3 死皮和健康橡胶树胶孚l o l i g o 芯片杂交图 f i g 1 3t h eh y b r i d i z a t i o np a n e m so b t a i n e do fo l i g om i c r o a r r a yi nr u b b e rl a r e s b e t w e e nt p da n dh e a l t h yr u b b e rt r e e 在乳管蔗糖供给关键基因的研究上,唐朝荣研究员带领的研究小组获得阶段性成 果,发现并验证了h b s u t 3 是决定乳管蔗糖供给和影响橡胶产量关键成员,与乙烯利刺 6 萝= !; 橡胶树甲基化过滤文库构建与生物信息学分析 激增产的效果正相关;小g 蛋白基因成员众多、功能多样,推测此类基因可能在橡胶生 物合成、橡胶粒子发生和胶乳再生中发挥重要作用。同时对已克

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论