【毕业学位论文】(Word原稿)苎麻茎皮cDNA文库的构建及EST序列分析作物遗传育种硕士论文_第1页
【毕业学位论文】(Word原稿)苎麻茎皮cDNA文库的构建及EST序列分析作物遗传育种硕士论文_第2页
【毕业学位论文】(Word原稿)苎麻茎皮cDNA文库的构建及EST序列分析作物遗传育种硕士论文_第3页
【毕业学位论文】(Word原稿)苎麻茎皮cDNA文库的构建及EST序列分析作物遗传育种硕士论文_第4页
【毕业学位论文】(Word原稿)苎麻茎皮cDNA文库的构建及EST序列分析作物遗传育种硕士论文_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

密级: 论文编号: 中国农业科学院 学位论文 苎麻 茎皮 库的构建及 列分析 of of in .)ST of of in .)ST 目 录 摘 要 . I . 文缩略表 . 一章 文献综述 . 1 . 1 构建 . 2 库的种类 . 3 库的应用 . 5 . 6 术原理与方法 . 7 生物信息学在 . 7 在功能基因组研究上的应用 . 9 本研究的目的与流程 . 11 第二章 苎麻茎皮 库构建 . 13 实验材料 . 13 材料 . 13 主要试剂和常用溶液 . 13 器皿准备 . 14 培养基配方 . 14 主要仪器设备 . 14 实验方法 . 15 苎麻茎皮总 . 15 分离和纯化 . 15 库的构建 . 15 结果与分析 . 18 总 提取 . 18 离纯化 . 19 合成及分析 . 19 库的质量 . 19 讨论 . 21 苎麻茎皮总 . 21 库的质量 . 22 第三章 苎麻茎皮 列与生物信息学分析 . 23 实验材料 . 23 材料 . 23 主要试剂 . 23 培养基配方 . 23 主要仪器设备 . 24 实验方法 . 24 列测定 . 24 测序 . 24 生物信息学分析 . 25 结果与分析 . 25 序起点 . 25 列的获得 . 26 列 提交 . 27 与 据库 . 27 对具已知功能和推测功能的 . 28 高丰度表达的基因与纤维发育相关基因 . 32 讨论 . 34 . 34 对情况 . 34 茎皮的主要功能基因 分类 . 34 第四章 结 论 . 36 构建了 2个高质量的 苎麻茎皮 库 . 36 获得 275条有效 . 36 获得 12类苎麻茎皮的功能基因 . 36 获得 8个纤维发育相关基因序列 . 36 今后研究方向 . 37 参考文献 . 38 附录 1 测序结果示意图 . 44 附录 2 对 . 45 附录 3 . 49 致 谢 . 51 作者简历 . 52 I 摘 要 苎麻 在我 国 有着悠久的历史 ,是一种重要的 韧皮 纤维作物,它主要 用 作 精纺原料 ,长江流域苎麻一年收三季(头麻、二麻和三麻)。 为了解苎麻纤维发育时期的基因表达情况,本研究 首次构建了中苎 1 号二麻和三麻的 茎皮 库,并对二麻文库进行 序和生物信息学分析。本研究获得的主要结果如下: ,提取 总 纯化 ,合成双链 链上 接头后,用限制酶 酶切并除去小于 400短链 于 400段连接到 - 酶切载体 ,获得滴度为 05 05 苎麻 库,插入片段大部分分布在 5001500间 。 库中随机挑选部分克隆进行测序,得到 384 条序列,根据 准获得长度大于 150列,通过 到有效序列 275条,占总获得序列的 非冗余 核酸 序列 数据库 进行同源性 比对,有 序列( 99 条)显示与已知序列高度的同源性;与蛋白质数据库比对时有 200 条)显示与已知序列 有 高度的同源性。 通过 对获得有功能描述的基因(包括功能确定和推测功能的)大致分为 12 类,其中与蛋白质合成 (关的 基因 所占比例最大,占总基因数的 能量 ( 关基因 次之,占 细胞分化 (关基因 占 细胞信号传导 (关基因 占 代谢 (关基因 占 8%、次生代谢(关基因 占 1%、蛋白质降解 (关基因 占4%、转运 (关基因 占 10%、抗病及防御 (关基因 占 转录(关基因 占 13%、细胞结构 (关基因 占 功能不明确及未分类(关基因 占 8%。 2 类基因中, 6 个 丰度较高的基因(表达频率 4)有 42 条 占总数的 9 个 中等丰度的基因( 2表达频率 4)有 20 条 总数的 剩下的为低丰度表达 基因;与纤维发育的基因有 8 个, 共 14 条 占总 的 关键词 :苎麻,茎皮, 库,表达序列标签 .)a is an of Its is of in of to he of ST as NA .) at to ,by 00bp 05ml 05a of 00bp 500ST of 75 ST 50bp by 75 6% of 75 2 of to ,%),%),%),10%),3%),%)。 2 of 4), 4),.),ST( 文缩略表 英文缩写 英文全称 中文名称 苄青霉素 苷三磷酸 本局部相似性比对搜索工具 基对 炭酸二乙酯 化乙锭 肠杆菌 二酸四乙酸 达序列标签 本 培养基 密度 合酶链反应 of nd 端快速扩增技术 E 缓冲液 中国农业科学院硕士学位论文 第一章 文献综述 1 第一章 文献综述 苎麻( .)荨麻科苎麻属 多年生韧皮纤维作物 ,是我国主要纤维作物之一,也是 精纺 原料。早在春秋战国时期我国就开始种植苎麻(李宗道等, 1989),麻织物已有上千年的历史。我国目前是世界上最大的苎麻生产国,种植面积和总产量均约占世界的 90%以上。迄今为止,已收集、保存苎麻属种质资源 2000 多份(揭雨成, 2000)。由于苎麻纤维细度不足,粗硬有余,在 生产应用上存在较大的局限性。目前纺织市场提倡 “绿色 +环保 ”,植物纤维特别是棉花纤维占领了大部分市场,苎麻纤维 迫切需要提高 竞争力。因此,如何培育出 优质 、 多 抗、高产的苎麻 新 品种是目前国内外麻类 科学 工作者的研究热点之一。 进入 21 世纪后,现代分子生物学技术发展的十分迅速,而苎麻由于杂合性和多年生特性,遗传背景很复杂,在分子生物学尤其是功能基因组学方面一直 进度缓慢 。采用常规育种的方法,通过改良栽培措施,使苎麻的纤维品质、产量和抗性都有了较大的提高,但是还有一些问题是常规育种无法解决的,比如说 分子标记某个 与性状有关的 基因,这种高水平的定向改良目标必须在分子水平上进行研究。 ( 1993)分离了苎麻叶绿体 因 ; ( 1998)克隆了苎麻 1, 5( 2002) 克隆了 氢酶基因; 揭 雨成等( 2002)用 析了苎麻不同基因型的亲缘关系;周建林等( 2005)分离了苎麻的 13 个微卫星序列;( 2005)分离了苎麻 26S 核糖体 陈建荣( 2005)分离了苎麻木质素合成关键酶因 ; ( 2006)克隆了苎麻 因; 蒋彦波等( 2007)构建了苎麻富含 (GA)n 微卫星的部分基因组文库,以 18 个微卫星位点设计了 18 对苎麻微卫星特异引物。但对苎麻功能基因组的研究尚未见报道。 构建 库是研究生物功能基因组的基础,表达序列标签 (术 是功能基因组学研究的主要方式之一 。目前, 术已被广泛应用于新基因的克隆、组织特异性基因表达谱分析以及基因组序列的功能注释等许多研究领域。 序分析成为大规模获取功能基因一种最为快捷和有效的研究手段( et 997; et 000),已成为动植物功能基因组研究的基本工具。因此,通过建立苎麻茎皮 库,开展 序分析,可能在短期内获得大量的苎麻韧皮纤维功能基因表达信息,为更好的了解功能基因在茎皮组织中的表达提供分子生物学依据,从而为将来从分子水平调控苎麻的生长、发育、抗性和代谢规律打下理论基础。 库的构建及其研究进展 库是基因文库的一种。基因文库是指采用体外克隆技术得到的一个重组 子群体。按组成基因文库的重组 段的供体来源,基因文库可分为基因组文库和 库两类。基因组文 库 中 包括了基因组所有顺序的随机克隆片段 ; 库中重组 段则来源于细胞中表达的 某一特定类型细胞表达的 反转录酶催化形成与之互补的组克隆后得到的 库,反映的是来源细胞当时基因组表达出的基因序列信息。中国农业科学院硕士学位论文 第一章 文献综述 2 基因组文库 为研究提供 全基因材料与资料 ;而 库在研究具体某类特定细胞中基因组的表达状态以及表达基因的功能鉴定方面具有特殊的优势,从而使它在个体发育,细胞分化,细胞周期调控,细胞衰老和凋亡等生命现象的研究中具有更为广泛的应用价值,是研究工作中最常使用到的基因文库 。构建 库并非最终目的,使用这些文库才是主要目的,既从文库中分离到人们感兴趣的目的基因(沈倍奋, 2001)。 构建 库的基本原理和方法 经典 逆转录引物或 随机引物, 为 合成的 接到适当的载体中获得文库。 在构建 多种载体系统可供选择,主要有 噬菌体载体系统、质粒载体系统和噬菌粒载体系统。其中 噬菌体载体系统是在 载体本身的设计方面已相当成熟。 质粒载体的体 外操作简便,最大的优点是能够实现对 但利用质粒载体构建 要的缺点是文库中含有全长 库的库容量相对较小(沈倍奋, 2001) 。噬菌粒载体系统 是将质粒与噬菌体人工重组形成的一种基因克隆载体,目前应用较少。 库 构建 基本步骤包括: 提取 ( 要构建一个高质量的 库,获得高质量的 至关重要的,所以处理 品时必须仔细小心。由于 存在所有的生物中,并且能抵抗诸如煮沸这样的物理环境,因此建立一个无 的环境对于 制备优质 重要 );纯化分离 用反转录酶 导下合成 1 链 ; 2 链的合成 (用 H 和大肠杆菌 合酶 I,同时包括使用 菌体多核苷酸酶和大肠杆菌 接酶进行的修复反应 ); 合成接头的加入 ; 将双链 隆到载体中 ; 分析 入片断 , 扩增; 对 构建 的 库进行鉴定。 图 1经典 et 1996) of a 国农业科学院硕士学位论文 第一章 文献综述 3 库的种类 自 1976年 建 渐 发展完善的过程。初期 于当时技术的限制,主要适合于获得高丰度对于低丰度 了使 效满足研究的需要,近年来, 已发展了一些构建 经典 经典 )转录合成 过分级分离去除小分子 下分子量较大的末端平滑化,接上接头,克隆到能在细菌中扩增的载体中。随着分子生物学的发展, 经典 一,低丰度表达序列在文库中出现的机率很低,第二, 文库克隆的片段一般较小 ,单个克隆上的 能提供的基因信息很少,大多需要几个克隆才能覆盖一个完整的全基因的 et 994; et 997)。 全长 全长 指从生物体内一套完整的 是 长 且可以通过基因序列比对得到 外,还可以对蛋白质序列 进行预测及进行体外表达和通过反向遗传学研究基因的功能等。 均一化 or 均一化 某一特定组织或细胞的所有表达基因均包含其中,且含量相等的 库。 974)基于 类。随后研究进一步表明,绝大多数基因是处于中等或低等表达丰度的,在单个细胞中含有近 1 15个拷贝,而高丰度表达基因的转录产物在单个细胞中最高可达 5000个左右拷贝,约占总表达量的 25。这种基因表达能力上的巨大差异成了获得一个具有完整代表性的 表达量上的巨大差异更为大规模研究增添了困难。对单一组织的 拷贝基因序列的大量存在给基因的筛选和鉴定带来不必要的浪费,尤其是在大规模的 991)通过基因组 构建了均一化 库 。均一化 有利于研究基因的表达和序列分析。 这种文库主要有三方面的优点:第一,增加克隆低丰度 用于分析分化发育阶段的基因表达及突变检查;第二,等量化的 现基因组序列中的转录区,尤其是普通探针所不能发现的稀有转录区;第三,与原始丰度的 库作杂交, 可估计出大多数基因的表达水平及发现一些组织表达特异的基因 现在,在构建均一化的 种主要的观点:一种是基于复性动力学的原理, 高丰度的 低丰度的 而可以通过控中国农业科学院硕士学位论文 第一章 文献综述 4 制复性时间来降低丰度;另一种是基于基因组 过 拷贝存在的 一种方法的掌握对技术的要求比较高,对多数人而言需要多次摸索才能找到最适条件;而后一种方法易于掌握,但有研究者根据复性动力学的原理也提出了其不利因素,即采用基因组 前已报到的均一化 晏慧君等, 2006)。 差减 (差减文库也称扣除文库, 是反映不同组织和细胞或同一细胞在不同功能状态下,基因表达差异的 要用于研究细胞的发育、分化、细胞周期、细胞对药物和生长因子的诱导反应以及肿瘤等疾病的研究。其基本流程是: 使用两种遗传背景相同或大致相同但在个别功能或特性上不同的材料 (如不同基因处理细胞系或植物的近等基因系等 )提取 或反转录后合成在一定条件下用大大过量不含目的基因的一方作为驱动子 (含有目的基因的试验方 (行杂交,选择性的祛除两部分共同基因杂交形成的复合物,往往进行多次的杂交 祛除过程,最后将含有相关目的基因的未杂交部分收集后,并连接到载体形成文 库。消减杂交是构建差减 减文库是否构建成功很大程度上决定于差减杂交的效率( 骆蒙等,2000)。 差减杂交的方法主要有 (1)羟基磷灰石柱层析法 ( (2)生物素标记、链亲和蛋白结合排除法; (3)限制性内切酶技术相结合的差减方法; (4)差减抑制杂交法 ( (5)磁珠介导的差减法 (其中 et 991)。 1996)依据消减杂交和抑制 抑制性消减杂交技术 (n, 主要是利用抑制两端连接上同一接头的同源双链片段仅呈线形扩增,从而达到富集差异表达基因的目的( 罗志勇,2003)。近年来已成功应用于植物发育、肿瘤与疾病 (et 001)、以及外界因子诱导组织细胞中相关的应答基因 (et 001)的分析和克隆。 固相 门用来获得可再度利用的第一链合成池。但由于使用 合磁珠,使第一链不可回收的结合在磁珠上,而且以后的反应步骤也不能都在介质上进行,使得该技术应用并不十分广泛。 998)提出了一种新的 方法,克服了以前文库构建中存在的缺点,所用的酶和试剂与传统方法完全相同,不同的是 合成和修饰均在固相支持物 链霉素偶联的磁珠 (, 样在反应过程中就可以简便而迅速的实现酶和缓冲液的更换,所需时间短,从 天,并且构建的文库适合大多数的研究目的。 固相 不损失 且污染易于控制。另外,用此方法可以得到真实的代表性文库,它包含有短小的 是因为在克隆 之前省去了分级分离的步骤。总之,固相法构建 中国农业科学院硕士学位论文 第一章 文献综述 5 了其不足。这种方法简便、可靠 、低廉,而且所建文库质量高,因此它可能会替代目前流行的 库的 应用 随着分子生物学技术的发展,探讨生物相关发生、发展的分子机制的研究炙手可热,其中构建 便从中分离出相关基因的应用非常广泛,已取得令人瞩目的成绩。 而使它在个体发育、细胞分化、细胞周期调控、细胞衰老和稠亡等生命现象的研究中具有更为广泛的应用价值,是研究工作中最常使用到的基因文库。 发现并分离克隆新基 因始终是分子生物学研究的主要任务和目的,虽然 是,应用于分离新基因是其最重要的用途。前述的不管是哪种类型的文库,都可以用于分离新基因,只是使用的方法有差异。分离方法主要有两种:第一,对于非全长 不管是经典的 要利用已经获得的新 过 二,利用全长 从非全长 (1) of et 988),也称为锚定 oh et 989)或单向 et 989),只需知道目的 (5 3端 (3该法的主要特点是利用一条已知序列,设计特异性引物向缺失的方向延伸,利用一条与 )(3加至第一链的同聚尾 (5补 的通用引物,可以从未知末端向已知区域延伸 用06 107倍的富集,结果就产生相对纯的 一,从 且分析克隆是否存在缺失的片段,这一过程需要几周的时间;而 实验周期大为缩短,可以用更长的时间优化实验以产生全长 二,筛选文库只能得到很少的 而对序列进行分析和确认。 (2)用 通过对文库的筛选或适用简并引物进行 常只能获得不完整的 了得到 常要重新筛选文库。重新筛选文库工作量大, 应用该方法需重新提取 用 需提取 噬菌体 保守序列设计 别是在基因的两端变异较大而中间某区域保守的情况下,用 一转录产物,又是存在着不同的拼接方式,通过筛库的办法同时将不同 拼接方式的克隆筛选出来可能性较小,而使用 利于观察到不同的拼接方式( 刘建喜等, 2001)。 中国农业科学院硕士学位论文 第一章 文献综述 6 从全长 (1)标记探针 后再把这些菌落的样品吸印到硝酸纤维素膜或尼龙膜上;这时加入标记的探针,如果出现杂交信号,那么从盘上就可以把包含杂交信号的菌落分离、培养出来( 翟礼嘉等, 2004)。以此筛选出阳性克隆,进行序列分析,以获得 方法能避免 一种比较准确可靠的 要缺点是克隆过程需要一系列的酶促反应、产率低、费时长、工作量大。该方法适合于表达丰度高的基因的筛选分离。用于做标记探针的 这种情况下筛选出来的基因往往是已分离基因的同源基因;如果用于做标记探针的 者是特异分子标记子 么可以筛选得到新功能基因。 (2)反式 反式 链 尾连接,环化的 造成缺口或用 后用 2条基因特异性引物对重新线性化或变性的 式 采用了 2条基因特异性引物,因此不易产生非特异性扩增。该方法可以快速、高效地扩增 慧君等, 2006)。 目前,我国已经成功地构建了上百种 中包括芥蓝(王劲 等, 2000)、番茄幼苗(李明刚 等 , 1999)、玉米叶片(刘长征, 1995)、水稻种子( 周兆斓, 1996) 、花粉( 叶秋,2001) 、向日葵花蕾( 张领兵, 2001) 、油菜花粉( 江昌俊 , 1995)、茶树新梢(赵丽萍, 2004)的 于苎麻 术 随着人类基因组计划的完成 (et 001; et 001),人类已迈入后基因组时代,其中一个主要目标是从测定基因组序列、揭示所有的生命遗传信息,转移到解读这些序列所编码的基因及其功能并研究基因调控机制。但要确定数万个基因的功能和表达方式 是一项非常艰难的任务。 如何快速准确的从基因组序列中获取生物学信息,已成为一个急迫而富有挑战性的课题。表达序列标签( 术 (et 991;et 992)就是基于这种认识而发展起来的。经过数十年的应用, 术已经成为植物基因组学研究的一个强有力的工具,虽然开展稍晚,但成就惊人。在植物中,拟南芥由于基因组小、生活周期短等特点被选为第一个开展基因组计划的双子叶植物,该计划与 1991 年底实施,至今已有 个表达基因通过 鉴定出来,占拟南芥基因总数的 70%以上 (et 998)。 它的主要研究内 容包括:构建遗传图谱、分离和鉴定新基因、基因差异表达的研究、比较基因组学研究、制备芯片等等 (et 998; et 999; 1992)。 随着植物 基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速基因 克隆 研究,同时避免重复工作,节省开支,已成为一个急迫而富有 挑战性的课题,采用 生物信息学 方法延伸表达序列标签( 列,获得基因部分乃至全长 第一章 文献综述 7 克隆,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔 的空间。 术原理与方法 术是一种相对简便和快速鉴定大批表达基因的技术。从理论上说, 每条 表了一种模板 部分序列, 是长约 150短序列,由从不同组织来源的 库中随机挑取克隆,在 5或 3端测序获得。 一条典型的真核生物 子由 55端转录非翻译区)、 放阅读框)、 33端转录非翻译区)和 )四部分组成。任何一个基因其子 5端和 3端的序列都是特定的,所以对应的 5端和 3端的序列 则可以特异性代表生物体某种组织某个时期的一个表达基因。 数目可以表示所代表的基因的拷贝数,一个基因的表达次数越多,能够测得的相应 目也越多,通过分析 可得知基因的丰度和表达情况(武金华, 2004)。 技术步骤如下:基因编码区与 据比较 寻找感兴趣 度大于 100似介于 50 间) 所选 据库比较 找出未克隆 与 据库比较搜寻重叠群 设 计引物进行 增或筛选 库或索取克隆号进行电子拼接获取全长 基因定位、结构、功能检测分析等(王忠华等, 2001)。 在 据库进行 索 (标准:同源性介于 50%间) 在 据库进行 析,去

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论