(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf_第1页
(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf_第2页
(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf_第3页
(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf_第4页
(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(细胞生物学专业论文)日本七鳃鳗(lampetra+japonica)口腔腺表达序列标签(est)分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

日本七蜒鳗( l a m p e t r aj a p o n i c a ) 口腔腺表迭序列标签( e s t ) 分析 日本七鳃鳗( l a m p e t r aj a p o n i c a ) 口腔腺 表达序列标签( e s t ) 分析 研究生:高琪 指导教师:李庆伟教授 学科专业:细胞生物学 中文摘要 七鳃鳗隶属于圆口绢,是一类爵营半寄生生活而引发机体显著特化的动物。由于其 一般结构甚为原始,在脊椎动物进化史上代表着动物已进入有头、有雏形脊椎骨,但还 无上、下颌这一发展水平,故在进化史上占有特殊地位,是现存的一类最原始的无颌类 脊椎动物。通过对这类动物的研究,可使人们对于生活在5 亿年前的古老脊椎动物有更 进一步的了解。长期以来人们对于七鳃鳗的研究多集中于形态学方面,而对于其基因组 学乃至蛋白质组学方面的研究却是空白。 选择日本七鳃鳗口腔腺为材料,以g u b l e r 和h o f f m a n 的c d n a 文库构建方法为基 础,用带有n o ti 酶切位点的o l l g o 矾l 耵k e rp 咖m 为反转录引物于c d n a 片段两 端添加e c o ri 连接位点,酶切后克隆于带有n o ti e c o ri 酶切位点的p b l u e s c r i p t i i s k ( + ) 载体上构建了库容量为2 i x l 0 6p f u m l 且插入片段平均大小为1 2 妨的符合文库构建标 准的日本七鳃鳗口腔腺c d n a 文库。在c d n a 第一链合成时,使用了r a v - 2 和s u p e r s c r i p t i i 两种逆转录酶确保了c d n a 第一链合成的质量( 包括数量和长度) 。在连接、克隆c d n a 的片段时,首先进行了c d n a 片段长度筛选,基本上除去了4 4 ) 0 b p 以下的c d n a 短片段, 借此提高全长c d n a 的插入效率。 随机挑敝库中的克隆子进行序列测定,去除序列申载体部分后经生物信息学初步 分析,共获得测序长度大于1 0 0 b p 且层析图谱较好的1 3 2 3 条e s t 序列。利用b l a s t x 及 b l a s t n 软件在n c b i 上的非冗余序列数据库中进行同源性对比分析,共有6 5 3 条( 4 9 3 6 ) e s t 可于蛋白质或核苷酸水平上找到同源序列,其中3 2 8 条与七鳃鲠科物种同源。同源 3 日本七蜒鳗( l s m g o t r oj s p o n l c a ) 口腔腺袁逸序列标签( 1 i s t ) 分析 序列功能分类大致分为1 2 类编码与蛋白质合成有关蛋白基因的f - s t 序列所占比例最 大( 2 7 9 ) 。1 3 2 3 条e s t 利用s e q u e n c h e r t m 软件进行片段重叠群分析( c o n t i ga n a l y s i s ) 获得了包括5 4 7 条序列在内的1 6 2 组片段重叠群并确定了8 条全长c d n a ,其中1 条已 通过p c r 扩增检测等手段初步确认为日本七鳃鳗血清白蛋白( 前体) 。 日本七鳃鳗口腔腺c d n a 文库以及e s t 数据库的成功构建,为研究日本七鳃鲠口腔 腺的功能基因和蛋白质组学奠定了基础。 关键词:日本七鳃鳗;口腔腺;c d n a 文库;表达序列标签 4 日本七鳃鲠( l a 删t r & j a p o n i c a ) 口腔臃表达序列标签( e s t ) 分析 1 文献综述 1 1e s t 技术简介 了解基因的详细结构和功能最直接的方法就是对其基因组进行全序列的测定,而真 核生物基因组庞大,其中仅有约2 3 的序列编码基因,例如人的基因组由3 1 6 4 7 亿个 碱基组成,约有2 的序列编码3 3 万个基因。直接从如此众多的碱基序歹0 中克隆基因, 尤其是要确定几万个基因的表达方式及相互问的关系,则相当的费时费力。但是如果 从基因的转录本- - m r n a 入手,进行基因的分离纯化及功能表达模式的分析定位,贝0 相 对的经济快捷i l 】。 基因表达遵从中心法则,在此过程中遗传信息的流向为d n a r n a 一蛋白质即 遗传信息由d n a 序列经转录、剪切后流向m r n a ,再经翻译产生有功能的蛋白质。一 个典型的真核生物m r n a 分子由5 - u t r ( 5 端转录非翻译区) 、o r f ( 开放阅读框) 、 3 - u t r ( 3 端转录非翻译区) 和p o l y a 四部分组成,其c d n a 具有对应的结构。对于 任何一个基因,其5 - u t r 和3 - u t r 都是特定的,即每条c i ) n a 的5 端或3 端的有限 序列即可特异性地代表生物体某种组织某个时期的一个表达基因。e s t 的数目可以显示 所代表基因的拷贝数,一个基因的表达次数越多,能够测到的相应e s t 也越多,所以分 析m r n a c d n a 即可获悉基因的表达情况和表达丰度吲。而以c d n a 测序为基础的e s t 技术就是基于这一认识发展起来的,同时f _ s t 也是相应物种全基因组测序计划的有益补 充。 e s t ( e x p r e s ds e q u e n c et a g s ) 是指通过对c d n a 文库随机挑选的克隆进行大规模 单向测序所获得的一些c d n a 5 端或3 端的核苷酸序列,其长度一般为3 0 0 5 0 0 b p 代 表了某个表达基因的一段信息圈。 e s t 技术则是将m r n a 反转录成e d n a 并克隆到质粒或噬菌体载体上从而构建成 c i ) n a 文库后,大规模的随机挑选c d n a 克隆,并对其5 或3 端进行单向测序,然后将 所获序列与已有数据库中的序列进行比对,进而获得对生物体生长、发育、代谢、繁殖、 衰老及死亡等一系列生理生化过程认识的技术p l 。 f s t 技术的快速发展主要得益于两个方面的因素:一是大规模自动化测序技术的日 趋成熟与完善。荧光染料及毛细管技术在d n a 测序技术中的成功应用,使得进入同一 根毛细管管道中的待测样品在较短时间内即可完成四种不同核昔酸的快速分离与识别, 从而大大简化了s a n g e r脱氧链终止测序方法的操作步骤。不同规格的毛细管全自动测 序仪和与之配套的高度自动化工作站的出现,使得人们在较短时间内准确获得数量庞大 5 ! 丝坠! 竺竺! 竺皇型型! 壁坠塑型坚竖! 坌堑 的d n a 序列成为可能。二是多种模式生物基因组测序计划的启动。大规模基因组测序 计划进行过程中,物理图谱的构建需要大量的s t s ( s i t e - s p e c i f i ct a gs e q u e n c e 位点特 异性标签序列) ,而s t s 的一个重要来源也是e 5 汀。此外,大量基因组序歹1 j 的功能诠释 也离不开e s t 的辅助( 4 l 。因此,无论是在人类、模式动物,还是模式植物的全基因组序 列测定计划的实施过程中,e s t 技术始终扮演着非常重要的角色。 5 e s t - - - - - - _ - - - - - - + 一4 - - _ _ _ - _ _ _ _ _ _ 。 3 - f _ s t 图1 - 1 e s t 技术原理圉 1 2e s t 技术的研究方法 e s t 技术的本质是通过对随机挑选的e d n a 文库中的阳性克隆子进行序列测定,然 后利用相关生物学软件对所获e s t 数据进行分析处理以获取大量信息,从而为某一生物 实验指明方向或提供素材的过程h 。其基本方法是首先从组织细胞中提取m r n a ,构建 成标准的c d n a 文库,然后从中挑取大量克隆子,利用载体通用引物铡出插入载体的 c d n a 片段5 端或3 端3 0 0 5 0 0 b p 的序列。将测序所得的e s t 与d b e s t 等数据库中的 数据进行比较分析,根据核酸或蛋白质序列的同源性比较,可以鉴定出哪些e s t 代表已 知基因,哪些e s t 代表未知基因,并对所得f s t 进行基因表达丰度分静一“。 1 2 1c d n a 文库的构建 用于e s t 研究的c d n a 文库主要包括两大类:一是普通的c d n a 文库,包括定向 插入c d n a 文库和非定向插入e d n a 文库。分析这类c d n a 文库中被测定c d n a 的丰 度,可以了解特定材料、特定时期、特定细胞或组织的基因表达情况。二是标准化的或 是经过差减而富集了的c d n a 文库。这类文库特别适用于寻找与某个特定研究目的直接 相关的低丰度表达基因。这主要是由于文库构建过程中将不同基因的表达频率进行了均 一化,甚至将许多与研究目的相关性不大的基因如管家基因进行扣除杂交而被去除从 而使得那些表达量低,但又与研究目的密切相关的基因得以富集的缘故。 1 2 2c d n a 文库中阳性克隆子的单向测序 e s t 一般是对c d n a 克隆子进行单向测序后所得,测序方向从5 端或3 端进行:但 也有些是从两端同时进行的。具体方向的确定还应该考虑到各自的特点。由于i n r n a 3 6 日本七蜒蛙( l s m p e t r a 向p 册,脚) 口腔雎表述序列标签( e s t ) 分析 末端有一段2 0 2 5 0 b p 的p o l y a 结构,靠近p o l y a 处存在的特异性末端非编码区序列几 乎是高度变异的l ”,因此从3 末端测序所得e s t 适宜作为基因特异探针,用于区分同一 基因家族中紧密相关的各个成员以及基因图谱的绘制嘲。相比之下5 末端序列非编码 区较小。包含的信息量大,适用于寻找新基因或研究基因的差异表这但以5 末端测 序也有其不利之处,如:m r n a5 末端存在二级结构,不利于合成全长c d n a ,也影响 测序反应的顺利进行。由于c d n a 合成过程中同一基因的不同m r n a 分子可以产生不 同长度的c d n a ,以及m r n a 的交替攒接等原因,c d n a 文库中同一基因有时具有不同 的5 末端起始序列,这样在进行序列多重比较时就会给判定是否来源于同一基因带来麻 烦。 1 2 3e s t 数据的分析与处理 e s t 研究的主要难点在于e s t 获取后如何对数量众多的序列信息进行准确、有效的 分析。数据分析的具体过程如下: 1 2 3 1 屎始序驯的氟茂疆 原始序列的预处理主要是针对克隆子的相应碱基序列而言的,预处理的主要标准是 其相应的碱基序列层析图谱。单个c d n a 克隆子测序后获取的原始数据一般包含有诸如 碱基的插,v 缺失、载体来源序列、较高的n 值、长的p o l y a 或p o l y r ,以及基因组d n a 、 细菌或真菌d n a 、线粒体d n a 、核糖体r n a 等污染序列的干扰。特别是碱基的插入, 缺失会造成移码突变,导致原始转录本编码信息的改变。因此,在使用这些e s t 数据前 进行质量控制是不可缺少的 8 1 。 随着基因组计划的相继实施许多软件可以实现完全的自动化处理,除了表1 - i 中 列出了几种常用的质量控制软件外,还有如d n a s t a r ,s e q e n c h e r t m 等一些商业软件可 供选择( 表i - 2 中的某些软件包也同样含有这类功能模块) 。 表1 - ie s t 序列质量控制常用软件 软件名称功能描述 获取方式 p h r e d 将序列峰图文件转化成核酸序列井生成质量控b g e u w a s h i n g m a e d e 制文件,以及根据质量控制文件获取有效序列 p h d 2 f a s t a 将质量控制文件转换成f a s t a 格式 b g e u w a s h l n g t o n e d u c r o s s m a t c h 根据载体文件去除载体序列p h g u w a s h i l 球o n e d u r e p e a tm a s k e r根据重复序列文件去除重复序列 m i t n o o t l “m b t w a s h i a g t o o e d u r e m o v ep o l y a a n d t 去掉太短的序列,截取长的p o l y a 和p o l y t ,去t 舡晒蜘瑚 m a n c a a s n e t 掉n 值超过9 5 的序列 1 2 3 2e s t 序别的泉嘉、拼接a 非冗案e s t 序列的获得 联汀代表了i n r n a 中的一部分信息,某一文库进行大规模序列测定后,那些表达 7 日本七蜒鳗( l a m p e t r aj a p o n i c a ) 口腔腺表选序列标鉴( e s t ) 分析 丰度较高的基因会被多次测到。而且测序量越大,被重复测到的冗余e s t 的数量和种类 就会越多,这是许多物种e s t 计划经常遇到的问题。对于从c d n a 两端分别测序的情况, 同一基因有可能被同时从5 端和3 端两个方向分别测到,产生两个方向相反的e s t ,甚 至二者之间会有一段重叠区域。建库过程中也有可能将某个基因打断,使得同一基因的 不同编码区段被随机分配到不同的克隆子当中,产生不同的e s t 。借助一些生物学软件 可去除这些冗余的重叠片段,使某些e s t 片段得以拼接和延伸( 见表1 - 2 ) 嘲。 表1 _ 2 序列拼接、聚类常用的几种软件 1 2 _ 3 3 与已有数据车避行序卿月膏健比对分枷 为了搞清实验所获f a s t 可能的功能,寻找新的未知基因,e s t 原始序列预处理后最 常用的分析方法是与国际互联网上公用数据库中的已有序列进行同源性比对,根据比对 结果判断所得e s r 片段可能的生物学功能,或者判断该e s t 是否为新的基因片段。 目前较为常用的e s t 数据库包括美国国家生物技术信息中心n c b i 的d b e s t ( h t t p :a v w w n c b i n l m n i h g o v d b f , s t m d e x h t n d ) ,欧洲生物信息学研究所e b i 所维护的 e m b l 数据库( h t i p :w w w c b i 扯u k c m b l ) 中的k s t 子数据库和日本国立遗传学研究所 的d d b j 数据库( h t t p :a v w w d d b j n i g a c j p ) 中的f - s t 子数据库。这三个数据库收录了有 关动物,植物、微生物的所有e s t 数据,并完全向公众开放。而且这三个数据库并不是 隔断的,他们通过计算机网络定期相互交换数据,以保证数据的完整性。在公共数据库 发展的同时,各种为特定物种或特定研究内容而建立的专业化数据库也发展起来,并呈 不断增长的趋势嗍。数据库中的数据一方面来自大型的e s t 测序中心,另一方面来自实 验室或研究者个人递交的序列,但序列均未进行拼接。 8 日本七蜒鳗( l a m p e t r aj a p o n i c a ) 口腔朦表达序列标签( e s t ) 分析 b l a s t ( b a s i cl o c a l a l i g n m e n ts e a r c h t o o l s ) 程序即基本局部相似性比对搜索工具, 是目前对e s t 数据库查询时使用最多的程序棚。b 脚程序运行速度快、准确度和灵敏 度高,而且运行结果可信度高,易于解释,同时程序及其代码完全免费“。目前绝大多 数公用数据库都提供基于b l a s t 的序列查询服甜“1 ( b l a s t 程序中常用的五种分支软 件见表1 - 3 ) 。 表1 3b i a $ t 程序的五种分支软件 1 2 3 4e s t 牟利的一潭性分套 基因的功能包括生化功能、生理功能和发育功能三大类,体现在生物体的生长发育、 繁殖分化、遗传代谢等生命活动的各个方面。目前,最常用的基因功能分类是基于e s t 序列的b i a s t 同源性搜索进行的。所谓同源性是指从b l a s t 搜索所得数据中推断出的 两个比对基因片段在进化上是否曾具有共同的祖先。如果两个基因或蛋白质具有惊人的 序列相似性,就认为它们之间曾具有段共同的进化历程。从而判断它们具有相似的生 物学功能【1 2 1 。但是这个推断在成为结论之前,还必须经过实验的验证。根据b l a s t 同 源性搜索的结果,多将基因功能具体划分为:代谢机能、能量代谢、细胞生长、分裂和 发育、转录、蛋白质合成、细胞运输、细胞结构、信号转导、细胞防卫、假想蛋白和分 类不明等种类旧。 在实际的研究工作中,将所得e s t 序列与n c b i 上的非冗余序列数据库进行b l 氍t ) ( 或者b i b t n 同源性比对,根据得分最高的同源性序列的生理生化功能特性将每条e s t 序列划分为某一类主要的功能基因并进行基因图谱的绘制,不仅可以获得对序列功能的 初步认识,而且有利于不同基因组间的研究比较。 1 3e s t 的主要应用 1 3 1 分子遗传标记 目前最有效的基因组作图方法便是s i s 作图。s t s ( s i t e - s p e d f i ct a gs e q u e n c e ,位 点特异性标签序列) 是指基因组中易于识别的且只出现一次的一段d n a 序列。长约 2 0 0 8 0 0 b p ,具有物种特异性,在人类基因组物理图谱绘制中作为标准标记冈。对某一 9 日本七鳃鳗( l a a t p o t j aj a p o n i c a ) 口腔腺表迭序列标签( e s t ) 分析 特定基因而言,e s t 3 末端非编码区的序列具有高度专一性,可作为s t s 用于基因组绘 图,因而e s t 是很好的s t s 来源。e s t 代表了某一基因的一段信息,研究发现长度大 于1 5 0 b p 的e s t 非常有益于基因图谱的绘制 2 1 。e s t 作为遗传标记最初应用于人类基因 组遗传作图。多数e s t 包含大量3 末段非编码区信息,f _ s t 已成为寻找多态性及分子标 记的主要数据来源,被广泛应用于s l i p 、s s r 等分子标记。 1 3 2 新基因的发现 发现新基因是当前国际上基因组研究的热点。而e s t 技术的应用使基因克隆技术发 生了革命性的进步。以e s t 为重要来源的染色体物理图谱的建立,进一步方便了对候选 基因的连锁分析。可将其确定在更狭小的染色体区段内,缩小了基因的候选范围。e s t 本身来源于表达基因的一部分,用其辅助c d h a 全长的筛选、基因组序列的鉴定等繁琐 的实验操作,可以大大提高工作效率。e s t 是c d n a 单向次测序的结果,不用过分追 究其碱基读取的准确性,因此利用e s t 获得新基因具有快速、高效的特点。 分析不同组织来源、不同处理条件f 的基因表达情况,不仅有利于分析不同条件下 的基因表达状况,而且通过与已有数据比较,可以一次性获取多个基因或蛋白质信息, 相对于传统的寻找差异表达基因的方法,利用e s t 技术辅助手段更易于快速发现多个新 的目的基因。 1 3 3 基因表达谱分析 基因的时空差异表达是有机体发育、分化、衰老和抗逆等生命现象的分子基础,研 究基因表达的方法有很多种:差示筛选法( d i f f e r e n t i a ls c r e e n i n g ) 、m r n a 差异显示法 ( d i f f e r e n t i a ld i s p l a y ) 、c d h a 代表性差异分析( r e p r e s e n t a t i v ed i f f e r e n t i a la n a l y s i s ) 、n o r t h e r n 杂交( n o r t h e r nb l o t i n g ) 、基因表达系列分析( s e r i a la n a l y s i so f g e n ee x p r e s s i o n , s a g e ) 、 c d n a 微阵列( c d n a m i c r o a r r a y ) 等。这些方法中,有的受到所分析转录本数量的限制, 有的所得序列过短,需要庞大数据库的支持,还有的费用昂贵,为一般实验工作者所不 及。相对而言,e s t 技术则具有多、快、好、省的特点,加之近年来基因组计划的实施 和相关技术的改进,多种生物的e s t 研究相应展开,使国际公共数据库中的e s t 序列 的数目更加丰富。 一般认为生物体某一生长时期的基因表达量约占全部基因总量的1 5 真核生物基 因的差异表达具有典型的时空特异性。e s t 序列代表了某段m r n a 的信息,某种e s t 数目越多,表明该e s t 所代表的基因在某一特定时期的表达量越多;反之:则表明该基 因的表达丰度较低。 传统的e s t 研究主要用于寻找新基因,是大规模筛选新基因的主要途径。随着e s t 数量的不断积累通过电子手段进行模拟n o r t h e r n 分析已成为可能。特定组织或器官 1 0 日本七妈鳗( l a m p o t j aj a p o n i c a ) 口腔靡表达序列标签( e s t ) 分析 c d n a 文库的构建和相应e s t 数据的分析,不仅可以准确展现不同来源细胞内的基因表 达的差异,而且还可根据基因表达的异同之处来推测某些基因可能的生理、生化或发育 功能【“。 1 3 4 基因组功能注释 功能基因组学的主要任务是基因组功能注释( g e n o m ea n n o t a t i o n ) 。所谓基因组功能 注释就是给d n a 序列加上生物学信息,识别并鉴定其所编码的基因及其它特点。其研 究内容分三个层次:基因组组成元件的识别,即o r f 识别;注释所有o r f 产物的功能 和基因袭达特征及基因问的相互作用;基因组进化i l ”。直接从基因组区域识别可能转录 的区域并非易事,因为绝大部分d n a 不编码基因转录本,而且转录的机理和转录本加 工的机制尚未完全明了,因此研究基因特别有效的材料就是c d n a ”。 基因组组成元件的识别般有两种方法:基因组中基因搜索( g e n s c a n ) 和同源 性比较。后者依靠查询蛋白质库和d b e s t 寻找编码区【1 j 。对于人类基因组而言,理论上 几乎全部的基因都能在d b e s t 数据库中找到有其对应的e s t 片段,借助这些礤汀不仅 可以判断一段d n a 中是否含有编码区,而且能精确地给出该基因外显子与内含子的剪 接方式,所以可用于前体m r n a 剪接机制地研究。因此,e s t 技术还经常被运用于基因 内含子、外显子排列地精确预测,选择性剪接地识剔。反常基因组排列结构地识别等方 面。 f _ s t 在基因组注释方面的精度上有一定的局限,这种局限性来源于f _ s t 测牟方法的 误差和在独立基因( u n i g e n e ) 的聚类拼接过程中可能将同源性较高的不同基因混杂在一 起,还有许多应用程序对部分序列是不合适的1 1 】。 l - 3 1 5 制备c d n a 4 j t f a ) - 列 芯片技术是近年来发展起来的一种研究功能基因组学的方法。核酸芯片主要有基因 组d n a 芯片和c d n a 芯片两类。目前,e s t 已成为制各高密度c d n a 芯片微阵列研究 基因表达的主要材料来源。c d n a 微阵列( c d n a m l c j r o a n a y ) 是将c d n a 片段、p c r 片 段、寡聚核苷酸固定在固相支持物上,形成高密度点阵列,然后与m r n a 反转录生成的 荧光素标记的第一链e d n a 探针杂交,杂交信号被检测系统自动采集并量化分析,从而 反映出待测组织某一发育时期或特定处理后的基因表达种类与频繁的过程。c d n a 微阵 列技术在人类疾病基因表达谱、疾病相关新基因的发现等方面研究甚多i 。 1 3 6基因表达的动态性研究 随着大量e s t 数据的积累,e s t 数据库是检测同源基因序列、外显子作图、揭示基 因差异拼接的有效工具。在真核生物中,大量基因在功能上是重复的,因此存在很多同 源基因家族。r n a 拼接是真核生物基因组的动态特征,特别是交替拼接( a l t e r n a t i v e 1 1 日本七蜒鳗( l a n p e t r aj a p o n i c a ) 口腔臃表迭序列标签( e s t ) 分析 s p l i c i n g ) 大大增加了基因功能产物的复杂性。因此e s t 所提供的关于基因组结构和功能 的信息比基因组序列更具有动态感,更能真实的反映基因组的功能。 1 3 7 基因电子克隆 利用e s t 数据库发现新基因也被称为基因的电子克隆。其基本方法是找到属于同一 基因的所有e s t 片段,再把它们连接起来。由于e s t 序列是全世界很多实验室随机产 生的,所以属于同一基因的很多e s t 序列必然有大量重复小片段,利用这些小片段作为 标志就可以把不同的e s t 连接起来,直到发现了它们的全长,这样就可以说通过电子克 隆找到了一个基因。如果这个基因与已知基因库比较,没有匹配的基因序列,那就找到 了一个新基因。但是由于进行电子克隆程序设计复杂,计算量巨大,一般的p c 机难以 完成任务,因此很多基因组学和分子生物学网站开始提供网上电子克隆的服务( 见表 1 _ 4 ) ,只要把自己感兴趣的序列通过网络提交。等待返回结果即可嗍。 表1 - 4 基因电子克隆的常用膀址 常用资源 同址 n 删h t t p :w w w n c b i n l m n t h g o v l o c n m k h t i p j w w w n c b i 血n l n i k g o v g e n b a n k u n i c t n e h t t p :w w w u c b i n l m , n i h g o v u n i g e n e :m d e x h t m l b l a s t h t t p :w w w n c b l u h n m h g o v b l a s t s i s h t t p ;w w w n c b l n l m n l h g o v s t $ u n i b i m t h 却埘鲰吐霉哪i t u n i b l a s t u n i b l a s t h t m l t 培, e m se s t n m c h i n eh t i p 柏h g 。m j 旺s 1 h 曲i n e 咖l 1 3 9 e m s e s t e x w a d h t l p :,g c g 吨c m j 唧 s 】e n r 锄e s t 味恻h 叫 t - r i c h 呻悯n l l 洫即啪i 由枷a 址嘣佃血曲曲l a 吼 e s t b l a s t h t t p :m , , , w h g m p m r c a c ,u l r e s t b a s t m a g e 址i p 撕j l i 弘v 帖i p 6 m a 簪, 用电子克隆的方法发现新基因也存在很大的弊端,搜索相似性序列相似度的设定和 序列拼接参数的设定直接影响最终的结果。如果参数限制条件太低,很可能会得到错误 结果:而参数条件限制太高,就可能没有结果。对于所拼接出来的基因还需要从生物学 意义上进行分离和鉴定。 1 4 e s t 研究的局限性 e s t 技术在基因发现方面具有规模化、高通量、高速度等传统方法所不具备的优越 性,但与其它所有技术一样,e s t 技术也有其自身无法突破的局限性。 一、e s t 序列是一次性测序所得,不可避免的包含错读碱基序列。d n a 序列的错误, 1 2 日本七鳃鳗( l a m p e t r aj a p o n i c a ) 口腔糠表迭序列标签( e s t ) 分析 特别是那些导致阅读框架改变的移码突变会降低e s t 编码区与全长蛋白质序列比对的 可靠性。 二、e s t 通常只编码一个蛋白质片段,所获得的比对结果往往是不稳定的。 三、当前技术上的限制使得绝大多数研究所用材料均来自不同的细胞类型、某种组 织、某个器官,甚至选取整个生物体作为e d n a 文库构建材料,因此所获取的e s t 就是 一个有关许多细胞类型,参与许多生物过程的基因片段,往往无法获得某特异生理过 程中特异细胞类型的基因表达信息。 四、多数基因的调控序列均位于内含子内,由m r n a 反转录所得c d n a 序列并不 包含这部分信息,因此单单研究e s t 数据会丢掉许多有价值的序列信息。 1 5 七鳃鳗e s t 研究现状 七鳃鲠隶属于圆口纲( c ) r c | o s t o n 姐t a ) ,是一类因营半寄生生活而引发机体显著特化的 动物。由于其一般结构甚为原始,在脊椎动物进化史上代表着动物已进入有头、有雏形 脊椎骨,但还无上、下颌这一发展水平,故在进化史上占有特殊地位。从寄生习性和特 化结构来看,圆口纲并不在进化的主干上,而是c a 古老的原始脊椎动物分化出来的一个 盲支与寒武纪晚期底栖的甲胄鱼类有共同的祖先,是现存的一类最原始的无颌类脊椎 动物。通过对这类动物的研究,可使人们对于生活在5 亿年前古老脊椎动物有e :进- - f f 的了解。 图1 - 2 脊索动物系统发生树 o|o口atm 日本七蜒鳗( l s 口p o t r oj a p o n i c a ) 口腔臁番达序列标签( e s t ) 分析 长期以来人们对于七鳃鳗的研究多集中于形态学方面,而对于其基因组学乃至蛋白 质组学方面的研究却是空白。由于七鳃鳗在脊椎动物进化史上所占据的重要地位,因此, 对于七鳃鳗的研究具有其它物种研究所不可替代的作用。 在n c b i 上的d b e s t 数据库中检索发现:目前已经发表的七鳃鳗科内物种的e s t 序列共有3 2 7 6 9 条,其中的绝大多数( 9 9 9 6 ) 序列都来自海七鳃鳗( p e t r o m y z o n m n 砌淞,3 2 7 5 5 条) 。而这部分序列又集中于骨髓、淋巴细胞、免疫激活淋巴细胞和前肠 等组织以及胚胎期的幼体。b 本七鳃鳗e s r 序列仅有一条( g e n b a n k 登录号:a b l 0 7 晒3 ) , 来自后脑组织。除此之外,公共数据库中有关日本七鲳鲠基因或蛋白质的序列信息也很 有限( 共8 2 条核酸序列和8 0 条蛋白质序列) 。值得注意的是在近一年的时间内,海七鳃 鳗e s t 的数据量呈大幅度增长,即从2 0 0 5 年4 月时的1 0 6 1 8 条迅速增加到了2 0 0 6 年4 月的3 2 7 5 5 条。由此可见。现在越来越多的科研人员已将研究的重心转向七鲳鳗基因组 和蛋白质组学方面。由于在材料获取上存在一定的困难,使得美国、加拿大、奥地利等 很早就开展海七鳃鲤研究的国家的科研人员目前还未涉足到日本七鳃鳗的研究领域当 中。 1 4 日奉七鳃鳗( l a m p e t r a 如p o n i c a ) 口腔腺表选序列标茎( e s t ) 分析 2 日本七鳃鳗口腔腺c d n a 文库的构建 2 1 材料与方法 2 1 1 材料 实验用日本七鳃鳗( l a r a p e r r a j a p o n i c a ) 3 0 0 余条于1 2 月中下旬捕自黑龙江省松花 江流域同江地区。用装有冰水的泡沫保鲜盒盛装运回。 p c r 引物:b c a b e s t 砖r m l 埘,b c a b e s t p r i m e r r v - m ,o l i g o d r ( 1 町l i n l r p r i m e r : 工具酶:r e v e r s et r a n s c r i p t a s e ( r a v - 2 ) , d n ap o l y m e r a s ci ,t 4d n ap o l y m e r a s e ,i 4 d n a l i g a s c 、t a k a r al a t a q t m ,s u p e r s c r i p ti i ,r i b o n u c l e a s eh a 珊; m a r k e r :d n a m a r k e r d l 2 0 0 0 ,d n a m a r k e r d l l 5 0 0 0 ,k - h i n d i h d i g e s t ; 试剂盒:r n a 提取试帮盒( t f i l r e a g a m k i t ) ,o l i g t 她x - d t o o ) : 克隆载体:p b l u e s c t i p t i is h + ) ; 菌种:e c o l ie l e c t r o - c e l lj m l 0 9 。 以上试剂均由宝生物工程( 大连) 有限公司提供。 2 1 2 方法 文库构建参照参考文献【2 2 】中所采用的方法。具体过程如下: 2 1 2 1a 眉u 嚷总r 惝鲴l 取 ( 谰离新鲜的日本七鳃鳗的口腔腺组织共约6 9 ,迅速放入事先加有液氮的研钵中充 分研磨。 加入2 0 dt f i z o lr e a g e n t 鼬j 后用铝箔纸密封待其融化,时间大约为1 h 。 将融化后的样品快速转移到匀浆器中进一步匀碎。 随后将样品移a 2 m lt u b e 中,2 5 恒温水浴5 m i n 。 ( m 、1 2 , 0 0 0 t p m 离- 0 1 5 m i n ,取上清至另外的2 m lt u b e 中,每个1 、i b e 中加a 1 5 体 积的氯仿振荡混匀后2 5 恒温水浴3 m i n 。 ( 斟、1 2 , 0 0 0 r p m 离一d , 1 5 m i n ,并加入等体积的异丙醇,2 5 c 恒温水浴1 0 m i n 。 嗄5 4 c 、1 2 ,0 0 呻m 离一0 2 0 m i n ,弃上清加入冷乙醇l m t 。 蚪、l o , o o o 唧离一心5 m i n ,弃上清待沉淀干燥后溶于适量的d e p c 水中。 ( 弧适量的总r n a 于6 5 、1 响纽热变性后进行1 琼脂糖凝胶电泳检测。 2 1 2 2 口眉迥m r n a 的分离眦 取2 5 q i l g 的总r n a 加入d ,c 水( d e p c 水预先处理且砌q a 专用) 至1 5 0 山。 ( 粥液体样品转移到1 _ 5 m 仙e 中,加入1 5 m l2 x b i n d i n gb u f f e r 和l 剐 日本七蜒鳗( 血印e f 巾j a p o n i c a ) 口腔腺表迭序列标签( e s t ) 分析 o l i 笋【c 】【n 钿a 于7 0 恒温水浴3 n 曲,然后室温放置l o m i n 。 室淘t 1 5 , 0 0 0 r p m 离心,弃上清后加入3 5 q c | lw a s hb u f f e r 仔细混匀0 1 4 ,o 把x 叽b 0 ) ,并 将全部样品移入装有过滤柱i 挣r u b e 中,室温1 5 , 0 0 0 r p m 离一g , 3 0 s 。 向过滤柱中再次女d a 3 5 0 # ! w a s hb u f f e r 黼匀o l i g o t e x d t 0 0 ) ,室温1 5 , 0 0 0 r p m 离, c , , 3 0 s 。 将过滤柱移入新的1 5 m l 的t u b e 中,加入7 0 的d e p c 水2 5 f 1 1 混匀o l i g o t e x - d t 0 0 ) , 随即室温1 5 , 0 0 0 r 瑚,c , 3 0 s 。 重复步骤即再次加入7 0 的d e p c 水筠一混匀并室温1 5 ,0 0 0 1 p m 离心3 0 s 。 回收后的l l l 】盼狐总计5 叫,1 琼脂糖凝胶电泳进行检测。 2 1 2 3d 沸唯的蕾成 ( 泌轴l n 时憾溶液于m i a i m l b e 中,加入2 卸dp h 7 5 的1 0 m mt r i s - h a 混匀后6 5 保 温5 m i ,随后放入冰中冷却。 于该m i c r o t u b e 分别加入2 舡ll o x l s ts l r m db u f f e r ,2 5 m0 1 m md t r ,1 j 埘 l o m m 郴m i x t i l r c ,珈ln o tio _ l i g od t ( m ) g 1 l k e rp r i m e r ( 1 j 与c g 似i ) ,1 坩r i m s ei n h b i t o r ( 4 0 u ,x 弘ld e c * 后室温静置1 0 m i n 。 加入2 “lr a v - 2 反转录酶后4 2 保温5 呖i i n 。 加入抽l s u p e r s c r i p t i i 酶后蝴3 0 m i 。 将总体积2 鲫的c d t 队第一链的合成反应体系( 见表2 1 ) 置于冰中保存。 表2 1c d n a 第链合成的总反应体系 试剂体积( 脚) m 】蝌a 溶液 1 n n mt z i s - h c l ( p h 7 5 、 1 0 x l s t s l r a n db u f f e r 0 1 m m m l o m md n r pm i x t u r e n o ti 吼咖幔l s ) ii n k e r p r i m e r ( 1 6 m ,a ) r m i n h i b i t o r ( 4 0u ,帅 d e p c * r a v - 2 反转录酶 s u p e r s c r i p t l i 酶 5 ( 犯坪毽) 2 5 2 f 5 2 _ 5 1 5 总体积 1 6 ! 查主塾竺! ! ! ! 兰! 竺丝竺! 竺! ! 些坚! 塑型塑墨! ! ! ! ! 坌堑 2 1 2 4c d n a 第= 艇的合成 于2 酗1c d 州a 第一链反应体系1 s ts t a n d r e a c t i o nm i x t u r e 中分别加x 2 0 5 i t l1 0 2 n d s t r a n db u f f e r , 7 5 l0 1 r a md 1 t 3 “l1 0 m md n t pm i x t u r e ,1 2 即lc o l dd h 2 0 后冰中冷却 5 r a i n 。 之后依次加入2 靴lr u a s eh ( 0 8u 脚和1 铷ld n ap o l y m e r a s ei ( 4u 弘1 ) ,最终体积 为2 0 l m 的c d n a 第二链的合成反应体系( 见表2 - 2 ) 于1 6 c 环境中反应2 5 h 。 表2 - 2c d n a 第- - 链合成的总反应体系 试剂体积0 a ) 1 s t s t a n d r c a 甜o n m i x t i l r e 1 0 x 2 n ds t r a n db u 彘r 0 1 m m d t f 1 0 m m 由哪m i x t a c o m d h 2 0 r n 黯c h “1 8 u ”1 ) d n a p o l y m c r a s e1 ( 4u o a ) 2 6 2 0 7 5 3 1 2 8 2 j 1 4 总体积 2 0 l 反应液经苯酚,絮【仿处理后,进行乙醇沉淀。 将沉淀溶于3 铋l 终浓度o 1 的t eb u f f e r 中。 2 1 2 5 双i c d ! 爿口平溪囊嚏 于已制备的3 懈链c i n 愀中分别加入1 0 p 11 0 x t 4p o l y m c r a s eb u f f e r , 驯 2 s m md n t fm i x t u r e ,j 圳t 4d n ap o l y m e r a s e ( 1 u 加1 ) 和5 q u ld h 2 d 配置反应溶液,将该 m i c r o m b e 置于7 环境中保温3 0 i i 曲。 总体积为1 0 0 | c l 的反应液经苯酚傣【仿处理后,进行乙醇沉淀。 将沉淀溶于讪 q r e b u f f e r 中,一2 0 保存。 2 1 2 6 鼠链c d 咐a 柬靖的a d a 舯 龟接 取经电泳检测合格后的双链c d n a :溶 葭4 l 于m 胁h l b e 中,随后分别加入2 m1 0 x l i g a s eb u f f e r , 枷1 0 m mr a t p , e c o ri - s m aia d a p t o r ( 0 3 撕1 ) 和9 舡1d h 2 0 配置反 应溶液,于冰中冷击口s m i n 。 加入1 捌1 t 4d n ai i g a s e ( 3 5 0 u 弘1 ) ,8 c 环境中保温过夜反应。 7 0 c 保温3 嘶面后加a s 脚n o ti 和2 弛l 研i 补充液,3 7 反应2 h 。 2 1 2 7 s p i nc o l u n m 蜘l t 4 t - 反复上下颠倒悬浊c o l u n m 内的g e l 。 先取下上盖后,慢慢去下下盖,c o l u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论