(生物化学与分子生物学专业论文)细菌分子鉴定专家系统的初步建立.pdf_第1页
(生物化学与分子生物学专业论文)细菌分子鉴定专家系统的初步建立.pdf_第2页
(生物化学与分子生物学专业论文)细菌分子鉴定专家系统的初步建立.pdf_第3页
(生物化学与分子生物学专业论文)细菌分子鉴定专家系统的初步建立.pdf_第4页
(生物化学与分子生物学专业论文)细菌分子鉴定专家系统的初步建立.pdf_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 细菌是一类与我们生活息息相关的微生物,细菌出现在大约3 8 亿年前,它们极其 微小、形态简单,在环境中分布广泛,包括一些极端环境。细菌在生化循环( 碳、氮以 及其他矿物质) 、能源转化、生物催化等方面扮演着重要角色,这使得细菌在新的工业 和生物医学领域成为重要的特殊资源,然而目前我们已知的细菌种类还很有限,大概有 6 3 7 0 多种而已。 细菌传统分类的困难在于可以依据的形态特征十分有限。这些表型特征在一定程度 上反映了细菌的进化过程和现存菌种的亲缘关系。细菌分类鉴定方法由表型鉴定和分子 鉴定构成,主要包括细菌形态鉴定、生理生化鉴定、蛋白质水平鉴定和核酸水平鉴定。 核酸序列分析方法包括:d n a 碱基序列组成( g + cm 0 1 ) 、d n a d n a 杂交、d n a - r r n a 杂交、核酸探针、r d n a 指纹图谱、1 6 sr d n a 全序列测定等方法。 本研究主要是将已经发表的细菌1 6 sr d n a 序列信息按照不同种属、不同菌种进行 有目标性的重新收集,通过利用生物信息学软件对数据库中庞大的细菌1 6 sr d n a 序列 进行筛选,初步得到目标序列。然后将目标序列再次进行种属内的种间和种内比较,核 实收集过程是否有错误。通过上述过程证明收集的序列符合收集要求、信息相对可靠。 进一步将收集、整理、分析好的细菌1 6 sr d n a 序列形成数据库,以供使用。通过对数 据库中有关1 6 sr d n a 序列信息的限制性酶切位点分析,建立酶切体系,该体系根据不 同种菌株1 6 sr d n a 基因酶切位点有无、多少、形成片段大小的不同,鉴定不同属细菌 的种,区别于以往的1 6 sr d n a 基因序列测定鉴定方式,并以栖热菌属和肠杆菌属为例, 通过模拟试验对系统进行了验证。 关键词:细菌,1 6 sr d n a ,分子鉴定,限制性酶切位点,酶切层次 a b s t r a c t a b s t r a c t b a c t e r i u mb e l o n g st oak i n do fm i c r o o r g a n i s mw h i c hh a sac l o s er e l a t i o n s h i pw i t ha l l h u m a n i t y i to r i g i n a t e da b o u t3 8b i l l i o ny e a r sa g o ,w i t hc h a r a c t e r i s t i c so fm i c r o s c o p i c i n d i v i d u a l s i m p l em o r p h o l o g ya n dw i d e s p r e a dd i s t r i b u t i o n e v e ni ne x t r e m ee n v i r o n m e n t p l a y i n gi m p o r t a n tr o l ei nt h eb i o c h e m i s t r yc i r c u l a t i o n ( c a r b o n ,n i t r o g e na sw e l la so t h e r m i n e r a ls u b s t a n c e ) ,t h ee n e r g yt r a n s f o r m s ,b i o l o g i c a lc a t a l y s i sa n do t h e rf i e l d s ,c a u s e st h e b a c t e r i u mb e c o m e sa l le x t r e m e l ys i g n i f i c a n tr e s o u r c ei nt h ee m e r g i n gi n d u s t r ya n db i o m e d i c a l f i e l d h o w e v e r ,t h e r ea r el i m i t e dc a t e g o r yo nn a t u r a lb a c t e r i a ld i v e r s i t y ,a b o u t6 , 37 0v a l i d l y d e s c r i b e ds p e c i e s t h ed i m c u l t i e so nt r a d i t i o n a li d e n t i f i c a t i o no fb a c t e r i aa r el i m i t e di nt h e i rm o r p h o l o g i c a l c h a r a c t e r i s t i c s t h e s em o r p h o l o g i c a lc h a r a c t e r i s t i c sr e f l e c tt h ee v o l u t i o np r o c e s sa n dg e n e t i c r e l a t i o n s h i po fb a c t e r i a i d e n t i f i c a t i o nm e t h o d sc o n s i s to ft a b l e - i d e n t i f i c a t i o na n dm o l e c u l a r i d e n t i f i c a t i o n ,i n c l u d i n gt h es h a p ei d e n t i f i c a t i o n ,t h ep h y s i o l o g i c a lb i o c h e m i c a li d e n t i f i c a t i o n , t h ep r o t e i nl e v e li d e n t i f i c a t i o na n dt h en u c l e i ca c i dl e v e li d e n t i f i c a t i o n t h en u c l e i ca c i d s e q u e n t i a la n a l y s i sm e t h o di n c l u d e s :d n a b a s i cg r o u ps e q u e n c ec o m p o s i t i o n ( g + cm 0 1 ) , d n a d n ah y b r i d ,d n a - r r n ah y b r i d ,n u c l e i ca c i dp r o b e ,r d n af i n g e r p r i n ta t l a s ,16 s r d n ae n t i r es e q u e n c ed e t e r m i n a t i o nm e t h o d sa n ds oo n t 1 1 i sr e s e a r c hm a i n l yc o l l e c t e dt h ep u b l i s h e d16 sr d n ag e n es e q u e n c e sa c c o r d i n gt ot h e d i f f e r e n tk i n d sa n ds e p a r a t e dw i t hb i o i n f o r m a t i c ss o f t w a r e s c o m p a r et h eg o a ls e q u e n c e s w i t hi n t e r s p e c i e sa n di n t r a s p e c i e st oc h e c k e dt h ec o l l e c t i o np r o c e s s t h er e s u l tp r o v e dt h e16 s r d n ag e n es e q u e n c e sw e r ea c c o r dw i t ht h ec o l l e c t i o nr e q u i r e m e n t sa n dt h ei n f o r m a t i o n s w e r er e l a t i v e l yr e l i a b l e t h e nt h ec o l l e c t i n ga n dc l a s s i f y i n g16 sr d n ag e n es e q u e n c e sf o r ma d a t a b a s ef o ru s e u s e do ft h ed a t a b a s et oi d e n t i f i e dt h ed i f f e r e n ts p e c i e s t h r o u g ht h ed a t a b a s e o fi n f o r m a t i o na b o u tt h e16 sr d n as e q u e n c er e s t r i c t i o ne n d o u n c l e a s es i t ea n a l y s i s , e s t a b l i s h e ds y s t e mf o ri d e n t i f y i n gt h ed i f f e r e n ts p e c i e sa c c o r d i n gt ot h ea v a i l a b i l i t yo f r e s t r i c t i o ne n d o u n c l e a s es i t e s ,h o wm a n ys i t e sa n dt h ed i f f e r e n ts i z e so ff r a g m e n t s i ti s d i f f e r e n tw i t ht h ep r e v i o u sm e t h o d sw h i c hm e n s u r a t et h e16 sr d n ag e n es e q u e n c e s t a k et h e t h e r m u sa n de n t e r o b a c t e ra st h ee x a m p l e ,s u c hr e s u l th a sb e e nv e r i f i e db ya n a l y s i so f e l e c t r o p h o r e s i ss i m u l a t i o n k e y w o r d s :b a c t e r i a ,16 sr d n a ,m o l e c u l a ri d e n t i f i c a t i o n ,r e s t r i c t i o ne n d o u n c l e a s es i t e s ,s y s t e r m o fr e s t r i c t i o ne n d o u n c l e a s es i t e i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对j t , j o f 究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 签名:至造豇 日 期:如g 车峭 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签 名立旌碧l 导师签名: e l 期: 1 可一 r i 一9 黯f ) 2 第一章前言 第一章前言 1 1 细菌分类鉴定 1 1 1 细菌分类 细菌出现在大约3 8 亿年前,它们极其微小、形态简单,在环境中分布广泛,包括一 些极端环境【l 7 】。细菌在生化循环( 碳、氮以及其他矿物质) 、能源转化、生物催化等方面 扮演着重要角色,这使得细菌在新的工业和生物医学方法领域成为重要的特殊资源 8 - 1 0 】,然而目前我们已知的细菌种类还很有限,大概仅有6 3 7 0 多种【1 1 】,1 6 8 3 年荷兰人列 文虎克( a n t o i n ev a nl e e u w e n h o e k ) 在自制的显微镜下第一次看见的奇怪的小东西,9 0 年 以后才被证实为一类生物。人们认识周围事物总是从命名和分类开始。细菌分类鉴定就 是通过对细菌形态、结构、生理生化特性、分子信息等方面对某个菌属进行归类。这些 可以从著名的伯杰氏细菌鉴定手册中查到。这本1 9 2 3 年初版的手册,至u 1 9 9 4 年发行 到第9 版。此书前言中多次申明,它不是细菌分类的参照,而只是帮助人们辨认在环境、 临床等实践中遇到的细菌,是否属于已知或接近已知菌株【l2 1 。悠长的历史和微生物 的重要性帮助我们解释这些形式生命在形态学的、生理学的和基因方面的差异性吁! 。这 个巨大的基因变化是少数为了适应环境改变的突变和再结合事件的结果【l 引。细菌可以从 亲缘关系较远的生物体通过水平基因转移( h g t ) 交换和获取基因,因此细菌可以具有比 真核生物更快的物种形成速率【1 4 1 1 7 1 。各种鉴定技术的不断出现和已有鉴定技术的完善都 为细菌的准确分类鉴定提供了帮助。图1 1 是用“组分矢量”方法构建的细菌亲缘树。原始 数据包括1 7 个古细菌,1 3 1 个真细菌,还放了6 个真核生物作为参照。由于同一个菌种的 不同菌株,同一个属( “属”是生物分类系统“门”、“纲”、“目”、“科”、“属”、“种”诸层次 的最低一级) 的不同菌种在构树过程中总是聚在一起,在图中只给每个属留一个代表。 因此,也可以说这是一棵属树。最新的伯杰氏细菌系统手册大纲( 2 0 0 3 年l o 月) 把全 部细菌分成2 6 个“门”,这棵树上有来自1 6 个门的物种。首次有可能把基于1 6 sr d n a 的生 命之树以及基于组分距离的分子亲缘树同几代细菌分类学家的成果汇总,做仔细的比 较,发现它们高度一致,同时也揭示了一些并非偶然的差异l l 2 。 江南大学硕士学位论文 图1 - 1 细菌亲缘树 f i g 1 1s t a m m b a u mo f b a c t e r i a 1 1 2 细菌分类鉴定传统方法 传统细菌分类的困难在于可以依据的形态特征十分有限。显微镜下呈现球状的叫球 菌、双球菌、链球菌、葡萄球菌;棒条状的是杆菌、分枝杆菌、弯曲菌、螺旋菌等。可 以在显微镜下用染料加色,这是丹麦细菌学家革兰( h a n sc c r a m ) 在1 8 2 9 年发明的办法。 着色的称为革兰氏阳性菌,不着色的是革兰氏阴性菌。更进一步的一些做法是观察细菌 的生活方式,这里有固氮、脱硫、光合、厌气、嗜血、产甲烷等诸多区分。然而,这些 表型特征在一定程度上反映了细菌的进化过程和现存菌种的亲缘关系【1 2 】。细菌分类鉴定 方法由表形鉴定和分子鉴定构成,主要包括细菌形态鉴定、生理生化鉴定、蛋白质水平 鉴定和核酸水平鉴定。 2 第一章前言 分子水平鉴定发展起来以前,主要是进行表形的鉴定,也就是生理生化、形态等鉴 定方式,这些方式有很多的局限性,鉴定结果有时候也不是很准确,但是在细菌分类鉴 定方法的发展中又是极其重要的。常用的形态学方法主要有:培养特征、细胞形态及其 染色特性、特殊的细胞结构、运动性等等。生理生化方法与细菌酶和调节蛋白的本质和 活性直接相关,酶和蛋白质都是基因产物,对细菌生理生化特征的比较也是对细菌基因 组的间接比较。常用于细菌分类鉴定的生理生化特征有:营养类型、与氧的关系、对温 度的适应性、对p h 的适应性、对渗透压的适应性、代谢产物等等。 1 1 3 现代细菌分类鉴定方法 随着生物技术和分子生物学的不断进步和发展,细菌的分类鉴定技术也有了很多突 破,尤其是分子水平上的方法为细菌分类鉴定提供了相对于表形分析更可靠的依据。现 代鉴定方法更是多种多样,有免疫诊断技术、蛋白质图谱分析和核酸序列分析等。例如: 凝集试验、免疫酶技术、免疫荧光技术、放射免疫测定技术、免疫胶体金标记技术等都 属于。核酸序列分析方法包括:d n a 碱基序列组成( g + cm 0 1 ) 、d n a d n a 杂交、 d n a r r n a 杂交、核酸探针、r d n a 指纹图谱、质粒图谱、1 6 sr d n a 全序列测定等方法。 除此之外现在还有将几种方法结合的方法如将表形分析、基因型分析和以分类学为目的 的系统发育特征分析结合在一起的方法,这样的方法被看作是“多相分类方法”【l 鬈2 3 j ( 图 1 - 2 1 3 】1 图1 2 :应用限制性片段长度分析( r f l p ) 、扩增的r d n a 限制性分析( a r d r a ) 、变性梯度凝胶电 泳( d g g e ) 、温度梯度凝胶电泳( t g g e ) 、单链构象多肽性( s s c p ) 、荧光原位杂交( f i s h ) 方法 江南大学硕士学位论文 进行格局分析 f i g 。1 2u s e f u lc u l t u r ed e p e n d e n ta n dc u l t u r ei n d e p e n d e n tm e t h o d s r f l pr e s t r i c t i o nf r a g m e n tl e n g t h p o l y m o r p h i s m ,a r d r aa m p l i w e dr d n ar e s t r i c t i o na n a l y s i s ,d g g ed e n a t u r i n gg r a d i e n tg e l e l e c t r o p h o r e s i s ,t g g et e m p e r a t u r eg r a d i e n tg e le l e c t r o p h o r e s i s ,s s c ps i n g l e s t r a n d e dc o n f o r m a t i o n p o l y m o r p h i s m ,f i s hx u o r e s c e n c ei ns i t uh y b r i d i z a t i o n 1 2 信息学在细菌分类鉴定中的应用1 2 4 l 随着计算机技术的飞速发展,尤其是计算机高级语言的发展和微型机的普及,使 计算机在微生物分类和鉴定中得到广泛的应用。计算机应用于微生物分类始于数值分 类法( n u m e r i c a lt a x o n o m y ) 。所谓数值分类法,是通过广泛比较分类单位的性状特征, 然后计算它们之间的相似性,再根据相似性的数值划分类群的一种分类方法。数值分 类法的思想最初是由法国植物学家阿德逊( a d a n s o n ) 于1 7 5 7 年提出来的,由于缺少有效 的计算工具而未能实现。直到1 9 5 7 年英国生物学家施尼斯( s n e a t h ) 首先借助于电子计算 机进行细菌的数值分分类,这种方法才开始用于生物分类。数值分类法的分类原则不 同于传统的分类法,其中最重要的区别在于:传统分类法的分类特征有主次之分,而 数值分类法则强调所采用的分类特征同等重要,在划分类群时它们都具有同等的地 位。 数值分类的结果可用多种方法表示,其中树状谱图法由于直观明确而最为常用。 数值分类法是根据生物表型特征总的相似性分类,所以其分类结构所表示的是一种表 型关系,并不直接表示生物的系统发育,因此数值分类所划分的类群又称为表元 ( p h e n o n ) 或表观群( p h e m o t i cg r o u p ) 以区别于传统的分类单元。但通过对数值分类结构的 分析,可以把其分类结果作为建立或修改传统( 自然) 分类单元( 如种、属等) 的依据。数 值分类使生物分类从传统分类的定性描述发展到进行定量分析的水平,其主要目的是 建立一种客观的聚类方法,并实现聚类过程的自动化。 利用电子计算机鉴定微生物的方法,为数颇众,由最简单的检索法直到复杂的多 变量分析技术,如判别分析法、相关系数法、概率最大近似模型法等。简单的检索 法,是将传统的鉴定检索表或有关资料,存储于计算机的存储器内,进行微生物鉴定 时,将未知菌的试验数据输入计算机,计算机自动进行检索,然后输出结果。这种方 法虽然简单易行,但远不能满足现代微生物鉴定的要求,因而多变量分析技术,尤其 是概率最大近似模型法,最常用于计算机进行运算鉴定微生物,例如:大多数微量多 项试验鉴定系统、快速自动化微生物检测仪器,它们携带的计算机软件进行的自动分 析鉴定,就是用概率最大近似模型法进行。计算机用于微生物鉴定严格说目前应是辅 助鉴定,因为它不能代替人进行微生物特征的试验,而取得原始数据资料,然而,它 存贮、分析、处理极为错综复杂的庞大数据的能力和自动输出鉴定结果的功能,大大 提高了微生物鉴定工作的效率,奠定了微生物鉴定的快速、准确、自动化的基础。 1 31 6 sr d n a 基因序列信息分析在细菌鉴定中的应用 目前,在细菌的系统分类学研究中最有用的和最常用的分子钟是r d n a ,其种类少, 含量大( 约占细菌r n a 含量的8 0 ) ,分子大小适中,存在于所有的生物中,特别是其进 4 第一章前言 化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。由 于1 6 sr d n a 基因序列信息在细菌中的进化相对保守、稳定而且具有普遍性,所以目前 将1 6 sr d n a 基因序列信息作为细菌分类鉴定的重要指标。细菌的1 6 sr d n a 的可变区位 点结构如下【2 7 1 : 5 v lv 2 v v 4 v 5v 6v 7 v 8v 9 v 1 0 3 f i 4 0 b p9 7 0 b p i5 4 0 b p 目可变瑗、a r z a b l er e g d a vl 1 0 ) v l :6 卜l o e o p v 3 :4 3 6 - 。5 0 0 b p v5 :,3 扣7 钳b p v7 :9 9 0 1 0 4 脚 v 9 :1 2 4 0 - 。t 2 9 8 b p v :1 2 卜2 4 0 b p v 孝5 8 伊6 7 1 b p v 6 :8 2 妒s s = 奄p v 8 :1 1 l 护1 1 6 0 却 v1 0 :1 4 1 0 。1 4 9 z b p 口 恒定医( c o i l s t a n tr e g 白n ) 与传统的以细菌形态和生理、生化特性为依据的表型特征分类方法相比,1 6 sr d n a 基因序列测定在分析、鉴定细菌进化过程及亲缘性方面具有突出特点,其最大的优势是 检测速度快,这是常规的细菌鉴定和培养方法无法比拟的。另外,一部分用表型方法鉴 定有困难的细菌,用1 6 sr d n a 基因序列分析能进行准确地鉴定。目前,已对2 0 0 0 种( 约 占真细菌总数的5 0 1 以上真细菌的1 6 sr d n a 基因进行了测序1 2 7 】。 除了对1 6 sr d n a 基因序列直接进行比对和分析以外,还有很多应用1 6 sr d n a 基 因序列信息进行细菌分类鉴定的其他方法,比如:d n a 多态性分析、核酸( r n a ) 印迹杂 交及基因芯片技术、荧光定量技术、u p - - p c r 结合限制性内切酶图谱、多位点测定技 术( m l s t ) 等技术。其中d n a 多态性分析还包括单链构象多态性分析( s s c p ) 、末端限制 性片段长度多态性分析( t r f l p ) 等【2 8 j 分析技术。m l s a 技术主要应用的是编码i 斟a 聚 合酶0 【亚基的r p o a 基因和编码苯丙氨酰t r n a 合成酶的p h e s 基因1 2 9 。通过p c r 扩增 这两个基因后进行序列分析,并采用软件分析建立进化树【2 4 】或者进行g c 含量分析( 这 里的g c 含量分析指的是每同义位点发生同义替换的比率或是非同义位点发生非同义替 换的比率d s d n ) 等方法来确定细菌种属【2 引。 由于现代分析技术的不断发展进步,应用1 6 sr d n a 基因序列这个分子标记可以对 细菌进行微量、准确、快速的鉴定。但是由于1 6 sr d n a 基因序列分析方法产生时间不 长,2 0 年左右,所以其数据库相对还不是很完善,尽管数目是不断增加的,但其中的序 列信息存在错误,也有一定的误差,尽管还有很多的不足,可是这种方法也是目前对细 菌分类鉴定中最为常用的分子手段。而1 6 sr d n a 基因序列测定又是1 6 sr d n a 基因序列 分析方法中最为普遍应用的形式,由于序列测定过程中的不确定性,不能保证测得的序 列均为完整的1 6 sr d n a 基因,在接下来的比对工作中就会出现一定的误差,给鉴定工 作带来一定的困难,因此通过其它直接应用1 6 sr d n a 基因的方法来鉴定细菌的方法也 越来越受到关注。 江南大学硕士学位论文 1 4 常用的r d n a 基因序列数据库 1 4 1g e n b a n k ( h t t p :1 w w w n c b i h i m n i h g o v ) g e n b a n k 是目前研究者最为常用的一个基因数据库,它是1 9 8 2 年由美国国立卫生研 究院( n i h ) 、美国国立医学图书馆( n l m ) 、美国国家生物技术信息中心( n c b i ) 等机构 开始建立一个公共数据库,提供所有公开发表的核酸和蛋白质序列及其生物学注释以及 书目文献等信息。基因库中的基因数据出自3 0 ,0 0 0 多种不同的物种,现在每月有6 0 0 多 种新的物种加入到基因库中。 g e n b a n k 中的序列数据有来自于e m b l 、d d b j 、基因组序列数据库( g e n o m e s e q u e n c ed a t a b a s e ,g s d b ) 、美国专利局等核酸数据库的d n a 序列,也有来自于p i r 、 s w i s s p r o t 、p r f ( p r o t e i nr e s e a r c hf o u n d a t i o n ) 、p d b ( p r o t e i nd a t ab a r 墩) 等蛋白质数据 库的蛋白质和氨基酸序列。与m e d l i n e 生物医学文献数据库建立了交叉参考信息,可以 通过e n t r e z 、i g m 和p u b m e d 获取其中与序列有关的文献信息。在基因和染色体图像数 据方面,与分子模型数据库( m m d b ) 和蛋白质数据库( p d b ) 建立了链接,可以获取基因 的三维结构。在基因遗传疾病描述方面,加强了与孟德尔人类遗传学联机数据库( o n l i n e m e d e l i a ni n h e r i t a n c ei nm a n ,o m i m ) 的联系。使基因库成为综合性的序列数据库。更为重 要的是,g e n b a n k 提供了b l a s t 序列类似性检索。序列对数据库的类似性检索是核酸或 蛋白质序列测定之后首先要做的工作,而且有时能得到重要的发现。此外,短序列的类 似性检索有时能指导进一步的实验设计,或有助于实验结果的分析。目前绝大多数的1 6 s r d n a 基因序列比对工作都是在g e n b a n k 提供的b l a s t 序列类似性检索中完成的,这就 为细菌的分类鉴定提供了更为可靠的依据。 1 4 2d d b j ( h t t p :w w w d d b j n i g a c j p ) 日本d n a 数据库( d n ad a t ab a n ko fj a p a n ) 简称d d b j ,始建于1 9 8 4 年,是世界三大 d n a 数据库之一,与n c b i 的g e n b a n k ,e b i 的e m b l 数据库共同组成国际d n a 数据库, 每日都交换更新数据和信息、因此三个三个数据库之间是相通的。d d b j 主要向研究者 收集d n a 序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,也接受其他 国家呈递的序列。 d d b j 主要包括:数据库搜索 一g e t e n t r y ( d a t ar e t r i e v a lb ya c c e s s i o nn u m b e r se t c ) - s r s ( d a t ar e t r i e v a lb yk e yw o r d s ) 一h o m o l o g ys e a r c h ( f a s t a b l a s t s & ws e a r c h ) - t x s e a r c h ( r e t r i e v a lo fu n i f i e dt a x o n o m yd a t a b a s e ) 数据分析 - c l u s t a l w ( m u l t i p l ea l i g n m e n ta n dt r e em a k i n g ) 一u s eo f s u p e rc o m p u t e rs y s t e m ( j a p a n e s eo n l y ) 基因组分析 - d d b j c i bh u m a ng e n o m i c ss t u d i o ( n o wu p d a t i n g ) 6 第一章前言 一g i b ( i m e g r a t e ds e a r c ho fb a c t e r i a , a r c h a e a ,e u k a r y o t a ) - g t o p ( g e n o m et op r o t e i ns t r u c t u r ea n df u n c t i o n ) 蛋白质数据库和结构 - p m d ( p r o t e i nm u t a n td a t a b a s e ) - p d br e t r i e v e r ( b r o w s e rf o rp d b ) - s s t h r e a d ( p r e d i c t i o no fs e c o n d a r ys t r u c t u r e ) l i b r a ( p r e d i c t i o no f3 ds t r u c t u r e ) 1 4 3e m b l ( h t t p :w w w e b i a c u i d e m b l ) 欧洲分子生物学实验室e m b l ( t h ee u r o p e a nm o l e c u l a rb i o l o g yl a b o r a t o r y ) 于1 9 7 4 年 由欧洲1 4 个国家加上亚洲的以色列共同发起建立,包括一个位于德i 雪h e i d e l b e r g 的核心 实验室,及三个位于德国h a m b u r g ,法国g r e n o b l e 及英国h i n x t o n 的研究分部。 e m b l d n a 数据库于1 9 8 2 年由e m b l 建立,与美国的g e n b a n k 及日本的d d b j 共同组成 全球性的国际d n a 数据库。与数据库搜索有关的主要是e b i ,e b i 全称为e u r o p e a n b i o i n f o r m a t i c si n s t i t u t e ,欧洲生物信息学研究所,是e m b l 在英国h i n x t o n 的分部,重点 是与世界上其他分子生物学数据库进行合作研究,最主要的有e m b l 核酸序列数据库, 于1 9 8 0 年开始建立,随后参与了与日内瓦大学共同进行的s w i s s p r o t 的建设。在 s w i s s p r o t 与e m b l 核苷酸序列库之间的数据转移的基础上,产生了新的数据库 t r e m b l ( t r a n s l a t i o nf r o me m b l ) ,即使核苷酸序列库的核苷酸序列自动翻译成 s w i s s p r o t 蛋白序列库中的蛋白序列。 除了我们最为关心的数据库搜索之外,e m b l 还从事生化实验技术质谱分析( m a s s s p e c t r o m e t r y ) 、细胞生物学( c e l lb i o l o g y ) 、细胞生物物理( c e l lb i o p h y s i c s ) 、分化 ( d i f f e r e n t i a t i o n ) 、基因表达( g e n ee x p r e s s i o n ) 、结构生物学( s t r u c t u r eb i o l o g y ) 放射性杂交 数据库( r a d i a t i o nh y b r i dd a t a b a s e ) 等众多方面的研究。 1 4 4 其他相关网站 除了上述比较常用的三个数据库搜索网站以外,还有其他一些有针对性的数据库, 例如: o r g a n e l l eg e n o m ed a t a b a s e s : o g m p :o r g a n e l lg e n o m em e g a s e q u e n c i n gp r o g r a m g o b a s e :a n o r g a n e l l eg e n o m ed a t a b a s e m i t o m a p :h u m a nm i t o c h o n d r i a lg e n o m ed a t a b a s e r n ad a t a b a s e s : r n ab a s e :d a t a b a s eo fr n as t r u c t u r e s t 剐n ad a t a b a s e :d a t a b a s eo ft r n a s t r n a :t r n as e q u e n c e sa n dg e n e s s r n a :s m a l lr n ad a t a b a s e c o m p a r a t i v e & p h y l o g e n e t i cd a t a b a s e s : c o g :p h y l o g e n e t i cc l a s s i f i c a t i o no fp r o t e i n s d h m h d :h u m a n m o u s e h o m o l o g yd a t a b a s e 江南大学硕士学位论文 h o m o l o g e n e :g e n eh o m o l o g i e sa c r o s ss p e c i e s h o m o p h i l a :h u m a nd i s e a s et od r o s o p h i l ag e n ed a t a b a s e s n p s m u t a t i o n s & v a r i m i o n sd a t a b a s e s : a l p s b a s e :d a t a b a s eo fm u t a t i o n sc a u s i n gh u m a na l p s d b s n p :s i n g l en u c l e o t i d ep o l y m o r p h i s md a t a b a s ea tn c b i h g v b a s e :h u m a ng e n o r n ev a r i a t i o nd a t a b a s e a l t e r n a t i v es p l i c i n gd a t a b a s e s : a s a p :a l t e r n a t es p l i c i n ga n a l y s i st o o la tu c l a h a s d b :h u m a na l t e r n a t i v es p l i c i n gd a t a b a s ea tu c l a a s m a m d b :a l t e r n a t i v e l ys p l i c e dg e n e si nh u m a n ,m o u s ea n dr a t a s d :a l t e r n a t i v es p l i c i n gd a t a b a s ea tc s h l s p e c i a l i s e dd a t a b a s e s : a b i m :l i n k st os e v e r a lg e n o m i c sd a t a b a s e a c u t s :a n c i e n tc o n s e r v e du n t r a n s l a t e ds e q u e n c e s a g s d :a n i m a lg e n o m es i z ed a t a b a s e a m i g o :t h eg e n eo n t o l o g yd a t a b a s e a s d b :d a t a b a s eo fa l t e r n a t i v e l ys p l i c e dg e n e s 1 5 本论文的研究内容 由于目前的1 6 sr d n a 序列数据库相对庞大与繁杂,有些信息并不完整,使测序后 的序列比对工作变得复杂。本论文拟以细菌分类鉴定中最为广泛应用的1 6 sr d n a 序列 分析为研究对象,通过对上万条细菌1 6 sr d n a 序列信息进行搜索分析,从中甄选出符 合要求的1 6 sr d n a 序列信息,利用现代生物信息学技术和手段对这些信息进行处理、 比对、分析、整理,使这些信息形成有用的数据库。通过这个数据库,建立细菌鉴定的 专家系统。该系统对细菌1 6 sr d n a 基因不通过测定序列的方式而是应用不同的限制性 酶切形成的体系进行分类。 具体研究内容主要分为以下部分: 细菌1 6 sr d n a 序列信息收集。按照伯杰氏细菌鉴定手册第八版的不同种属从 g e n b a n k 中甄选长度大于1 2 k b ,序列信息完整、序列中没有错误的1 6 sr d n a 基因序 列。将分类收集好的序列信息进行种间和种内比对,核实序列的可靠性,建立一个细菌 1 6 sr d n a 数据库。 建立细菌鉴定专家系统。通过对各个菌属中不同种的1 6 sr d n a 基因序列进行限制 性内切酶酶切分析,建立各个属不同种之间的酶切体系,未知菌经过对1 6 sr d n a 基因 序列相应的限制性酶切,最后确定其种。 8 第二章细菌1 6 sr d n a 序列收集 第二章细菌1 6 sr d n a 序列甄选 2 1 细菌1 6 sr d n a 基因介绍 核糖体是细菌唯一的细胞器,是蛋白质合成的场所,它的沉降系数是7 0 s ,在适当 条件下解离成5 0 s 和3 0 s 两个大小亚基,两个亚基都含有r n a 和蛋白质。r r n a 按沉降系 数分3 种,分别为5 s ,1 6 s 和2 3 s 。5 s 和2 3 sr r n a 基因在5 0 s 亚基中,1 6 sr r n a 在3 0 s 亚 基中,它们是核糖体不可缺少的成分。1 6 sr d n a 基因是细菌染色体上编码r r n a 相对应 的d n a 序列,存在于所有细菌的染色体基因组中。1 6 sr d n a 基因约由1 5 4 0 个核苷酸组 成,并含有多个拷贝( 即转录单位) ,如大肠杆菌k 1 2 染色体基因组中,含7 个1 6 sr d n a 拷贝,而在一般情况下,细菌的其他结构基因都是单拷贝的网。 由于1 6 sr d n a 基因核苷酸序列总长度适宜,结构完整,更便于对细菌进行各种研 究。设计一对引物,以1 6 sr d n a 为靶分子在适当条件下进行p c r 扩增,便得到扩增后的 1 6 sr d n a 片段,用链终止法或化学降解法对片段进行测序,序列与基因库中的片段比 对,便得知未知菌与基因库中其他菌的相似性,从而完成对菌的鉴定。 2 2 材料与方法 2 2 1 序列收集 g e n b a n k ( h t t p :w w w n c b i n i m n i h g o v ) 、伯杰氏细菌鉴定手册第八版 2 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论