




免费预览已结束,剩余3页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
利用NCBI相关资源电子定位基因的方法和实践第23卷第6期2003年11月孝感学院JOURNAIOFXIAOGANUNIVERSITYVOL.23NO.6NOV.2003利用NCBI相关资源电子定位基因的方法和实践李建华,陈锦华(孝感学院生命科学技术学院,湖北孝感432000)摘要:介绍了在NCBI上与电子定位基因有关的主要生物信息学资源,以人胰核糖核酸酶基因为例,探讨了运用生物信息学在NCBI中电子定位基因的几种方法.关键词:NCBI;基因;电子定位中图分类号:Q78文献标识码:A文章编号:1671-2544(2003)O6一O057一o3被称为基因组解剖学的基因定位,是遗传学研究中的重要环节1.基因位置的确定有助于了解基因的功能.在转基因技术的研究中,基因定位是确定供体基因在受体染色体整合位置的必要手段.近年来,随着生物信息资源的日益丰富和生物信息学的快速发展,使一种新的定位基因的方式电子定位基因成为可能.1NCBI上的生物学资源基因定位(genelocation)是指用一定的:疗法将目的基因确定到染色体的实际位置上.基因的电子定位是指利用日益丰富的生物信息学资源,运用生物信息学的方法,将目的基因确定到染色体的实际位置上.1.1NCBI简介3NCBI()是美国国家生物技术信息中心(Nationalcenterofbiotechnologyinformation),创建于1988年,其宗旨是开发和研究各种服务于生物医学领域的自动信息存取系统.NCBI管理着包括GeneBank,OMIM,MMDB,RefSeq,UniGene,dbSNP等多种大型生物学数据库,并且提供了多种数据库查询工具,以及多种数据库分析资源.是国际互联网上最大的生物学数据库之一.NCBI与设在美国国立卫生研究院(NIH)内的国家医学图书馆联合,提供近4000种有关生物医学方面的文献检索服务(其中有相当部分提供全文下载服务).此外,NCBI还提供大量免费软件如Blast,ORF等的下载服务.1.2NCBI上常用的生物学资源NCBI由七个部分组成引:1)数据库检索工具(Entrez,TheTaxonomyBrowser,LocusIink,TheQUERYEmailserver);2)序列相似性搜索程序BIAST家族;3)基因水平序列资源(UniOene,Refseqdatabase,dbSNP,ORFFinder,ElectronicPCR);4)染色体序列资源;5)基因组分析资源(EntrezGenomes,COGs,反转录病毒基因型分析工具;6)基因表达及表型分析资源;7)分子模拟数据库.其中可用于电子定位基因的生物学资源主要有以下几种.1.2.1GenBank数据库GenBank数据库由17个子库组成,存有超过105000个不同的生物体的核苷酸序列,每条Genbank数据记录包含了对序列的简要描述,它的科学命名,物种分类名称,参考文献,序列特征表,以及序列本身的碱基组成.此外,NCBI还提供广泛的数据查询,序列相似性搜索以及其它分析服务.1.2.2EST数据库对cDNA文库克隆的随机收稿日期:2003一O611作者简介:李建华(1969一),男,湖北孝感人,孝感学院生科院讲师.57李建华,陈锦华测序所得到的两端各200400bp左右的序列被称为表达序列标记(EST).在GeneBank等的EST数据库(dbEST)中有存有包括人,鼠,牛,猪,狗,线虫,水稻,果蝇等的大量的EST序列.l_2.3UniGene数据库UniGene序列是指被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的基因,有定位图和表达信息以及同其它资源的交叉参考.UNiGene数据库是将GenBank中的序列自动分隔成无冗余基因簇的实验性系统.UniGene数据库是一种包含有标记和序列标签位点(STS)序列信息的NBCI资源.由于绝大部分STS序列是由EST序列转化而成,可用EST序列,通过电子PCR技术,在STS数据库(dbSTS)中定位基因,寻找新基因以及获得全基因序列等.l_2.4电子PCR(E-PCR)电子PCR是用两段引物序列与STS数据库比较,以寻找一段核昔酸序列中有无STS序列,它可以帮助我们确认基因及基因作图.将一个查询序列同已经定位的STSs比较,来发现查询序列的可能的图谱定位.E_PCR通过查找在目的DNA序列中与定位标记的PCR引物非常吻合的子序列来找到STSs.这个子序列一定要有正确的顺序,方向,和间隔,以至他们可以合理的启动一个扩增出正确分子量的PCR产物.最新版本的E-PCR可搜索除了NCBIdbSTS数据库以外的其他资源.l_2.5BIAST家族BIAST是一种序列对库的对齐检索分析工具,有五种基本形式:BIASTP(一个氨基酸序列与一个蛋白质数据库比较);BIASTN(一个核苷酸序列与一个核苷酸数据库比较);BIASTX(一个核苷酸序列按六个阅读框翻译成氨基酸序列后分别与一个蛋白数据库比较);TBIASTN(一个氨基酸序列与分别按六个阅读框翻译成氨基酸的核苷酸数据库比较);TBIASTX(将用户输入的核苷酸序列和数据库中的核苷酸序列同时按六个阅读框翻译成氨基酸后再进行比较).l_2.6Entrez信息检索系统Entrez信息检索系统是NCBI的核心检索系统,管理了NCBI上的主要生物信息资源,同时提供对3D蛋白结构,基因组图谱信息和PubMedMEDIINE的访问.一58一Entrez包含了对每个数据库记录的预先计算好的相似搜索,产生一个相关序列结构,和MEDIINE记录的表.Entrez允许用户按照指定的识别号或按照自由词进行检索.使用IAnkout服务,外部资源可以被链接到Entrez纪录.2电子定位基因的方法和实践2.1利用同源序列电子定位基因由于生物间,特别是在分类学上亲缘关系近的物种间的基因具有很大的保守性,如人和鼠之间有9O以上的序列是相同的,反刍动物牛和羊的基因组基本相同,可共用一套微卫星标记.因此可根据已知的某物种的同源基因序列(氨基酸或DNA序列),利用NCBI资源,确定它在所研究物种染色体上的位置.现以电子定位编码人的胰核糖核酸酶的基因(RNAas1)为例,来简要介绍这种定位方法(从同源序列牛胰核糖核酸酶的氨基酸序列开始).1)联网至/blast,选择Standardprotein-proteinBIAST,选Translation,将牛胰核糖核酸酶的氨基酸序列(124aa)输入到检索框中,用Tblastn程序(如果输入的是基因组序列,用blastn程序)进行序列同源性检索.得到一批分值(score)不同的同源序列,从中可找到人核糖核酸酶基因在GeneBank中的编号为:BC005324.点击该记录的链接,可得到该基因在UniGene中的编号为SHGC_l1531以及其它相关信息.2)联网至http:/wWw_ncbi.nlrTLnikgov/,选择HumanGenomeResources,输入编号BC005324,检索,可得知该基因位于第l4号染色体长臂第l区第l带中的第l亚带,点击14ql1.1,可得到该基因的详细定位图谱及许多相关链接.3)联网至/entrez.fcgi,选择UniGene,输入通过步骤l得到的UniSTS编号(SHGCl1531),检索,由于大部分UniGene序列已经具有较为明确的利用放射性杂交(radiationhybrid,RH)技术所给出的定位信息,因此,据此编号就有可得到该基因在UniGene数据库中的定位图和相关信息.2.2利用EST序列进行电子基因定位联网至http:/rWw_ncbi.nlrTLnikgovge利用NIBC相关资源电子定位基因的方法和实践nome/sts/epcr.cgi,利用NCB1的电子PCR资源,输人待分析的EST序列(人胰核糖核酸酶),检索,得到其在GeneBank中的EST编号B123650,联网至http:/ncbi.nlm.nihgov/dbSTS,输入编号BI23650并检索,即可得到该基因在S1rS数据库(dbSrS)中的定位图和相关信息.2.3直接利用基因序列电子定位基因如果已经通过候选基因法等方法获得了目的基因序列,则可直接在GenBank中进行库同源性检索,得到该基因序列(人胰核糖核酸酶)对应的基因序列后,点击Genemeview,可观察其基因组结构,再点击染色体列表中对应的染色体及区域,就可获得详细的基因定位结果.3基因电子定位问题的几点思考1)基因电子定位是在后基因组时代发展起来的一种新的定位基因的方式,是传统基因定位方法的延伸.基因电子定位,对于充分挖掘生物信息资源,更好地了解基因的功能,基因间的相互作用以及基因的表达调控等,将发挥巨大的作用.2)由于生物信息资源种类繁多,数量庞大,并正在快速增长和不断更新【7,特别是在国际互联网上,各种信息间的交叉链接十分复杂.因此,运用生物信息资源(如NCBI)电子定位基因的:具体方法和途径也将是多种多样和不断变化的,但其基本过程可归纳为获得序列(同源序列,EST序列,目的序列)一检索一基因定位图.3)生物信息资源和相应的统计分析方法(含软件)是基因电子定位的前提和基础_8.因此,基因电子定位的应用对象和范围受到前者的制约,而其精确性则受到这两者的共同影响.4)虽然基因电子定位是建立在严谨的科学研究的基础之上,具有较高的可信度,运用电子方法定位基因,可以收到事半功倍的效果.但它毕竟是一种理论的定位方法,因此基因电子定位的结果只能作为我们进行相关研究的参考,其正确性必须接受科学实验的最终检验.参考文献贺林.解码生命一人类基因组计划和后基因组计划I-M,.北京:科学出版社,2000.MiguelAAndrade,ChrisSander.Bioinformatics:fromgenomedatatObiologicalknowledge,J,.Cur-rentOpinioninBiotechnology,1997,8:675683..王哲,黄高升.NCBI的数据库资源及其应用J.生命科学,2002,14(1):59-62.CRCantor.HALirrLElectrophoresis,Supercom-putingandtheHumangenomesM,.Worldscien-tificPubilishingPublishingCo,1991.王镜岩等.生物化学(第三版)M.北京:高等教育出版社,2002.施晓秋等.计算机科学在生物信息学中的应用J.浙江工业大学,2001,29(2):161-165.李衍达.信息科学与生物之谜J.世界科技研究与发展,2001,21(3):2630.TheMethodandPracticeofElectro-localizationofGenesbyUseofRelativeResourcesofNCBI11Jian一】lua,CHENJinhua(CollegeofLi.ScienceandTechnology,XiaoganUniversity,Xiaogan,Hubei432000,China)Abstract:Themainbioinformaticsresourcesrelatingtoelectro-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024届浙江省温州市高三上学期第一次适应性考试物理试题
- 泵考试题及答案
- 中日文化交流史知到智慧树答案
- 2025年度建材环保性能第三方检测与认证合同范本
- 2025版售楼处项目全生命周期服务合同
- 2025年度政府机关节能型电脑采购服务协议
- 2025版生猪养殖食品安全检测与监管合同
- 2025年图书店铺股权转让及版权合作框架协议范本
- 2025年度标准教育项目委托代理合同
- 2025年商铺租赁合同范本涵盖租赁期限及租金调整机制
- T-CITSA 57-2025 高速公路基础设施主数据标准
- 住院病人防止走失课件
- 2025年临床助理医师考试试题及答案
- GB/T 45767-2025氮化硅陶瓷基片
- 2025年云南省初中学业水平考试物理及答案
- 《化工安全技术》教学设计(教学教案)
- 主持人妆 男主持人上镜妆
- 安全伴我行-大学生安全教育智慧树知到答案章节测试2023年哈尔滨工程大学
- GB/T 2423.18-2021环境试验第2部分:试验方法试验Kb:盐雾,交变(氯化钠溶液)
- 安全文明施工措施费清单五篇
- 医院总务设备科管理制度
评论
0/150
提交评论