如何在genbank中查找一基因的序列_第1页
如何在genbank中查找一基因的序列_第2页
如何在genbank中查找一基因的序列_第3页
如何在genbank中查找一基因的序列_第4页
如何在genbank中查找一基因的序列_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

如何在genbank中查找一基因的序列1、在GeneBank中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信息的例子,/Sitemap/samplerecord.html,在记录的末尾有各种记录的详细说明,如果你没有accession号,可以把你手头的编号用source等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真的很别扭,希望对你有帮助。2、关于在GeneBank中查找序列我有几点体会:

最直接、最简单的方法是手头有基因的accession号;

如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息;

搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生物学操作or分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如果Gene数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq的序列,Refseq序列特征如下:

Accessionprefix

Moleculetype

Comment

AC_

Genomic

Completegenomicmolecule,alternateassembly

NC_

Genomic

Completegenomicmolecule,referenceassembly

NG_

Genomic

Incompletegenomicregion

NT_

Genomic

Contigorscaffold,clone-basedorWGSa

NW_

Genomic

Contigorscaffold,primarilyWGSa

NS_

Genomic

Environmentalsequence

NZ_b

Genomic

UnfinishedWGS

NM_

mRNA

NR_

RNA

XM_c

mRNA

Predictedmodel

XR_c

RNA

Predictedmodel

AP_

Protein

AnnotatedonAC_alternateassembly

NP_

Protein

YP_c

Protein

XP_c

Protein

Predictedmodel

ZP_c

Protein

Predictedmodel,annotatedonNZ_genomicrecords

aWholeGenomeShotgunsequencedata.

bAnorderedcollectionofWGSforagenome.

cComputed.

其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子;

其他未尽事宜大家补充!3、如何在genbank查找某个细菌的基因序列?你输入这个细菌的名字直接查,一般会有的~~~~~而且一般第一个会是全基因组序列~~~进入ncbi的首页,database选nucleotide,输入你的关键词,如果库里收录里就会有的4、如何查找基因序列?——在Genbank中寻找目的基因的实例(1)根据文献

搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开,在Search后的下拉框中选择Nucleotide,把GenbankID号输入GO前面的文本框中,点“GO”,就可以找到他了。

举例说明,例如:在2003年JBC的文章(ConditionalKnock-outofIntegrin-linkedKinaseDemonstratesanEssentialRoleinProteinKinaseB/AktActivation)中出现了“calreticulin(GenBankaccessionnumbergi16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。

在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy了)

这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。(2)点击AY047586后出现的界面如下:

如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。

呢?这就需要根据你自己查阅的文献以及在这些基因序列后面的解释来确定了。

如果我想找的基因是第一个序列即isoforma,就可以点击NM_001025366.1,得到如下界面:说来其实很简单,就是利用Genbank的检索功能。也许大家的检索文献能力很强,但是面对G

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论