如何在genbank中查找一基因的序列_第1页
如何在genbank中查找一基因的序列_第2页
如何在genbank中查找一基因的序列_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、如何在genbank中查找一基因的序列Ge nBa nk是美国国立卫生研究院维护的基因序列数据库,聚集并注释了所有 公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注 释 的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另 外一些那么按照生成这些序列数据的技术方法划分。目前GenBank中所有的记录 均来自于最初作者向DNA序列数据库的直接提交。这些作者将序列数据作为论 文的一局部来发表,或将数据直接公开。GenBank由位于马里兰州Bethesda的 美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库DDBJ以及欧洲生物信息研究院的欧洲分

2、子生物学实验室核苷酸数据库EMBL 一起,都是国际核苷酸序列数据库合作的成员。所有这三个中心都可 以独 立地接受数据提交,而三个中心之间那么逐日交换信息,并制作相同的充分 详细的数据库向公众开放虽然格式上有细微的差异,并且所使用的信息系统也 略有不同。Gen Ba nk数据库格式的详细说明 :/ ncbi. nlm. /Sitemap/samplerecord.html1、 在Gen eBa nk中查找基因序列只要输入 accession号就可以了,如果你没有 accession号,可以把你手头的编号用 source等信息源转换成accession号。2、关于在GeneBank中

3、查找序列我有几点体会:最直接、最简单的方法是手头有基因的accession号;如果没有就需要明确两个重要的内容,即基因名称及物种信息如果有最好是拉丁全名,基因名称尽可能详细,防止搜出一些不相关的信息;搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属 于NCBI工作人员重新整理过的Refseq的序列,这样会比拟可靠;.其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子;3、如何在genbank查找某个细菌的基因序列?输入这个细菌的名字直接查,一般就会找到,而且一般第一个会是全基因组序列。 进入ncbi的首页,dat

4、abase选nucleotide,输入你的关键词,如果库里收录里 就会找到。4、 如何查找基因序列? 在Genbank中寻找目的基因的实例1根据文献如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank 中的 ID 号,那就好办了,直接翻开 :/ ,在 Search后的下拉框中选择 Nucleotide,把Genbank ID号输入GO前面的文本框 中,点“GO,就可以找到他了。举例说明,例如:在 2003 年 JBC的文章Conditional Knock-out of Integrin-linked Kin ase Demon strates an Esse nti

5、al Role in Protein Kin ase B/Akt Activati on 中出 现了 “calreticulin GenBank accession number gi 16151096,那么把“ 16151096输入GO前面的文本框中,点“ GQ'就可以找到该基因了当然包 括基因序列等相关信息。在出现了检索结果界面下列图后,直接点击红箭头所指的AY047586就可以看到基因的相关信息了呵呵,是不是有点太 easy 了这里需要指出一下,在显示基因的页面右侧有一个 Link,点击后出现一个小菜单, 里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多 说

6、了。2点击AY047586后出现的界面如下:如果只想获得序列例如去设计 PCR引物的时候,那就可以选择FASTA这样 就得到了 FASTA格式的序列文件,没有其他数字和格式的干扰。mat peptideEDEEDEEDKEEDEEEDVPGQAKDEL54.593/gene«wCALRrr/product-vasostatin/note»derived from calreticulin following post-translational cleavagerrORIGIN1611211812413013614214815416016617217818419019611

7、021108111411201126113211381 ctgccggagg tatccgtgcc tcaaggagca agtcagattt ataaaggttt ctttcagcaa tcgactgtgg acggagactc aggttcatgt gcaaggatga aggtgaagat tgccacccaa ccaagatcga ctgaccctga ccccagtgat cagattacaa ccagtatcta ctggcaccat gcaacgagac aggagcagag aggacaagga aagatgagga cagggctgga ctgtgagact gtcgtttt

8、aa gctgctgctc gtttctggac tggcaaattc gcagacaagc caaaggccag gggcggctat agaatacaac catcttcaac tgagtttaca tgacaacagc gaagataaag tgatcccaca tgctaagaag tcagaaccct gggcacttgg tgcctatgat ctttgacaac gtggggcgta gcttaaggag ggatgatgag ggaagacgtc ctgaggcctg cgagaacttt agggcccgcg ggcctcctcg ggagacgggt gttctcagtt

9、caggatgcac acgctggtgg gtgaagctgt atcatgtttg tacaagggca cacctgtaca caggtggagt gatcctgatg gactccaagc cccgaggact gagtacaagg atccacccag aactttggcg ttcctcatca acaaaggcag gaggaagaag gacaaagatg cccggccagg agcgctcctg ca cgttgccgcc gcctggccgt ggacttcccg ccggcaagtt gcttttatgc cgcagttcac tccctaatag gtcccgacat

10、agaacgtgct cactgattgt ccggctcctt cttcaaaacc ctgaggactg gggatgaaga gtgagtggaa aaattgacaa tgctgggcct ccaacgatga cagagaaaca acaagaaacg aggatgagga ccaaggacga ccgcagagct ccctcggccc cgccgagcct ctggatcgaa ctacggtgac tctgtcggcc ggtgaaacat tctggaccag ctgtggccct gatcaacaag gcggccagac ggaagacgat ggaagaccgg gga

11、caagccc gatggacgga gccccggcag ccccgagtac ggacctctgg ggcatacgct aatgaaggac caaagaggag ggatgaggag gctgtagaga tgccgcgcca gccatgctgc gccgtctact tccaaacaca gaggagaaag agtttcgagc gagcagaaca acagacatgc ggcaccaaga gacatccgtt aacacctatg tgggacttcc gatgagcggg gagcatatcc gagtgggaac atcgacaacc tctcccgatc caggtc

12、aagt gaggagtttg aaacaggacg gaggaggcag gacaaggagg ggcctgcctc aataatgtctDisclaimer I Write to the OesKNCBIINLKINIHNucleotideISian Inj :阴迩r|这就是FASTA格式的序列:Search - Hj:l60lt48r. for皿L.:m:苜Preew/lnaexHtstoryClipbQsrdDetlVtfpt*y | FASTA11Show 5 JI Send7*Rmga; fton 1 - .11io indR«nmcaanplf&«it

13、4dfirttidRefrwh2 NCBIPubMtdPrettinStructur*FMCfix 的 nm*OMlMBonria厂 I: AY0475弧 Reports Homo sapiens cak gil6l51096I® 林>gil 161S1O9C | gb| AY047S86« IE Hono sapiena calretLcuLiu CALR ihtWA, conplete cdsC TGC<<KAG<M TC G TTTT X JIAJWCC CGCK GTTGC CQCCCCC TC WCC CGCC ATGC TW TATCC

14、G TGCCGC TGC TGC TC GGC CTCCTCWCC TMCC GTC GCC GAGCC TGC CGT亡 TAC TTC AAGGAGC AGTTTC T XAC.&SAGA 匚,捞UTGG JL 匸 rrcc C GC Tt;GAT 匚匚人 JIT 匚: XAAC AC AAGT JlG JlETOGC AAXTT 匚 GTT 匚丁匚 ATTC C GiH AAGTT 匚 TACGGTA'ZOAWAA A A'jATA AAGGTTTK AA : AA 'K ': AGOATGC 丸匚 X TTTTAT'XT'7TGT

15、CGGXA'7TTTCGJtG:C TTT>: AG AACAAA'XJC-: A'JAC KTWTGGTGCAGTTC ACCWTGAAACATG AGC JlGJlLC KTCQKC TGTGWWC GOUT JLTG * 上MGC TGTTTCC TJLJLTAG TTTS 去C C JlQKC AGAC ATGC山 J GGAGAC T A'SAiTA': JlXC ATC hTDTTTGGTf C C G 丄匚 ATC TGTG 丈 CC TGGC: A 匚匚 JL 丄 G JLAGGTT亡 JLTGTC ATCTTCAACTIC kkQ

16、GOC JLAGMCGTOC TOATC AAC AAGCAC ATCC GTIXK lAOGATGATGACTTTAC ACACC TGTAC AC *C TGATTGTCWCC *GAC A AC XC TATGAWTGAAGATTGAC AACAOCC AWTJAGTCC GX TCC TTWAAGACOATTGWAC TTC CTGCC AC CC UG1 扎GhUQZTCG TGATCTTC AAAACC如果只是知道基因的名字,怎么查序列呢?还是举例说明,比方我想做的基因名称是人的VEGF基因,那么怎么在Genbank中找到它呢?翻开 :/ /在search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称“ VEG,点击 GO搜索结果出来了总共689条,哪一条是我想要的基因呢?点击箭头所指的LimitsLimits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能 大大精简查询结果。我们接着来,在 Limits这个界面,先选择查询

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论