付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、如何在genbank中查找一基因的序列Ge nBa nk是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另外些则按照生成这些序列数据的技术方法划分。目前GenBank中所有的记录 均来自于邓分来最初作者向DNA序列数据库的直接提交。这些作者将序列数据作为论文的口发表,或将数据直接公开。GenBank由位于马里兰州Bethesda的美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库(DDBJ以及欧洲生物信息研究院的欧洲分子生物学实验室
2、核苜酸数据库(EMBL 一起,都是国际核K酸序列数据库合作的成员。所有这三个中心都可以独 立地接受数据提交,而三个中心之间则逐日交换信息,并制作相同的充分详细的数 据库向公众开放(虽然格式上有细微的差别,并且所使用的信息系统也略有不Gen Ba nk数据库格式的详细说明 http:/www. ncbi. nim. /Sitemap/samplerecordhtml1、在Gen eBa nk中查找基因序列只要输入accession号就可以了,如果你没有 accession号,可以把你手头的编号用source等信息源转换成accession号。2、矢于在GeneBank中查找序列我有
3、几点体会:最直接、最简单的方法是手头有基因的 accession号;如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉 丁全名),基因名称尽可能详细,避免搜出一些不相矢的信息; 搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;.其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子;3、如何在genbank查找某个细菌的基因序列?输入这个细菌的名字直接查,一般就会找到,而且一般第一个会是全基因组序列。进入ncbi的首页:databa
4、se选nucleotide,输入你的矢键词,如果库里收录里就会4、如何查找基因序列? 在Genbank中寻找目的基因的实例(1 )根据文献如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank 中的 ID 号,那就好办了,直接打开 ,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO,就可以找到他了。举例说明,例如:在 2003 年 JBC 的文章(Conditional Knock-out of Integrin-linkedKin ase Dem on st
5、rates an Esse ntial Role in P rotein Kin ase B/Akt Activati on ) 中 出 现了 "calreticulin (GenBank accession number gi 16151096),那么把“16151096输入GO前面的文本框中,点“ GCr就可以找到该基因了(当然包括基因序列等相矢信息)。在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586就可以看到基因的相矣信息了(呵呵,是不是有点太easy T)这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里 面是与该基因相矢的链接
6、,很有用的,值得一个一个地去看看,这里我就不多说(2)点击AY047586后出现的界面如下:如果只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA这样 就 得到了 FASTA格式的序列文件,没有其他数字和格式的干扰。EDEEDEEDKEEDEEEDV PGQAKDELmat p epHde54.593/geiie«wCALR 存/p roduct-vasostatin/note»derived from calreticulin following post-translational cleavage"'ORIGIN1381ctgtgag
7、actcgagaactttcgttgccgcccgccgagccttccaaacaca1ctgccggagggtcgtttlaaagggcccgcggcctggccgtctggatcgaagaggagaaag61tatccgtgccgctgctgctcggcctcctcgggacttcccgctacggtgacagtttcgagc121tcaaggagcagtttctggacggagacgggtccggcaagtttctgtcggccgagcagaaca181agtcagaltttggcaaattcgttctcagttgcttttatgcggtgaaacatacagacatgc241ataaa
8、gglttgcagacaagccaggatgcaccgcagltcactctggaccagggcaccaaga301ctttcagcaacaaaggccagacgctggtggtccctaatagctgtggccctgacatccgtt361tcgactgtgggggcggctatgtgaagctgtgtcccgacatgatcaacaagaacacctatg421acggagactcagaatacaacatcatgtttgagaacgtgctgcggccagactgggacltcc481aggltcatglcatcttcaactacaagggcacactgattgtggaagacgatgat
9、gagcggg541gcaaggatgatgagtttacacacclgtacaccggctccttggaagaccgggagcatatcc601aggtgaagattgacaacagccaggtggagtcttcaaaaccggacaagcccgagtgggaac661tgccacccaagaagataaaggatcctgatgctgaggactggatggacggaatcgacaacc721ccaagatcgatgatcccacagactccaagcgggatgaagagccccggcagtctcccgatc781ctgaccctgatgctaagaagcccgaggactgtgagtgg
10、aaccccgagtaccaggtcaagt841ccccagtgattcagaaccctgagtacaaggaaattgacaaggacctctgggaggagtttg901cagattacaagggcacttggatccacccagtgctgggcctggcalacgctaaacaggacg961ccagtatctatgcclatgataactttggcgccaacgatgaaatgaaggacgaggaggcag1021ctggcaccatctttgacaacttcctcatcacagagaaacacaaagaggaggacaaggagg1081gcaacgagacgtggggcgtaa
11、caaaggcagacaagaaacgggatgaggagggcctgcctc1141aggagcagaggctlaaggaggaggaagaagaggatgaggagctgtagagaaalaatglct1201aggacaaggaggatgatgaggacaaagatgccaaggacgatgccgcgcca1261aagatgaggaggaagacgtccccggccaggccgcagagctgccatgctgc1321cagggctggactgaggcctgagcgctcctg caccctcggcccgccgtctactDisclaimer I Write to the OesK疋
12、BIINLKINIH这就是FASTA格式的序列:2NCBIP ubMtdPrettin Bonria涂卩uc嘛oticfe"匚forSearch - Hj : l60it48:m :fTyyShow 5 JI Send? *Pre ew/lnaexHistoryClipbQsrdDet IVtfpt*y I FASTARmga : fton ' Jio i ndR«nmcaanplf&«it4dfirttidAefrwh-林I I: AY0475 弧 Reports Homo sapiens cak gi510961>gil 161S1O9C
13、 | gb| AY047S86« IE Hono sapiena calretLcuLiu CALR) ihtWA, conplete cdsC TGC<<KAG<M TC G TTTT X JIAJWCC CGCK GTTGC COCCCCCTC WCC CGCC ATGC TW TATCC G TGCCGC TGC TGC TC GGC CTCCTCWCC TMCC GTC GCC GAGCC TGC CGT r TAG TTC AAGGAGC AGTTTC T X AC .&SAGA 匚捞 UTGG JL c rrcc C GCTt : GAT 匚匚人
14、 JIT 匚 : XAAC AC AAGT JIG JIETOGC AAXTT GTT 匚丁匚 A TTC C GiH AAGTT 匚 TACGGT A70AWA A A A'JATA AAGGTTTK A A : AA "K ' : AGOATGC 丸匚 X TTTTAT"X7TGTCGGAA7TTTCGJtG : C TTT> : AG AACAAA'XJC-: A'JAC KTMGGTGCAGTTC ACCWTGAAACATGAGC JlGJlLC KTCQKC TGTGWWC GOUT JLTG * |:MGC TGTTTCC
15、TJLJLTAG TTTS 去 C C JlQKC AGAC ATGC111 J GGAGAC T A'SAiTA' : JlXC ATC hTDTTTGGTf C CG丄ATC TGTG 丈 CC TGGC : A 匚匚 JL ; G JLAGGTT- JLTGTC ATCTTCAACTIC 欣QGOC JLAGMCGTOC TOATC AAC AAGCAC ATCC GTIXK lAOGATGATGACTTTAC ACACC TGTAC AC *C TGATTGT CWCC *GAC A AC XC TATGAWTGAAGATTGAC AACAOCC AWT JAGTCC
16、GX TCC TTWAAGACOATTGWAC TTC CTGCC AC CC UG1 扎 GhUQZTCG TGAT CTTC AAAACC如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名称是人的VEGF基因,那么怎么在Genbank中找到它呢?打开 /在search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称“ VEG,点击 GO搜索结果出来了总共689条,哪一条是我想要的基因呢?点击箭头所指的LimitsLimits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能 大大精简查询结果。我们接着来,在Limits这个界面,先选择查询的限定范围。我们要找什么基因来着?想起来了,是人的VEGF基因,那就开始选择:先选Gene na
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 室内地面施工技师考试试卷及答案
- 沙漠化治理工程师考试试卷及答案
- 美国拉日本退出核协议书
- 房屋建筑工程创优的基本要求
- 防溺水安全常识
- 租车牌照协议书
- 培训学校和高校合作协议书
- 支持所有协议书的移动硬盘
- 新能源车车位协议书
- 螺杆式制冷设备技术协议书
- 串串店加盟易合同范本
- 诚信管理体系知识培训课件
- 戚继光马上作课件
- 临床试验SAE培训课件
- 人工智能应用技术基础 课件 项目七 解码人工智能生成内容AIGC的独特技术
- 肿瘤化疗发展史全解析
- 2025年检察院书记员考试真题(附答案)
- 医疗纠纷预防和处理课件
- 前庭大腺脓肿切开护理查房
- 2025年甘肃省中考英语试卷真题(含标准答案及解析)
- 护士呼吸科进修专题汇报
评论
0/150
提交评论