




已阅读5页,还剩118页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,GenBank数据库结构,作用:了解序列数据库的格式,有助于更好地提高数据库检索的效率和准确性。DDBJ数据库的内容和格式与GenBank相同,此处不作详细介绍。分别介绍EMBL和GenBank的数据库结构,.,GenBank数据库数据注释(/genbank/),GenBank库包含所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。NCBI可提供广泛的数据查询、序列相似性搜索以及其它分析服务。数据库序列文件:注释内容文章索引文件:检索目录文摘,.,GenBank数据库结构,完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等建立的,用于数据库查询。GenPept是由GenBank中的核酸序列翻译而得到的蛋白质序列数据库数据格式为FastA。,.,GenBank数据库结构,GenBank中最常用的是序列文件。序列文件的基本单位:是序列条目,包括核苷酸碱基排列顺序和注释两部分。生物信息资源中心通过计算机网络提供该数据库文件。注释条目:文章的格式,(/genbank/,.,Genbank,.,Genbank查找页面,.,D31716,描述部分,.,CDsarerecurringunitsinpolypeptidechains(sequenceandstructuremotifs),theextentsofwhichcanbedeterminedbycomparativeanalysis.Molecularevolutionusessuchdomainsasbuildingblocksandthesemayberecombinedindifferentarrangementstomakedifferentproteinswithdifferentfunctions.,CDs编码序列,含终止密码子polyA_signal多聚A信号,.,D31716,特性表,序列本身,关键字,CDsarerecurringunitsinpolypeptidechains,.,D31716,序列本身,.,.,序列结束,4859bp,.,D31716,.,GenBank数据记录,.,GenBank数据记录,.,GenBank数据库结构,GenBank序列文件由单个的序列条目组成。序列条目由字段组成,每个字段由关键字起始,后面为该字段的具体说明。字段分若干次子字段,以次关键字或特性表说明符开始。每个序列条目以双斜杠“/”作结束标记,.,GenBank数据库结构,序列条目的格式非常重要,关键字从第一列开始,次关键字从第三列开始,特性表说明符从第五列开始。每个字段可占一行,也可以占若干行。若一行中写不下时,继续行以空格开始,.,GenBank数据库,物种:GenBank库里的数据按来源于大约100,000个物种,其中56%是人类的基因组序列(所有序列中的34%是人类的EST序列)记录:每条GenBank数据记录包含对序列的简要描述,它的科学命名,物种分类名称,参考文献,序列特征表,及序列本身,.,GenBank数据库,序列特征表:包含对序列生物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位点等分类:所有数据记录被划分为如细菌类、病毒类、灵长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序列数据等16类,其中EST数据等又被分成若干文件,.,注释内容,序列条目关键字:LOCUS(代码),DEFINITION(说明),ACCESSION(编号),NID符(核酸标识),KEYWORDS(关键词),SOURCE(数据来源),REFERENCE(文献),FEATURES(特性表),BASECOUNT(碱基组成)ORIGIN(碱基排列顺序)。新版的核酸序列数据库将引入新的关键词SV(序列版本号),用“编号.版本号”表示,并取代关键词NID,.,LOCUS,LOCUS(代码):是该序列条目的标记,或者说标识符,蕴涵这个序列的功能:如HUMCYCLOX表示人的环氧化酶。序列长度类型种属来源录入日期等说明字段是有关这一序列的简单描述,.,ACCESSION,ACCESSION(编号):具有唯一性和永久性,在文献中引用这个序列时,应该以此编号为准。,.,KEYWORDS,KEYWORDS(关键词)字段:由该序列的提交者提供,包括该序列的基因产物其它相关信息,.,SOURCE,SOURCE(数据来源)字段:说明该序列是从什么生物体、什么组织得到的次关键字ORGANISM(种属):指出该生物体的分类学地位,.,REFERENCE,REFERENCE(文献)字段:说明该序列中的相关文献,包括AUTHORS(作者),TITLE(题目)及JOURNAL(杂志名)等,以次关键词列出。MEDLINE的代码:该代码实际上是个超文本链接,点击它可以直接调用上述文献摘要。一个序列可有多篇文献,以不同序号表示,并给出该序列中哪一部分与文献有关。,.,FEATURES,FEATURES(特性表):具有特定的格式,用来详细描述序列特性。特性表中带有/db-xref/标志的字符可以连接到其它数据库,如分类数据库(taxon9606),以及蛋白质序列数据库(PID:g181254)。序列中各部分的位置都在表中标明,5非编码区,编码区,3非编码区,多聚腺苷酸重复区域等。翻译所得信号肽以及最终蛋白质产物碱基含量字段,给出序列中的碱组成,.,ORIGIN,ORIGIN行是序列的引导行下面便是碱基序列以双斜杠行“/”结束。,.,GenBank数据库数据库格式,FASTA格式gi|1293613|gb|U49845.1|SCU49845SaccharomycescerevisiaeTCP1-betagene,partialcds;andAxl2p(AXL2)andRev7p(REV7)genes,completecdsGATCCTCCATATACAACGGTATCTCCACCTCAGGTTTAGATCTCAACAACGGAACCATTGCCGACATGAGACAGTTAGGTATCGTCGAGAGTTACAAGCTAAAACGAGCAGTAGTCAGCTCTGCATCTGAAGCCGCTGAAGTTCTACTAAGGGTGGATAACATCATCCGTGCAAGACCAAGAACCGCCAATAGACAACATATGTAACATATTTAGGATATACCTCGAAAATAATAAACCGCCACACTGTCATTATTATAATTAGAAACAGAACGCAAAAATTATCCACTATATAATTCAAAGACGCGAAAAAAAAAGAACAACGCGTCATAGAACTTTTGGCAATTCGCGTCACAAATAAATTTTGGCAACTTATGTTTCCTCTTCGAGCAGTACTCGAGCCCTGTCTCAAGAATGTAATAATACCCATCGTAGGTATGGTTAAAGATAGCATCTCCACAACCTCAAAGCTCCTTGCCGAGAGTCGCCCT(该序列没有完全列出),.,GenBank数据库数据库格式(1),FASTA格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或氨基酸字符串。大于号()表示一个新文件的开始结束用(/)FASTA格式并没有什么特殊的要求。,.,FASTA格式序列的提交,.,GenBank数据库数据库格式(1),FASTA格式特点:只存储了最少量的信息它将所存储的信息转化为简单的字符串人和计算机对其存储的信息都具有极大的可读性FASTA格式在许多分子生物学软件包中得到广泛应用。,.,GenBank数据库数据库格式(2),GenBank纯文本文件格式(GenBankflatfile,GBFF):GenBank、EMBL、DDBJ每天都相互同步更新各自的数据库,它们是怎样交换数据的呢?,.,GBFF文件格式,GBFF是GenBank数据库的基本信息单位,是最为广泛使用的生物信息学序列格式之一。,.,LOCUSSCU498455028bpDNAPLN21-JUN-1999DEFINITIONSaccharomycescerevisiaeTCP1-betagene,partialcds,andAxl2p(AXL2)andRev7p(REV7)genes,completecds.ACCESSIONU49845VERSIONU49845.1GI:1293613KEYWORDS.SOURCEbakersyeast.ORGANISMSaccharomycescerevisiaeEukaryota;Fungi;Ascomycota;Hemiascomycetes;Saccharomycetales;Saccharomycetaceae;Saccharomyces.REFERENCE1(bases1to5028)AUTHORSTorpey,L.E.,Gibbs,P.E.,Nelson,J.andLawrence,C.W.TITLECloningandsequenceofREV7,agenewhosefunctionisrequiredforDNAdamage-inducedmutagenesisinSaccharomycescerevisiaeJOURNALYeast10(11),1503-1509(1994)MEDLINE95176709REFERENCE2(bases1to5028)AUTHORSRoemer,T.,Madden,K.,Chang,J.andSnyder,M.TITLESelectionofaxialgrowthsitesinyeastrequiresAxl2p,anovelplasmamembraneglycoproteinJOURNALGenesDev.10(7),777-793(1996)MEDLINE96194260REFERENCE3(bases1to5028)AUTHORSRoemer,T.TITLEDirectSubmissionJOURNALSubmitted(22-FEB-1996)TerryRoemer,Biology,YaleUniversity,NewHaven,CT,USAFEATURESLocation/Qualifierssource1.5028/organism=Saccharomycescerevisiae/db_xref=taxon:4932/chromosome=IX/map=9CDS1.206/codon_start=3/product=TCP1-beta/protein_id=AAA98665.1/db_xref=GI:1293614/translation=SSIYNGISTSGLDLNNGTIADMRQLGIVESYKLKRAVVSSASEAAEVLLRVDNIIRARPRTANRQHMgene687.3158/gene=AXL2CDS687.3158/gene=AXL2/note=plasmamembraneglycoprotein/codon_start=1/function=requiredforaxialbuddingpatternofS.cerevisiae/product=Axl2p/protein_id=AAA98666.1/db_xref=GI:1293615/translation=MTQLQISLLLTATISLLHLVVATPYEAYPIGKQYPPVARVNESF(有部分序列未列出)VDFSNKSNVNVGQVKDIHGRIPEMLBASECOUNT1510a1074c835g1609tORIGIN1gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg61ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct(有部分序列未列出)4921ttttcagtgttagattgctctaattctttgagctgttctctcagctcctcatatttttct4981tgccatgactcagattctaattttaagctattcaatttctctttgatc/,.,GBFF格式,按域(Field)可以划分为三个部分头部包含整个记录的信息(描述符);第二部分包含了注释这一记录的特性;第三部分是核苷酸序列本身。所有序列数据库记录都在最后一行以“/”结尾。,.,GBFF格式头部Locus行,所有的GBFF都起始于LOCUS行:-+-+-+-+-+-1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GBFF格式头部Locus行,1、LOCUS行:第一项是LOCUS名称:最初这一名称是用来表示本记录描述的基因座,以方便检索相似序列:前三个字母代表特定物种的名称第四、第五个字母代表如基因产物等特定的类别名称。如HUMHBB(人-珠蛋白基因区域)。,.,GBFF格式头部Locus行,LOCUS这种“十字符”命名方式已经无法满足基因在基因座中所包含的信息。LOCUS名称目前唯一的作用是它在数据库中是独一无二的,已不在具有任何实际意义。仅使用检索号码(acessionnumber)以满足对LOCUS名称的要求1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GBFF格式头部Locus行,第二项是序列长度。GenBank对提交的序列长度没有上限要求。根据国际序列数据库合作计划的协议,为方便不同的软件处理序列,规定单条数据库记录的长度不能超过350kb。GenBank已经很少接受长度低于50bp的序列。1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GBFF格式头部Locus行,第三项表明序列的分子类型:其序列必须是一种单一的分子类型。包括:基因组DNA、RNA、RNA前体、mRNA(cDNA)、tRNA等。1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GBFF格式头部Locus行,第四项是GenBank分类码:由三个字母组成,分类码将GenBank数据库分为17个分支1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GenBank分类码(GenBankDivision),.,GBFF格式头部Locus行,第五项是最后修订日期。某些时候,它也是数据第一次被公开的日期。这项简单的信息并无法对此做出判断。1102030405060LOCUSSCU498455028bpDNAPLN21-JUN-1999,.,GBFF格式头部DEFINITION行,2、DEFINITION行:主要对GenBank记录中所含的生物学意义做出总结。它的说明内容包括来源物种、基因/蛋白质名称;-+-+-+-+-+-1102030405060DEFINITIONSaccharomycescerevisiaeTCP1-betagene,partialcds,andAxl2p(AXL2)andRev7p(REV7)genes,completecds.,.,GBFF格式头部DEFINITION行,如果序列是非编码区,则包含对序列功能的简单描述;如果序列是一段编码区,则标明该序列是部分序列(partialcds)还是全序列(completecds)。-+-+-+-+-+-1102030405060DEFINITIONSaccharomycescerevisiaeTCP1-betagene,partialcds,andAxl2p(AXL2)andRev7p(REV7)genes,completecds.,.,GBFF格式头部-ACCESSION行,3、检索号(ACCESSION):是序列记录的唯一指针。检索号通常由一个字母加5个数字(U12345)或者由两个字母加6个数字(AF123456)组成。-+-+-+-+-+-1102030405060ACCESSIONU49845DearGenBankSubmitter:ThankyouforyourdirectsubmissionofsequencedatatoGenBank.WehaveprovidedaGenBankaccessionnumberforyournucleotidesequence:bankit660463AY795899WestronglyrecommendthatthisGenBankaccessionnumberappearsinanypublicationthatreportsordiscussesthesedata,asitgivesthecommunityauniquelabelwithwhichtheymayretrieveyourdatafromouron-lineservers.,.,GBFF格式头部-ACCESSION行,检索号在数据库中是唯一而且不变的,即使数据的提交者改变数据的内容。在ACCESSION行中可能出现多个检索号,可能是因为数据提交者提交了一条与原记录相关的新记录,或者新提交的记录覆盖了原有的旧记录。第一个检索号为主检索号,而其余的统称为二级检索号。,.,GBFF格式头部VERSION行,4、版本号行:它的格式是:检索号.版本号。版本号于99年2月由三大数据库采纳使用。主要用于识别数据库中一条单一的特定核苷酸序列。在数据库中,如果某条序列数据发生了变化,即使是单碱基的改变,它的版本号都将增加,而它的检索号保持不变如由U12345.1变为U12345.2。-+-+-+-+-+-+-+-11020304050607079VERSIONU49845.1GI:1293613,.,GBFF格式头部VERSION行,版本号系统与跟在其后的GI(GenInfoIdentifier)号系统是平行运行当一条序列改变后,它将被赋予一个新的GI号,同时它的版本号将增加。当依据核酸序列的内部序列进行蛋白质翻译时,蛋白质的翻译发生任何变换,核酸序列都将被赋予一个新的GI号。-+-+-+-+-+-+-+-11020304050607079VERSIONU49845.1GI:1293613,.,GBFF格式头部KEYWORDS行,5、关键词行:是用来描述序列的。如果该行中没有任何内容,那么就只包含一个“.”。由于没有对照词汇表,所以NCBIGenBank拒绝接受关键词,它只存在于旧的记录中。-+-+-+-+-+-+-+-11020304050607079KEYWORDS.,.,GBFF格式头部SOURCE行,6、序列来源行:没有做特殊的规定,它通常包含序列来源生物的简称,有些时候也包含分子类型。Organism:以NCBI的分类数据库为依据,指明物种的正式科学名称。-+-+-+-+-+-+-+-11020304050607079SOURCEbakersyeast.ORGANISMSaccharomycescerevisiaeEukaryota(真核);Fungi(真菌);Ascomycota(子囊菌门);Hemiascomycetes(半子囊菌纲);Saccharomycetales;Saccharomycetaceae;Saccharomyces.,.,GBFF格式头部REFERENCE行,7、参考文献行:将与该数据有关的参考文献均收录在内,将最先发表的文献列于第一位。如果序列数据没有被文献报道,该行将显示“inpress”或“unpublished”如所引用文献存在于MEDLINE数据库中,将出现一个MEDLINE单一指针(uniqueidentifier,UID)以便检索。-+-+-+-+-+-+-+-11020304050607079REFERENCE1(bases1to5028)AUTHORSTorpey,L.E.,Gibbs,P.E.,Nelson,J.andLawrence,C.W.TITLECloningandsequenceofREV7,agenewhosefunctionisrequiredforDNAdamage-inducedmutagenesisinSaccharomycescerevisiaeJOURNALYeast10(11),1503-1509(1994)MEDLINE95176709,.,GBFF格式头部REFERENCE行,如果序列是直接提交而未经发表的,就将在标题(TITLE)中注明“直接提交(DirectSubmission)”在期刊(JOURNAL)中注明提交日期,提交者姓名以及提交者的工作单位。-+-+-+-+-+-+-+-11020304050607079REFERENCE1(bases1to1939)AUTHORSYi,CAO.,Dairong,QIAO.,Qinghua,HE.andShunji,HE.TITLECloningandexpressionstudiesofacDNAencodingUDP-glucosedehydrogenasefromDunaliellasalinaJOURNALUnpublished,.,GBFF格式中部,特性表(FEATURES):它描述基因和基因的产物,以及与序列相关的生物学特性。特性表提供一个参考词汇表以对合法的特性进行注释这些特性包括该序列是否执行一个生物学功能;它是否与一个生物学功能的表达相关;它是否与其它分子相互作用;它是否影响一条序列的复制;它是否与其它序列的重组相关;它是否是一条已识别的重复序列;它是否有二级或三级结构;它是否存在变异或者它是否被修订过。,.,GBFF格式中部,特性表格式:按表单的方式设计的,包含三个部分:第一,特性关键词(Featurekey);第二,特性位置(Location);第三,限定词(Qualifiers)。FEATURESLocation/Qualifierssource1.5028/organism=“Saccharomycescerevisiae”酿酒酵母/mol_type=genomicDNA基因组DNA/db_xref=taxon:4932分类学/chromosome=IX染色体/map=9,.,GBFF格式中部FEATURES,第一,特性关键词(Featurekey),是一个简要说明功能组的关键词,允许加入新的或未定义的特性;第二,特性位置(Location),指明在特性表中的什么地方找到相关特性,在位置特性中可以包含操作符(Operator)和功能性描述符(Descriptor)以指明序列需经过怎样的处理才能得到相应的特性;第三,限定词(Qualifiers),相关特性的辅助信息,限定词使用一组标准化的对照词汇表以利于计算机从中提取信息。,.,GBFF格式中部FEATURES,例1KeyLocation/QualifiersCDS23.400/product=alcoholdehydrogenase/gene=adhI特性表含义:该编码序列(CDS)起始于第23碱基,终止于第400碱基产物是乙醇脱氢酶基因名称是“adhI”。,.,GBFF格式中部FEATURES,例2KeyLocation/QualifiersCDSjoin(544.589,688.1032)/product=T-cellreceptorbeta-chain特性表含义:它表示记录中所存储的序列为部分编码序列,表达产物“T-细胞受体beta链”由序列内两个片段结合生成指明两个片段在序列中所处的位置。,.,GBFF格式中部特性表关键词,1、特性表的关键词:以树型结构生成misc_feature生物学特性无法用特性表关键词描述的序列misc_difference序列特性无法用特性表关键词描述的序列conflict同一序列在不同的研究中在位点或区域上有差异unsure序列不能确定的区域old_sequence该序列对以前的版本做过修订variation包含稳定突变的序列modified_base修饰过的核苷酸gene已识别为基因或已命名的序列区域misc_signal无法用信号特性关键词描述的信号序列promoter转录起始区CAAT_signal真核启动子上游的CAAT盒,与RNA结合相关TATA_signal真核启动子的TATA盒-35_signal原核启动子中的-35框-10_signal原核启动子Pribow盒GC_signal真核启动子的GC盒RBS核糖体结合位点polyA_signalRNA转录本的剪切识别位点enhancer增强子attenuator与转录终止有关的序列terminator转录终止序列rep_origin双链DNA复制起始区,.,GBFF格式中部特性表关键词,misc_RNA无法用RNA关键词描述的转录物或RNA产物prim_transcript初始转录本precursor_RNA前体RNAmRNA信使RNA5clip前体转录本中被剪切掉的5端序列3clip前体转录本中被剪切掉的3端序列5UTR5非翻译区3UTR3非翻译区exon外显子CDS蛋白质编码序列sig_peptide编码信号肽的序列transit_peptide转运蛋白编码序列mat_peptide编码成熟肽的序列intron内含子polyA_siteRNA转录本的多聚腺苷酸化位点rRNA核糖体RNAtRNA转运RNAscRNA小细胞质RNAsnRNA小核RNAsnoRNA加工和修饰rRNA的小核RNA,.,GBFF格式中部特性表关键词,immunoglobulin_relatedC_region免疫相关蛋白上的稳定区D_segment码免疫球蛋白重链的可变区基因之一J_segment编码免疫球蛋白轻链和重链的可变区基因之一N_region插入重排免疫球蛋白片段间的核苷酸S_region免疫球蛋白重链的开关区V_region免疫球蛋白轻链和重链的可变区,和T细胞受体,和链;编码可变的氨基末端部分;可由V_segment,D_segment,N_region和J_segment组成V_segment免疫球蛋白轻链和重链的可变区段,和T细胞受体,和链;编码大多数可变区(v_region)和前导肽的最后几个氨基酸repeat_region基因组中所包含的重复序列,.,GBFF格式中部特性表关键词,repeat_unit单个的重复元件LTR长末端重复序列Satellite卫星重复序列misc_binding无法描述的核酸序列结合位点primer_bind复制、转录的引物结合位点protein_bind蛋白质结合区STS测序标签位点misc_recomb无法用重组特性关键词描述的重组事件iDNA通过重组所消除的DNAmisc_structure无法用结构关键词描述的核酸序列高级结构或构型stem_loop发夹结构D-loop线粒体中DNA中的取代环,.,GBFF格式中部Location,2、特性位置(Location):用来描述在序列中的什么区域能够找到相关的特性,位置特性可以包含Complement、Join、Order等三个操作符(Operator)。467指明序列中的单个碱基340.565指明包括起始和中止碱基在内的一段连续序列D49653CCAAGAAGAAGAAGACCCCAGCGAGGAAAATGTGCTGGAGACCCCTGTGCCGGTTCCTGTGGCTTTGGTCCTATCTGTCCTATGTTCAAGCTGTGCCTATCCACAAAGTCCAGGATGACACCAAAACCCTCATCAAGACCATTGTCACCAGGATCAATGACATTTCACACACGCAGTCGGTATCCG.,.,序列文件格式例子(GenBank),LOCUSRATOBESE539bpss-mRNAROD23-SEP-1995DEFINITIONRatmRNAforobese.ACCESSIOND49653KEYWORDS.SOURCERattusnorvegicus(strainOLETF,LETOandZucker,)differentiatedadiposecDNAtomRNA.ORGANISMRattusnorvegicusEukaryotae;mitochondrialeukaryotes;Metazoa;Chordata;Vertebrata;Sarcopterygii;Mammalia;Eutheria;Rodentia;Sciurognathi;Myomorpha;Muridae;Murinae;Rattus.REFERENCE1(bases1to539)AUTHORSMurakami,T.andShima,K.TITLECloningofratobesecDNAanditsexpressioninobeseratsJOURNALBiochem.Biophys.Res.Commun.209,944-952(1995)STANDARDfullautomaticCOMMENTSubmitted(10-Mar-1995)toDDBJby:TakashiMurakamiDepartmentofLaboratoryMedicineSchoolofMedicineUniversityofTokushimaKuramotocho3-chomeTokushima770JapanPhone:+81-886-33-7184Fax:+81-886-31-9495.,.,序列文件格式例子(GenBank),NCBIgi:995614FEATURESLocation/Qualifierssource1.539/organism=Rattusnorvegicus/strain=OLETF,LETOandZucker/dev_stage=differentiated/sequenced_mol=cDNAtomRNA/tissue_type=adiposeCDS30.533/partial/note=NCBIgi:995615/codon_start=1/product=obese/translation=MCWRPLCRFLWLWSYLSYVQAVPIHKVQDDTKTLIKTIVTRINDISHTQSVSARQRVTGLDFIPGLHPILSLSKMDQTLAVYQQILTSLPSQNVLQIAHDLENLRDLLHLLAFSKSCSLPQTRGLQKPESLDGVLEASLYSTEVVALSRLQGSLQDILQQLDLSPECBASECOUNT121a167c133g118tORIGIN1ccaagaagaagaagaccccagcgaggaaaatgtgctggagacccctgtgccggttcctgt61ggctttggtcctatctgtcctatgttcaagctgtgcctatccacaaagtccaggatgaca121ccaaaaccctcatcaagaccattgtcaccaggatcaatgacatttcacacacgcagtcgg181tatccgccaggcagagggtcaccggtttggacttcattcccgggcttcaccccattctga241gtttgtccaagatggaccagaccctggcagtctatcaacagatcctcaccagcttgcctt301cccaaaacgtgctgcagatagctcatgacctggagaacctgcgagacctcctccatctgc361tggccttctccaagagctgctccctgccgcagacccgtggcctgcagaagccagagagcc421tggatggcgtcctggaagcctcgctctactccacagaggtggtggctctgagcaggctgc481agggctctctgcaggacattcttcaacagttggaccttagccctgaatgctgaggtttc/,.,序列文件格式例子(GCG),LOCUSRATOBESE.G539BPSS-RNAENTERED09/23/95DEFINITIONRatmRNAforobese.ACCESSION-KEYWORDS-SOURCERattusnorvegicus;NorwayratORGANISMEukaryotae;mitochondrialeukaryotes;Metazoa;Chordata;Vertebrata;Sarcopterygii;Mammalia;Eutheria;Rodentia;Sciurognathi;Myomorpha;Muridae;Murinae;RattusREFERENCE1AUTHORSMurakami,T./organism=Rattusnorvegicus;/strain=OLETF,LETOandZucker;/dev_stage=differentiated;/sequenced_mol=cDNAtomRNA;/tissue_type=adiposeBASECOUNT121A167C133G118T0OTHERORIGIN?RATOBESE.GLength:539Jan30,1996-05:32PMCheck:5797.1CCAAGAAGAAGAAGACCCCAGCGAGGAAAATGTGCTGGAGACCCCTGTGCCGGTTCCTGT61GGCTTTGGTCCTATCTGTCCTATGTTCAAGCTGTGCCTATCCACAAAGTCCAGGATGACA121CCAAAACCCTCATCAAGACCATTGTCACCAGGATCAATGACATTTCACACACGCAGTCGG181TATCCGCCAGGCAGAGGGTCACCGGTTTGGACTTCATTCCCGGGCTTCACCCCATTCTGA241GTTTGTCCAAGATGGACCAGACCCTGGCAGTCTATCAACAGATCCTCACCAGCTTGCCTT301CCCAAAACGTGCTGCAGATAGCTCATGACCTGGAGAACCTGCGAGACCTCCTCCATCTGC361TGGCCTTCTCCAAGAGCTGCTCCCTGCCGCAGACCCGTGGCCTGCAGAAGCCAGAGAGCC421TGGATGGCGTCCTGGAAGCCTCGCTCTACTCCACAGAGGTGGTGGCTCTGAGCAGGCTGC481AGGGCTCTCTGCAGGACATTCTTCAACAGTTGGACCTTAGCCCTGAATGCTGAGGTTTC/,.,序列文件格式例子(ASN.1)ASN.1是NCBI用来存储和维护所有数据的格式,Seq-entry:=setlevel1,classnuc-prot,descrpubpubsubauthorsnamesstdnamenamelastMurakami,initialsT.,affilstrTakashiMurakami,SchoolofMedicine,UniversityofTokushima,DepartmentofLaboratoryMedicine;Kuramotocho3-chome,Tokushima,Tokushima770,Japan(E-mail:muraclin.med.tokushima-u.ac.jp,Tel:+81-886-33-7184,Fax:+81-886-31-9495),mediumemail,datestdyear1995,month3,day10,pubpubmuid95251725,articletitlenameCloningofratobesecDNAanditsexpressioninobeserats.,authorsnamesstdnamenamelastMurakami,initialsT.,namenamelastShima,initialsK.,affilstrDepartmentofLaboratoryMedicine,SchoolofMedicine,UniversityofTokushima,Japan.,fromjournaltitleiso-jtaBiochem.Biophys.Res.Commun.,ml-jtaBiochemBiophysResCommun,issn0006-291X,nameBiochemicalandbiophysicalresearchcommunications.,impdatestdyear1995,month4,day26,volume209,issue3,pages944-952,languageeng,idspubmed7733988,medline95251725,pmid7733988,update-datestdyear2000,month2,day1,sourceorgtaxnameRattusnorvegicus,commonNorwayrat,dbdbtaxon,tagid10116,orgnamenamebinomialgenusRattus,speciesnorvegicus,modsubtypestrain,subnameOLETF,LETOandZucker,lineageEukaryota;Metazoa;Chordata;Craniata;Vertebrata;Euteleostomi;Mammalia;Eutheria;Rodentia;Sciurognathi;Muridae;Murinae;Rattus,gcode1,mgcode2,divROD,subtypesubtypetissue-type,nameadipose,subtypedev-stage,namedifferentiated,seq-setseqidddbjnameRATOBESE,accessionD49653,version1,gi995614,descrtitleRatmRNAforobese(leptin),completecds.,genbanksourceRattusnorvegicus(strain:OLETF,LETOandZucker)differentiatedadiposecDNAtomRNA.,keywordsobese(ob),leptin,obesity,obproduct,secretoryprotein,molinfobiomolmRNA,create-datestdyear1995,month9,day22,instreprraw,molrna,length539,seq-datancbi2na508208215498A00EE7A2157B96BD7BA7FAD737B5CEF427B9735102D4A384500574D0853ED14A34384FD11192DACD652922AD16BFA1F4F56A7D154F78BFB508E85215E92DCD048D74527E5F5401B9E48C9D385E88179885D75379E97DD42279D5E59215BA5E48252225E8E9B5E825D9DC75122BAE9DE24A792A7779284
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工作与生活两不误的策略
- 工作中的自律性对提高效率的影响
- 工业自动化发展趋势及技术革新
- 工业设计的美学与产品设计实践
- 工作效率提升技巧与策略
- 工业领域物联网环保应用研究
- 工作模式变革下的组织文化创新
- 工作流程优化与持续改进方法
- 工厂安全生产与应急预案制作
- 工程建筑中岩土工程的实践应用
- 福建省2025年6月普通高中学业水平合格性考试地理模拟卷二(含答案)
- 2025年山东省济宁市泗水县中考三模地理试题(含答案)
- 2025年文件归档管理考试题及答案分析
- 文明小学生主题班会课件
- 2024年中考历史试题分类汇编:世界近代史(原卷版+解析)
- 购买私人地皮合同范本
- T/CWPIA 2-2020户外重组竹地板铺装技术规范
- 2025届黄冈市重点中学八下数学期末统考试题含解析
- 2025年英语四级考试模拟试卷及答案
- 跨学科视域下道德与法治与心理健康教育融合的探究
- 智能在线问卷调查系统开发合同
评论
0/150
提交评论