




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DNA各种序列格式介绍2011年12月18日 Genomics 字号 小 中 大 暂无评论 阅读 510 次 点击加入在线收藏夹 1.Plain格式A sequence in plain format may contain only IUPAC characters and spaces (no numbers!).Note: A file in plain sequence format may only contain one sequence, while most other formats accept several sequences in one file.An example sequence in plain format is:ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGACTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCAAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATTTTAATTACAGACCTGAAPlain sequence序列格式,只含有IUPAC字符和空格,不含有数字,并且一个Plain格式的文件只能含有一条序列。2.EMBL格式A sequence file in EMBL format can contain several sequences.One sequence entry starts with an identifier line (“ID”), followed by further annotation lines. The start of the sequence is marked by a line starting with “SQ” and the end of the sequence is marked by two slashes (“/”).An example sequence in EMBL format is:ID AB000263 standard; RNA; PRI; 368 BP.XXAC AB000263;XXDE Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.XXSQ Sequence 368 BP;acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg 60ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg 120caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc 180aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag 240gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga 300agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca 360gacctgaa 368/EMBL格式文件可以包含多条序列,每个序列条目都以”ID”开始,紧跟一些注释信息,序列的开始标记为”SQ”,结束标记为”/”。3.FASTA格式A sequence file in FASTA format can contain several sequences.Each sequence in FASTA format begins with a single-line description, followed by lines of sequence data.The description line must begin with a greater-than (“”) symbol in the first column.An example sequence in FASTA format is:AB000263 |acc=AB000263|descr=Homo sapiens mRNAACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCCCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAACTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCAAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGTTTAATTACAGACCTGAAFASTA格式文件可以包含多条序列,每条序列之前都有以”开始的一行,该行包含一些序列的描述信息。4.GCG格式A sequence file in GCG format contains exactly one sequence, begins with annotation lines and the start of the sequence is marked by a line ending with two dot (“.”) characters. This line also contains the sequence identifier, the sequence length and a checksum. This format should only be used if the file was created with the GCG package.An example sequence in GCG format is:ID AB000263 standard; RNA; PRI; 368 BP.XXAC AB000263;XXDE Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.XXSQ Sequence 368 BP;AB000263 Length: 368 Check: 4514 .1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga301 agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca361 gacctgaaGCG格式文件只含有一条序列,以一些注释信息行开始,序列以”.”行开始,该行还包含序列的标识,以及长度等。5.GenBank格式A sequence file in GenBank format can contain several sequences.One sequence in GenBank format starts with a line containing the word LOCUS and a number of annotation lines. The start of the sequence is marked by a line containing “ORIGIN” and the end of the sequence is marked by two slashes (“/”).An example sequence in GenBank format is:LOCUS AB000263 368 bp mRNA linear PRI 05-FEB-1999DEFINITION Homo sapiens mRNA for prepro cortistatin like peptide, completecds.ACCESSION AB000263ORIGIN1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga301 agaccttctcc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca361 gacctgaa/GenBank格式文件可以包含多个序列,每个序列条目都以”LOCUS”开始,紧跟多行注释信息,序列开始标记为”ORIGIN”,序列结束标记为”/”。6.IG格式A sequence file in IG format can contain several sequences, each consisting of a number of comment lines that must begin with a semicolon (“;”), a line with the sequence name (it may not contain spaces!) and the sequence itself terminated with the termination character 1 for linear or 2 for circular sequences.An example sequence in IG format is:; comment; commentAB000263ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCACCGCCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAATAAGCTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCCCTCAAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCGGGCTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGAATGTTTAATTACAGACCTGAA1IG格式序列文件可以包含多个序列,每个序列条目都以多个comment行开始,且comment行以”;”开始,comment行下面是包含序列名称的一行,序列以数字1结束,第2条序列以2结束,以此类推。7.IUPAC字符To represent ambiguity in DNA sequences the following letters can be us
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商业场所转让合同书
- 2025项目合作合同范本项目合作合同格式
- 2025二手车交易合同样本范本
- 2025年激光扫瞄显微镜项目发展计划
- 2025年塔吊操作员劳动合同
- 鞋业智造升级路径-洞察及研究
- 2025年北京市农药买卖合同书
- 主持人挑战题目及答案解析
- 2025年上海市租房合同
- 2025年光伏逆变器柜体系统合作协议书
- 地下室转让合同协议书
- 大学生创业基础2000116-知到答案、智慧树答案
- (正式版)YBT 6328-2024 冶金工业建构筑物安全运维技术规范
- (正式版)HGT 6270-2024 防雾涂料
- 2024年的老龄化社会与养老产业
- 钣金生产工艺
- 公共关系管理培训课件
- 护理信息学课件
- JGJT220-2010 抹灰砂浆技术规程
- 纸箱采购投标方案(技术方案)
- 【小班幼儿挑食行为研究及改善策略9600字(论文)】
评论
0/150
提交评论