版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、EMBOSS软件包方林2006-03-06EMBOSS的特点European Molecular Biology Open Source Suite软件的分类软件数量一致化输入输出扩展方便图形接口丰富EMBOSS软件分类比对序列编辑结果显示酶动力学分析序列特征分析核酸分析蛋白分析系统发育分析信息分析适用工具EMBOSS的输入序列格式abi, acedb,clustaln, codata, cbid, embl/em, experiment, fasta/pearson, gcg/gcg8, genbank/gb/ddbj, gff,hennig86, ig, jackknifer, jackk
2、nifernon, mega, meganon, msf, nbrf, ncbi, nexus/paup, nexusnon/paupnon, pfam/stockholm, phylip/phylipnon, raw, selex, staden, strider, swissprot/swiss/sw, text, treecon, asis共32种EMBOSS的输出文件格式acedb, asn1,clustal/aln, codata, debug, embl/em, fasta/pearson,fitch, gcg/gcg8, genbank/gb, gff, hennig86, ig
3、,jackknifer, jackknifernon, mega, meganon, msf, nbrf, ncbi, nexus/paup, nexusnon/paupnon, phylip, phyplipnon, selex, staden, strider, swiss/sw, text/plain/raw, treecon共30种USA一致序列地址format:file:entrydbname:entrylist几种常用的序列格式FASTAEMBLGenBankSwissprotClustal ALNFASTA格式gi|8392890|ref|NM_000477.3| Homo sa
4、piens albumin (ALB), mRNAAGCTTTTCTCTTCTGTCAACCCCACACGCCTTTGGCACAATGAAGTGGGTAACCTTTATTTCCCTTCTTTTTCTCTTTAGCTCGGCTTATTCCAGGGGTGTGTTTCGTCGAGATGCACACAAGAGTGAGGTTGCTCATCGGTTTAAAGATTTGGGAGAAGAAAATTTCAAAGCCTTGGTGTTGATTGCCTTTGCTCAGTATCTTCAGCAGTGTCCATTTGAAGATCATGTAAAATTAGTGAATGAAGTAACTGAATTTGCAAAAACATGTGTTGC
5、TGATGAGTCAGCTGAAAATTGTGACAAATCACTTCATACCCTTTTTGGAGACAAATTATGCACAGTTGCAACTCTTCGTGAAACCTATGGTGAAATGGCTGACTGCTGTGCAAAACAAGAACCTGAGAGAAATGAATGCTTCTTGCAACACAAAGATGACAACCCAAACCTCCCCCGATTGGTGAGACCAGAGGTTGATGTGATGTGCACTGCTTTTCATGACAATGAAGAGACATTTTTGAAAAAATACTTATATGAAATTGCCAGAAGACATCCTTACTTTTATGCCCCGGAACTCCT
6、TTTCTTTGCTAAAAGGTATAAAGCTGCTTTTACAGAATGTTGCCAAGCTGCTGATEMBL 格式GenBank格式Swissprot格式Clust ALN常用的一些EMBOSS程序wossnametfmseqretrevseqtranseqgetorfcoderetbacktranseqpepstatswossname-search要找的关键字-outfilef输出结果到所给的文件-groups只输出程序所在的组的名字-alphabetic只输出程序名和简单的描画,而不显示程序所在组的名字-noemboss 不要在EMBOSS主程序库中搜索-noembassay不要
7、在EMBOSS的附加包中搜索-colon用冒号分隔程序所在的类和父类erestml Restriction site Maximum Likelihood methodfrestboot Bootstrapped restriction sites algorithmfrestdist Distance matrix from restriction sites or fragmentsfrestml Restriction site maximum Likelihood methodrecoder Remove restriction sites but maintain same tran
8、slationremap Display sequence with restriction sites, translation etc.tfmtfm是另一个有用的程序,普通配合wossname运用用,它只能显示给定程序的协助信息。但它显示的协助信息较为详细,不像经过-help或-v那样只显示参数信息。用法: tfm options programseqret运用平率最高的一个程序序列的格式转换特征提取序列的拆分序列操作等seqret主要参数-feature 用序列的特征信息-firstonly 只输出第一条序列-sbegin1 n 从n位置开场截取序列-send1 n 截取到n位置-sre
9、verse1 对核酸序列反向取补-sask1 提问截取序列的起始,终止和能否反向取补-snucleotide1 只对核酸进展操作-sprotein1 只对蛋白进展操作-slower1 序列都表示成小写的方式-supper1 序列表示成大写的方式-sformat1 s 输入文件的格式-sdbname1 s 数据库名-sid1 s 序列名-ufo1 s 一致特征名-fformat1 s 特征的格式-fopenfile1 f 特征文件名-osformat2 s 输出文件格式-ossingle2 s 将序列分割成一条序列一个文件的方式-ofdirectory2 f 输出文件的目录-auto 关掉提示-
10、stdout 输出到规范输出-filter 从规范输入读,输出到规范输出getorf用于预测序列的开放阅读框常用参数 -table 用于翻译的表密码子表 -minsize n 最小的ORF -maxsize n 最大的ORF -nomethionine 起始密码子能否编码甲硫氨酸 -circular 序列为环状的 -noreverse 在或不在反链中预测ORF -flanking n 追加n长度的侧翼序列revseq用于对序列进展翻转和取补常用参数-noreverse 能否取反 -nocomplement 能否取补transeq用于蛋白的翻译常用的参数-frame 翻译那几个相位,对于正链可以
11、为1,2,3, 对于反链, 为-1,-2,-3 -table 密码子表,可以为上面的任何一个 -regions 要翻译的范围,可以表示为: 24-45, 56-78 1:45, 67=99;765.888 1,5,8,10,23,45,57,99 数字可以用任何非数字,非字母的符号表示。 -trim 能否不显示终了密码子,缺省为*表示transeq支持的密码子表 0 (Standard) 1 (Standard (with alternative initiation codons) 2 (Vertebrate Mitochondrial) 3 (Yeast Mitochondrial) 4
12、(Mold, Protozoan, Coelenterate Mitochondrial and Mycoplasma/Spiroplasma) 5 (Invertebrate Mitochondrial) 6 (Ciliate Macronuclear and Dasycladacean) 9 (Echinoderm Mitochondrial) 10 (Euplotid Nuclear) 11 (Bacterial) 12 (Alternative Yeast Nuclear) 13 (Ascidian Mitochondrial) 14 (Flatworm Mitochondrial)
13、15 (Blepharisma Macronuclear) 16 (Chlorophycean Mitochondrial) 21 (Trematode Mitochondrial) 22 (Scenedesmus obliquus) 23 (Thraustochytrium Mitochondrial)coderet用于提取序列的CDS,mRNA或蛋白序列常用的参数有:-nocds 不提取CDS序列 -nomrna 不提取mRNA序列 -notranslation 不提取translation序列将蛋白反向翻译成核酸常用参数-cfile f密码子频率文件,格式如下#Codon AA Frac
14、tion Frequency NumberGCA A 0.088 10.828 28723GCC A 0.423 52.293 720GCG A 0.428 52.999 140592GCT A 0.062 7.615 20201TGC C 0.854 7.853 20832TGT C 0.146 1.344 3564GAC D 0.665 36.225 96097GAT D 0.335 18.259 48437GAA E 0.299 15.643 41497GAG E 0.701 36.750 97488TTC F 0.825 30.677 88TTT F 0.175 6.529 17320GGA G 0.085 7.084 18792GGC G 0.700 58.228 154464GGG G 0.115 9.55
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海中华职业技术学院《数学学科教学论》2024-2025学年第二学期期末试卷
- 重庆机电职业技术大学《现代药学实验技术》2024-2025学年第二学期期末试卷
- 武汉体育学院体育科技学院《中国古代文学II》2024-2025学年第二学期期末试卷
- 机关内部反诈制度
- 机关内部统计管理制度
- 机关单位内部釆购制度
- 机场内部驾驶证制度
- 来访单位内部管理制度
- 林场内部考勤制度
- 检察院内部信息公开制度
- 2026年南京铁道职业技术学院单招职业技能测试题库附答案详解(综合题)
- 2025年侍茄师初级笔试及答案
- 煤气柜安全制度规范
- 2026年山西青年职业学院单招职业技能考试备考试题带答案解析
- 岗位安全风险管控培训课件
- 《创新创业基础》教学大纲
- 2026年度江苏中烟工业有限责任公司高校毕业生招聘(第一批次)笔试考试参考题库及答案解析
- 2026江苏中烟工业有限责任公司高校毕业生招聘14人(第一批次)考试参考题库附答案解析
- DB37-T 5345-2025 《建筑工程流态固化土应用技术规程》
- 2025年初级会计职称《经济法基础》精讲课件第1-4章
- 预应力全装配式风机基础设计方法研究
评论
0/150
提交评论