版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Biological Sequence Analysis 周杰 王莉Contents DB Searching the Blast family, pattern hunter, blat, etc. Sequence Alignment Clustalx, Tcoffee, mafft, ProsCons, etc. Sequence Pattern Analysis Sequence Logo, Codon Usage, etc. Protein Sequence Analysis ORF,funcntion,regulato
2、ry,strucuture,interaction,etc Phylogenetic analysis MEGA, PAUP, Phylip, Mrbayes, etc.Google ScholarEntrezBLASTSeedingMegaBlast 快速寻找高度相似的序列 主要特点: 比BLAST快数百倍 Large Word size Greedy algorithm输入输出格式 所有类blast程序都接受fasta格式序列文件 所有类blast程序都输出类似blast的结果文件。Fasta格式 seq1 CGGCGCTAGCATCGTACACGATCGACACACTGACATCGACA
3、CTAGCTAGCGATCGATCGATCGATGCTACTGACTGACTGATGCTGAC seq2 GATCGATCAGCACGAGCAGCAGCACGACTACTATGCAGTCGATCGTAGCTGACGTACTGATGCAGTCTGACTGATCGTAGCTACGACTACACTACGATC各种序列格式及转换READSEQREADSEQ!Sequence Alignment Software ClustalX (Windows) Tcoffee Mafft Proscons MUSCLE MAUVE, LAGAN, etc (Genome alignment) Progressiv
4、e AlignmentComparison CLUSTAL WIN/UNIX下图形界面,使用最广泛,适合短和不太多的序列。 Tcoffee 比CLUSTAL略精确一些,慢,不常用 Mafft 精度可调,较多500-10000条或较长序列5k-5000k aa/nt都可使用,UNIX下命令行界面。 Porscons 目前为止最为精确的对位软件,慢,UNIX下命令行界面。 MUSCLE 快,可对较长或较多的序列,WIM/UNIX下命令行界面。Why CLUSTALW?输入输出格式 所有序列对位程序都接受fasta格式序列文件 所有序列对位程序都输出fasta格式结果文件或者类似clustalw格式
5、的结果文件。Genome Alignment Tools MUMmer (2019) LAGAN, M-LAGAN (2019) MAUVE (2019) Rearrangement and InversionMAUVE序列模式分析 Sequence Logo Many othersProtein Sequence Analysis ORF Function Prediction 2nd, 3rd structural prediction、comparison Protein interaction predicion ORFORF Finder (demo)功能预测 第一步: databa
6、se search Blast然后尝试搜索各个数据库 找到最接近的蛋白,寻找它的注释和功能信息MPSS/mpss/Structure Prediction二级结构预测Tertiary Structure Predictionrussell.embl-heidelberg.de/gtsp/flowchart2.htmlProtein Structural ComparisonProtein Interaction Prediction 用蛋白序列搜索各大相互作用数据库 BIND, STRING, DIPPhylogenetic Analysis PHYLIP MEGA Tree
7、View PAUP* MrBayes PAML PHYML /phylip/software.htmlPhylipJoe Felsenstein “No Thanks to”特点 发布早,使用非常广泛 命令行driven 能够处理各种类型的数据 包括除Bayesian之外的几乎所有方法 模块化 可批量处理Flowchart文件格式 输入均为PHYLIP格式 输出进化树文件为newick格式(1,2),3),4);(1:1.0,2:2.0):1.0,3:2.0):1.0,4:1.0);MEGADemo timeTreeViewPA
8、UP* By David Swoffold 特点 包括几乎所有构树方法 Bayes方法,蛋白序列的ML方法除外 在Mac上有良好的图形界面 MP方法有非常完善的参数设定及选项,MP树的最佳选择 ML方法也比较完善结合Modeltest) 灵活的分析流程及参数设定,适合各种要求 100$文件格式 输入文件 NEXUS 输出文件 NEXUS, newickNEXUS format#NEXUSBEGIN DATA;dimensions ntax=5 nchar=664;format missing=?symbols=ABCDEFGHIKLMNPQRSTUVWXYZinterleave datatyp
9、e=DNA gap= -;matrixO.lichuanensis TGAAACTTTGGCTCTTTTTTAGGCATCTGCTTGGTCGCCCAO.rhodostigmatus TGAAACTTTGGCTCTCTTCTAGGCATCTGCCTAATTACCCAO.popei TGAAATTTTGGTTCTCTTCTTGGCATCTGCTTAGCCACCCAS.chintingenis TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCAS.boulengeri TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCA;End;PAU
10、P*批处理脚本示例#nexusbegin PAUP;log file=hsearchl.log;set autoclose=yes;hsearch start=stepwise addseq=randomn reps=100 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes;savetrees file=hsearch1.all.tre;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;log stop;end; MacClade
11、By the Maddison brothersMrbayes By John Huelsenbeck & Fredrik RonquistFeatures of Bayesian Method Handles complex models with many parameters Based on likelihood, statistically consistent Faster than ML method,can handle 50 taxon phylogeny Combine multiple types of data (DNA, protein,morphology, etc)文件格式 只接受NEXUS格式 只输出NEXUS格式用处 用来输入和编辑数据,生成NEXUS格式文件,供PAUP,MrBayes等程序使用 图形化显示和编辑进化树 性状进化分析 祖先性状重建PA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建三明市泰宁县招聘农业普查人员4人考试备考试题及答案解析
- 2026四川乐山市市属事业单位考核招聘22人(武汉专场)考试备考题库及答案解析
- 2025年就业援藏省(市)和非援藏省事业单位面向西藏籍高校毕业生补充招聘1考试模拟试题及答案解析
- 2026年河南省周口市幼儿园教师招聘笔试备考题库及答案解析
- 2026年青岛市四方区街道办人员招聘考试参考题库及答案解析
- 2026年武汉市黄陂区卫生健康系统人员招聘笔试备考试题及答案解析
- 史学著作《澳大利亚土著与白人》第20章英汉翻译实践报告
- 校服管理制度
- 2025-2030全球与中国冰淇淋自动售货机行业营销模式及经营管理风险研究报告
- 学校项目采购制度
- 人教版 (2019)必修1《分子与细胞》第2节 细胞器之间的分工合作表格教案
- GB 18280.1-2025医疗产品灭菌辐射第1部分:医疗器械灭菌过程的开发、确认和常规控制要求
- 时尚穿搭培训课件
- 潮州土墙加固施工技术交底
- 2025闵行七宝镇村(合作社)、镇属公司公开招聘20人模拟试卷(含答案详解)
- 2024-2025学年辽宁省丹东市第十九中学七年级下学期期中考试数学试题
- 猫宁供应商入驻考试答案50题苏宁考试题库
- 2025年高考数学全国一卷试题真题及答案详解(精校打印)
- 商业购物中心广告氛围形象管理规范课件分享
- 2024版股份合资企业运营管理及风险控制合同3篇
- 磷石膏固废资源化利用技术及应用前景
评论
0/150
提交评论