版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、序列分析工具使用简介黄远森中山大学生命科学学院8/7/202211.数据库搜索工具-Blast (basic local alignment search tools)2.多序列比对工具-Clustal3.进化树重建与分析工具-Phylip8/7/20222数据库搜索工具-Blast1.Blast与NCBI2.如何获得blast服务3.Blast的各个程序介绍4.一个简单的实例8/7/20223Blast与NCBI返回BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似的数据库搜索程序。NCBI提供了在线的blast服务/blast/8/7/20224获得blast服务返
2、回1.使用NCBI提供的在线服务。/blast/ 优点:数据库更新快,使用方便,可随时查看搜索结果。 缺点:受限与网络和程序运行速度,只能搜索固定的数据库。2,本地化的blast。 a.服务器版 /blast/ /blast/ b.单机版 (NCBI提供多种版本,包括DOS版本) 优点:即时返回结果,可以搜索特殊数据库。 缺点:数据库的更新问题,操作性问题。8/7/20225Blast的各个程序介绍返回8/7/20226实例 假设我们获得一个人类的蛋白序列,但我们不知道它具体是哪一种东西,我们可以通过blast搜索,看看它可能是什么东西。 phenylalanine hydroxylase M
3、STAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQ
4、FSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK 返回8/7/20227实例返回第一步:登陆NCBI的Blast页面,选择blastp程序,将所要搜索的序列粘贴到查询窗口。8/7/20228实例第二步:设定好参数后点击blast,开始搜索。任务提交后,返回一个查询id。根据该id可以在任意时候查看查询结果。返回8/7/20229实例第三步:返回
5、查询结果。返回8/7/202210实例返回8/7/202211实例返回8/7/202212多序列比对工具clustalClustal是一个单机版的基于渐进比对的多序列比对工具,由Higgins D.G. 等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,windows版本的clustalx等。8/7/202213Clustalx的工作界面(多序列比对模式)8/7/202214Clustalx的工作界面(剖面(profile)比对模式)8/7/202215Clustal的工作原理Clustal输入多个序列快速的序列两两比对,计算序列间的距离,获得一个距离矩阵。邻
6、接法(NJ)构建一个树(引导树)根据引导树,渐进比对多个序列。8/7/202216Clustal的应用1.输入的文件格式。 FASTA ,NBRF/PIR, EMBL/Swiss Prot, GDE, CLUSTAL, GCG/ MSF. 2.两种工作模式。 a.多序列比对模式。 b.剖面(profile)比对模式。3.一个实际的例子。8/7/202217多序列比对实例输入文件的格式(fasta):KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTNDMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK.KPRO_MAIZE TRKFKV
7、ELGRGESGTVYKGVLEDDRHVAVKKLENDAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD1CSN HYKVGRRIGEGSFGVIFEGTNLLNN8/7/202218第一步:输入序列文件。8/7/202219第二步:设定比对的一些参数。8/7/202220参数设定窗口。8/7/202221第三步:开始序列比对。8/7/2022228/7/202223第四步:比对完成,选择保存结果文件的格式8/7/2022248/7/202225更为详细的教程可以在这里得到更多关于clustal的帮助:http:/www-igbmc.u-strasbg
8、.fr/BioInfo/ClustalX/Top.html 8/7/202226进化树重建与分析工具phylip phylip是最为通用的进化树分析软件。该软件是由华盛顿大学开发,是完全免费的,并提供源代码。 /phylip.html 该软件具有以下功能: 1. 将DNA或蛋白质序列数据转变成距离数据。 2.对距离数据进行分析。 3.对基因频率和连续的元素进行分析。 4.根据各种数据绘制采用一定的算法构建进化树。 8/7/202227用于进化树重建的数据1.特征数据(character data),它提供了基因、个体、群体或物种的信息。2.是距离数据(distance data)或相似性数据(
9、similarity data),它涉及的则是成对基因、个体、群体或物种的信息。8/7/202228进化树重建的方法一.距离法二.最大简约法(maxparsimosy)三.最大似然法(maxlikelihood)8/7/202229Phylip3.6软件包中包含的程序(根据分析的对象)最新的3.6版本中,一共有35个分析程序。其中:1. DNA和RNA数据分析工具。(10个)2.蛋白序列数据分析工具。(6个)3.限制酶位点数据的分析工具。(6个)4.距离矩阵数据分析工具。(3个)5.基因频率数据分析工具。(3个)6.连续和离散的特征数据的分析工具。(12个)7.进化树的显示和编辑工具。(4个)
10、 详细请参考phylip主页的介绍:/phylip/programs.html 8/7/202230出发数据已经排列好的蛋白序列。重构算法距离法(protdist.exe) 最大简约法(protpars.exe) 最大似然法(proml.exe)统计分析拨靴法(bootstrap)实际应用(从蛋白序列推导进化树)8/7/202231实际操作 Phylip软件包中的每个分析程序都是一个独立的应用程序。我们选择好了分析算法后,按一定的顺序组合使用选择的程序,就可以获得按选择的算法分析的结果(进化树)。例子:从我们刚刚通过clustal比对获得的蛋白序 列推测进化树。 选择方法:距离法(protdi
11、st.exe)8/7/202232第一步:双击执行protdist.exe,根据提示输入分析的 文件名(程序默认是infile)。8/7/202233第二步:设定各个参数,执行程序,获得距 离矩阵数据输出文件outfile。第三步:选择通过距离矩阵推测进化树的算 法(fitch.exe,kotsch.exe,neighbor.exe)。第四步:将刚获得的输出文件改名为infile,执行选择的推测算法(neighbor.exe)。设置好参数后执行程序,获得outfile和outtree两个结果输出。8/7/2022348/7/202235 获得的结果文件中,outtree文件是一个树文件,可以用treeview等软件打开。outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。outfileouttree8/7/202236加入统计分析(bootstrap)我们刚刚获得的进化树是纯粹的根据先前获得的排列数据所推导出来的。有很多可能使得这个树并不一定可靠。1.测序的出错。2.多序列比对算法本身的问题。3.其他的问题。我们可以引进一些统计分析来寻找更优的进化树最常见的就是bootstrap分析。8/7/202237Bootstrap分析Phylip软件包中有两个用于执行bootstrap分析的程序。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关节镜下半月板修复微创手术
- DB5308T 16.1-2014 景东无量山乌骨鸡养殖综合技术规范 第1部分:品种要求
- 宁银消金2027届暑期实习生招募备考题库及完整答案详解一套
- 2026西工大化学与化工学院博士后招聘58人备考题库及参考答案详解
- 应急疏散演练准则制度
- 危废处理操作管控办法
- 2026年安徽中医药大学公开招聘教学、科研人员及辅导员18名备考题库(第一批)及一套完整答案详解
- 2026黑龙江大庆市人民医院招聘备考题库参考答案详解
- 2026上海康余管理服务有限公司招聘2人备考题库完整答案详解
- 2026河南开封一五五医院招聘工作人员备考题库含答案详解
- YY/T 0107-2024眼科A型超声测量仪
- 卡介苗乙肝疫苗预防接种
- 建行住房抵押贷款合同
- 2024年甘肃省天水市中考地理试题卷(含答案)
- 原污水管道堵塞疏通工程招投标书范本
- 人工智能在金融科技伦理与法律监管中的应用
- 春节一家人打牌引发趣事
- 矫正型大动脉转位伴发畸形矫治术后护理查房
- 货币战争与人民币战略
- 泥浆及土方外运合同
- 纳豆激酶(日本原装进口纳豆激酶)
评论
0/150
提交评论