



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
如何看懂NCBI BLAST输出结果2010-11-13 10:38:11|分类: 生物信息分析 |标签:blast |字号大中小订阅本文转自:/bio/?p=1632 写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最 相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息 等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。最新的BLAST结果报告解读,本文以BLASTP为例子,说明如何来解读BLAST结果。示例BLAST地址:/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome 比对用的例子:gi|16758036|ref|NP_445782.1| ribosomal protein L21 Rattus norvegicusMTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQHAVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKGTWVQLNGQPAPPREAHFVRTNGKEPELLEPIPYEFMA数据选择:nr比对时间:2009年9月9日12:46:23解读报告前需要掌握的概念:alignments 代表比对上的两个序列hits 表示两个序列比对上的片段Score 比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高E Value 值越小,越可信,相对的一个统计值。Length 输入序列的长度Identities 一致性,就是两个序列有多少是一样的Query 代表输入序列Sbjct 代表数据库中的序列结果详细说明菜单与基本信息NCBI Blast结果-菜单与基本信息1.下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;2.此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI会自动生成一个;3.你输入序列的信息,包括标识号、描述信息、类型、长度;4.数据库的信息以及你选择的Blast程序;5.查看其他报告,比如摘要、分类、距离树、结构、多重比对等。Graphic SummaryGraphic Summary1.保守域,Blastp时,如果与保守域数据库比对有结果时,方显示;2.Distribution of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;3.这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;4.颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果;5.输入序列的坐标;6.每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要 判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像 整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什 么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。DescriptionsDescriptions1.比对上序列的标识符,上面有到该序列详细信息的链接;2.序列的表述信息,可以知道这个序列功能、基因、物种等信息;3.比对得分,由高向低排列,上面有到比对详细信息的链接;4.E value,由低向高排列;5.该序列的其他链接,字母表示数据库,比如U表示unigene、G表示Gene数据库;深入解读:简要的列表形式,便于阅读都比对上了哪些序列,(如果你经验丰富,从score的得分就大致可以判断序列的相似性)序列的相似情况。AlignmentsAlignments 比对详细信息1.比对上的序列信息;2.比对的各种得分,这里不做一一说明,不清楚请参看我的另一篇关于blast结果解析的文章(这里我最关注的是Identities,比对上(一 致)的数字、一共有多少个,比对上所占的比例)3.具体的比对序列显示,一目了然,知道了哪些序列比对上了,哪些序列是不一样的,这里也要注意序列的位置关系;4.5.复选框,可以选择感兴趣的比对序列,在处进行相应的操作;6.对选择的序列进行操作,比如下载这些序列、画系统发育树、进行多重比对。深度解读:blast是以hit为单位显示的结果,分段比对是其核心,所以对于每个hit所显示的信息应当有个深入的理解。至于比对上的情况如何, 不要迷信于那些数字,通过序列,你一眼就可以看出来。最后就是注意5、6的操作,可以给你带来很大的便利。小结根据不同的目的,在blast结果中寻求的东西也是不同的,这里仅仅是对于默认结果做了一个说明,你还可以根据你的目的进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年燃气安全题库及答案
- QC安全生产培训内容课件
- 2025年热处理试题及答案
- 中考几何面积题目及答案
- 2025年数学的搞笑题目及答案
- 色彩构成考试题库及答案
- 洗胃法考试题及答案
- 高压力电工理论考试题及答案
- 希望杯题库及答案
- 吸氧题目及答案
- 华晨宝马大东厂区天然气分布式能源站项目环评报告
- 青海2023届高校毕业生就业报告出炉:医学和法学就业率最高
- 汽车电控发动机构造与维修(第三版)
- GB/T 328.13-2007建筑防水卷材试验方法第13部分:高分子防水卷材尺寸稳定性
- 茶叶实践报告3篇
- 西门子低压电器快速选型手册
- 养羊与羊病防治技术课件
- 最新教科版五年级科学上册《第2课时 地球的结构》教学课件
- Q∕SY 05129-2017 输油气站消防设施及灭火器材配置管理规范
- 企业微信私域流量运营方案
- 中职学校《机械基础》第二学期全套电子教案(含教学进度计划)(配套教材:高教版中职统编)云天课件
评论
0/150
提交评论