已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实习一基因组数据注释和功能分析,课程内容,基因组学,转录物组学,蛋白质组学,系统生物学,通过序列比对工具BLAST学习,了解蛋白编码基因的功能注释原理介绍多序列联配工具ClustalX分子进化分析软件MEGA4的基本知识,掌握系统发生树绘制的基本方法,序列比对的进化基础,什么是序列比对:将两个或多个序列按照最佳匹配方式排列在一起。对应的相同或相似的符号排列在同一列上。错配与突变相应,空位与插入或缺失对应。序列比对的目的:从核酸以及氨基酸的层次去分析序列的相同点和不同点,以推测他们的结构、功能以及进化上的联系通过判断两个序列之间的相似性来判定两者是否具有同源性相似性:可以被数量化,如:序列之间相似部分的百分比同源性:质的判断,两个基因在进化上是否曾有共同祖先的推断,BLAST,基本局部比对搜索工具(BasicLocalAlignmentSearchTool)NCBI上BLAST服务的网址:/blast/NCBI上blast程序的下载:/blast/executables/release/NCBI的BLAST数据库下载网址:/blast/,选择物种,选择blast程序,QuerySequence,AminoacidSequence,DNASequence,tBLASTx,BLASTx,BLASTn,tBLASTn,BLASTp,NucleotideDatabase,ProteinDatabase,NucleotideDatabase,NucleotideDatabase,ProteinDatabase,Translated,Translated,Translated,以Blastx为例:,目标序列为ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC,6个读码框翻译,5端到3端第一位起始:ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第二位起始:TGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第三位起始:GAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC3端到5端第一位起始:GCGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第二位起始:CGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第三位起始:GGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT,与核酸相关的数据库,与蛋白质相关的数据库,选择数据库,序列或目标序列的GI号,以文件格式上传,BlastN,配对与错配,空位罚分,BlastP,打分矩阵:PAM30PAM70BLOSUM80BLOSUM62BLOSUM45,PAM模型可用于寻找蛋白质的进化起源,而BLOSUM模型则用于发现蛋白质的保守域。,选择打分矩阵(scoringmatrix),ThePAMfamilyBasedonglobalalignmentsThePAM1isthematrixcalculatedfromcomparisonsofsequenceswithnomorethan1%divergence.OtherPAMmatricesareextrapolatedfromPAM1.TheBLOSUMfamilyBasedonlocalalignments.BLOSUM62isamatrixcalculatedfromcomparisonsofsequenceswithnolessthan62%divergence.AllBLOSUMmatricesarebasedonobservedalignments;theyarenotextrapolatedfromcomparisonsofcloselyrelatedproteins.,进行比对的数据库,图形化结果,E值(E-value)表示仅仅因为随机性造成获得这一比对结果的可能性。这一数值越接近零,发生这一事件的可能性越小。,上机实习1:网上运行blastx和blastn,(NCBIblast网址:/BLAST/)lesson.seq.screen.Contig34TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTGCTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGCAAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACC对contig34进行网上blastn(演示),blastx(自行操作)比对*由于时间关系,请参见预存结果。,本地运行BLAST,下载NCBI上blast程序:/blast/executables/release/安装(安装到C:)数据库的格式化(formatdb)程序运行(blastall),登陆NCBI的FTP下载blast程序,双击安装到C盘产生三个文件夹bindatadoc,将数据库文件(db)及目标序列文件(in)保存在Blast/bin文件夹下,bin含可执行程序(将数据库及需要比对操作的数据放入该文件);data文件夹含打分矩阵及演示例子的序列数据信息;doc文件夹含关于各子程序的说明文档。,本地数据库的构建,查看db文件,由fasta格式的序列组成,数据库的格式化,formatdb命令用于数据库的格式化:formatdboption1option2option3formatdb常用参数-idatabase_name需要格式化的数据库名称-pTF待格式化数据库的序列类型(核苷酸选F;蛋白质选T;默认值为T)例:formatdb-idb-pT,对蛋白质数据库“db”进行格式化,程序运行,blastall命令用于运行五个blast子程序:blastalloption1option2option3*可在dos下输入blastall查看各个参数的意义及使用blastall常用参数四个必需参数-pprogram_name,程序名,根据数据库及搜索文件序列性质进行选择;-ddatabase_name,数据库名称,比对完成格式化的数据库;-iinput_file,搜索文件名称;-ooutput_file,BLAST结果文件名称;两个常用参数-eexpectation,期待值,默认值为10.0,可采用科学计数法来表示,如2e-5;-malignmentviewoptions:比对显示选项,其具体的说明可以用以下的比对实例说明例:blastall-pblastx-ddb-iin-oout-e2e-5-m9(表格显示比对结果),采用blastx程序,将in中的序列到数据库bd中进行比对,结果以表格形式输入到out文件,上机实习2:本地运行blastx,进入DOS命令行提示符状态(“运行”cmd)进入C盘“cd”进入包含序列数据的bin目录下“cdBlastbin”察看目录下内容“dir”格式化数据库db“formatdb-idb-pT”运行blastx“blastall-pblastx-iin-ddb-oout-e2e-5-m9”察看结果“moreout”或在windows下双击打开,输入,数据库类型:F/T,Blast程序序列输入数据库结果输出,输入“cd”-回车回到安装目录C盘,输入“cdblastbin”-回车到达blast程序下bin文件夹,输入“dir”-回车察看bin文件夹下内容,bin文件夹下包含以.exe为后缀的程序文件以及这次实习需要用到的数据可文件“bd”和目标序列文件“in”,输入“moredb”-回车察看db文件内容,空格键翻页输入“q”跳出,输入“formatdbidbpT”-回车对db数据库进行格式化,输入“dir”-回车察看bin文件夹下内容,格式化以后产生的文件,输入“blastall-pblastx-iin-ddb-oout-e2e-5-m9”-回车运行blastx程序,产生的结果文件“out”,用”moreout”察看结果文件,不使用m参数时比对结果显示序列两两比对,2019/12/12,38,可编辑,用”moreout”察看结果文件,多序列比对的目的,从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。,多序列比对的应用:系统发育分析(phylogeneticanalysis)结构预测(structureprediction)序列基序鉴定(sequencemotifidentification)功能预测(functionprediction)ClustalW/ClustalX:一种全局的多序列比对程序,可以用来绘制亲缘树,分析进化关系。MEGA4,ClustalW/X的运行,本地运行命令行操作的ClustalW(linux&windows)窗口化操作的ClustalX(windows)下载页面:ftp:/ftp.ebi.ac.uk/pub/software/欧洲生物学中心(EBI)还提供了ClustalW的网上运行服务(http:/www.ebi.ac.uk/clustalw),目标序列,各种参数设定,下载ClustalX,Jalview,结果下载,上机实习3:本地运行ClustalX,17-RNASE1.fasta多序列比对(MultipleAlignment),在C:zcnishiyan1clustalx1.83文件夹下,找到clustalx.exe双击打开,Clustalx窗口,点击File下拉菜单中Loadsequences选项,打开序列文件17-RNASE1.fasta.txt,打开后的界面,点击进行多序列比对,可在Alignment下拉菜单中的AlignmentParameters中设定各个参数,点击Alignment下拉菜单中的DoCompleteAlignment进行比对,比对结果“*”、“:”、“.”和空格依次代表改位点的序列一致性由高到低,MEGA4,一个关于序列分析及比较统计的工具包包含距离建树,MP等建树法自动或手动进行序列比对;推断进化树;估算分子进化率,进行进化假设测验;联机进行数据库搜索;,MEGA4可以识别fasta格式文件将17-RNASE1.fasta.txt重命名为17-RNASE1.fasta,选择打开方式为MEGA4,打开17-RNASE1.fasta,自动跳出序列窗口用ClustalW做多序列联配,ClustalW参数设置,以.meg格式保存结果,回到MEGA主窗口激活所保存的文件(.meg),编辑标注保守区域标注不匹配的区域,回到MEGA4主窗口构建进化树,已被激活的文件,选择Bootstrap重复次数,至少为100次,四种系统进化树构建方法,分化程度较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年起重机械指挥证模拟考试题及答案
- 写字楼安全管理课件
- 地质工程专业单招模拟题集
- 建筑设计原理B章节测试题及答案详解
- 急救手环功能应用考试题库及参考答案
- 火灾逃生自救技巧测试及答案详解
- 建筑工程材料学模拟考试题库及答案
- 建筑工程测量核心知识点梳理与习题集
- 教育学习bi备资料山羊智力测试题库及答案解析集
- 建筑设计理念应用题实战演练及答案
- AI人工智能应用介绍PPT
- MT-146.1-2011-树脂锚杆-第一部分:锚固剂
- 铝合金门窗工程计算表及单价分析表(自动计算)
- GB/T 5751-2009中国煤炭分类
- GB/T 23465-2009呼吸防护用品实用性能评价
- GB/T 13477.18-2002建筑密封材料试验方法第18部分:剥离粘结性的测定
- 第五章-金融衍生工具市场-货币金融学-蒋先玲课件
- 加拿大育空考察报告 - 副本
- 素描静物中苹果绘画步骤课件
- 社区妇联换届选举操作手册
- 大学生创业计划书(创新创业课)
评论
0/150
提交评论