已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实习一基因组数据注释和功能分析 课程内容 基因组学 转录物组学 蛋白质组学 系统生物学 通过序列比对工具BLAST学习 了解蛋白编码基因的功能注释原理介绍多序列联配工具ClustalX分子进化分析软件MEGA4的基本知识 掌握系统发生树绘制的基本方法 序列比对的进化基础 什么是序列比对 将两个或多个序列按照最佳匹配方式排列在一起 对应的相同或相似的符号排列在同一列上 错配与突变相应 空位与插入或缺失对应 序列比对的目的 从核酸以及氨基酸的层次去分析序列的相同点和不同点 以推测他们的结构 功能以及进化上的联系通过判断两个序列之间的相似性来判定两者是否具有同源性相似性 可以被数量化 如 序列之间相似部分的百分比同源性 质的判断 两个基因在进化上是否曾有共同祖先的推断 BLAST 基本局部比对搜索工具 BasicLocalAlignmentSearchTool NCBI上BLAST服务的网址 http www ncbi nlm nih gov blast NCBI上blast程序的下载 ftp ncbi nlm nih gov blast executables release NCBI的BLAST数据库下载网址 ftp ftp ncbi nlm nih gov blast 选择物种 选择blast程序 QuerySequence AminoacidSequence DNASequence tBLASTx BLASTx BLASTn tBLASTn BLASTp NucleotideDatabase ProteinDatabase NucleotideDatabase NucleotideDatabase ProteinDatabase Translated Translated Translated 以Blastx为例 目标序列为ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC 6个读码框翻译 5 端到3 端第一位起始 ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第二位起始 TGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第三位起始 GAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC3 端到5 端第一位起始 GCGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第二位起始 CGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第三位起始 GGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT 与核酸相关的数据库 与蛋白质相关的数据库 选择数据库 序列或目标序列的GI号 以文件格式上传 BlastN 配对与错配 空位罚分 BlastP 打分矩阵 PAM30PAM70BLOSUM80BLOSUM62BLOSUM45 PAM模型可用于寻找蛋白质的进化起源 而BLOSUM模型则用于发现蛋白质的保守域 选择打分矩阵 scoringmatrix ThePAMfamilyBasedonglobalalignmentsThePAM1isthematrixcalculatedfromcomparisonsofsequenceswithnomorethan1 divergence OtherPAMmatricesareextrapolatedfromPAM1 TheBLOSUMfamilyBasedonlocalalignments BLOSUM62isamatrixcalculatedfromcomparisonsofsequenceswithnolessthan62 divergence AllBLOSUMmatricesarebasedonobservedalignments theyarenotextrapolatedfromcomparisonsofcloselyrelatedproteins 进行比对的数据库 图形化结果 E值 E value 表示仅仅因为随机性造成获得这一比对结果的可能性 这一数值越接近零 发生这一事件的可能性越小 上机实习1 网上运行blastx和blastn NCBIblast网址 http www ncbi nlm nih gov BLAST lesson seq screen Contig34TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTGCTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGCAAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACC对contig34进行网上blastn 演示 blastx 自行操作 比对 由于时间关系 请参见预存结果 本地运行BLAST 下载NCBI上blast程序 ftp ncbi nlm nih gov blast executables release 安装 安装到C 数据库的格式化 formatdb 程序运行 blastall 登陆NCBI的FTP下载blast程序 双击安装到C盘产生三个文件夹bindatadoc 将数据库文件 db 及目标序列文件 in 保存在Blast bin文件夹下 bin含可执行程序 将数据库及需要比对操作的数据放入该文件 data文件夹含打分矩阵及演示例子的序列数据信息 doc文件夹含关于各子程序的说明文档 本地数据库的构建 查看db文件 由fasta格式的序列组成 数据库的格式化 formatdb命令用于数据库的格式化 formatdb option1 option2 option3 formatdb常用参数 idatabase name需要格式化的数据库名称 pT F待格式化数据库的序列类型 核苷酸选F 蛋白质选T 默认值为T 例 formatdb idb pT 对蛋白质数据库 db 进行格式化 程序运行 blastall命令用于运行五个blast子程序 blastall option1 option2 option3 可在dos下输入blastall查看各个参数的意义及使用blastall常用参数四个必需参数 pprogram name 程序名 根据数据库及搜索文件序列性质进行选择 ddatabase name 数据库名称 比对完成格式化的数据库 iinput file 搜索文件名称 ooutput file BLAST结果文件名称 两个常用参数 eexpectation 期待值 默认值为10 0 可采用科学计数法来表示 如2e 5 malignmentviewoptions 比对显示选项 其具体的说明可以用以下的比对实例说明例 blastall pblastx ddb iin oout e2e 5 m9 表格显示比对结果 采用blastx程序 将in中的序列到数据库bd中进行比对 结果以表格形式输入到out文件 上机实习2 本地运行blastx 进入DOS命令行提示符状态 运行 cmd 进入C盘 cd 进入包含序列数据的bin目录下 cdBlast bin 察看目录下内容 dir 格式化数据库db formatdb idb pT 运行blastx blastall pblastx iin ddb oout e2e 5 m9 察看结果 moreout 或在windows下双击打开 输入 数据库类型 F T Blast程序序列输入数据库结果输出 输入 cd 回车回到安装目录C盘 输入 cdblast bin 回车到达blast程序下bin文件夹 输入 dir 回车察看bin文件夹下内容 bin文件夹下包含以 exe为后缀的程序文件以及这次实习需要用到的数据可文件 bd 和目标序列文件 in 输入 moredb 回车察看db文件内容 空格键翻页输入 q 跳出 输入 formatdb idb pT 回车对db数据库进行格式化 输入 dir 回车察看bin文件夹下内容 格式化以后产生的文件 输入 blastall pblastx iin ddb oout e2e 5 m9 回车运行blastx程序 产生的结果文件 out 用 moreout 察看结果文件 不使用 m参数时比对结果显示序列两两比对 用 moreout 察看结果文件 多序列比对的目的 从物种的一些分子特性出发 从而了解物种之间的生物系统发生的关系 通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律 多序列比对的应用 系统发育分析 phylogeneticanalysis 结构预测 structureprediction 序列基序鉴定 sequencemotifidentification 功能预测 functionprediction ClustalW ClustalX 一种全局的多序列比对程序 可以用来绘制亲缘树 分析进化关系 MEGA4 ClustalW X的运行 本地运行命令行操作的ClustalW linux windows 窗口化操作的ClustalX windows 下载页面 ftp ftp ebi ac uk pub software 欧洲生物学中心 EBI 还提供了ClustalW的网上运行服务 http www ebi ac uk clustalw 目标序列 各种参数设定 下载ClustalX Jalview 结果下载 上机实习3 本地运行ClustalX 17 RNASE1 fasta多序列比对 MultipleAlignment 在C zcni shiyan1 clustalx1 83文件夹下 找到clustalx exe双击打开 Clustalx窗口 点击File下拉菜单中Loadsequences选项 打开序列文件17 RNASE1 fasta txt 打开后的界面 点击进行多序列比对 可在Alignment下拉菜单中的AlignmentParameters中设定各个参数 点击Alignment下拉菜单中的DoCompleteAlignment进行比对 比对结果 和空格依次代表改位点的序列一致性由高到低 MEGA4 一个关于序列分析及比较统计的工具包包含距离建树 MP等建树法自动或手动进行序列比对 推断进化树 估算分子进化率 进行进化假设测验 联机进行数据库搜索 MEGA4可以识别fasta格式文件将17 RNASE1 fasta txt重命名为17 RNASE1 fasta 选择打开方式为MEGA4 打开17 RNASE1 fasta 自动跳出序列窗口用ClustalW做多序列联配 ClustalW参数设置 以 meg格式保存结果 回到MEGA主窗口激活所保存的文件 meg 编辑标注保守区域标注不匹配的区域 回到MEGA4主窗口构建进化树 已被激活的文件 选择Bootstrap重复次数 至少为100次 四种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 普外科胰腺癌手术后康复计划
- 老旧小区改造项目施工组织设计
- 四点共圆基本判断方法(超全)专题培训课件
- 2025年教师资格之小学教育学教育心理学每日一练试卷A卷含答案
- 2025企业合作合同技术共享协议与联合研发合同子公司版文档范本
- 2025超市冷藏食品供货合同协议书
- 2025标准果园承包合同范本
- 城镇老旧小区改造案例图集
- 水利工程安全生产风险管控六项机制建设要求培训课件
- 血液净化室库房管理制度
- 2025年及未来5年中国鱼具行业市场运营现状及投资战略咨询报告
- 《政务信息系统运行维护费用定额测算方法》
- 物流车辆动态安全监控操作规程
- 2025中国电气装备许继集团许继电气校园招聘笔试历年参考题库附带答案详解
- 高中语文高考语文复习+高考中的成语考查+课件
- 2025甘肃庆阳正宁县公安局招聘警务辅助人员40人备考考试题库附答案解析
- 七年级历史上学期期末选择题100题-附答案解答
- 2025健身房与瑜伽馆合作经营合同
- 四川省公务员2025年考试行测言语理解真题试卷(含答案)
- 矿山绿色矿业建设规划
- 低温天气安全教育培训课件
评论
0/150
提交评论