大学生物信息学课件-第2章核酸序列分析.ppt_第1页
大学生物信息学课件-第2章核酸序列分析.ppt_第2页
大学生物信息学课件-第2章核酸序列分析.ppt_第3页
大学生物信息学课件-第2章核酸序列分析.ppt_第4页
大学生物信息学课件-第2章核酸序列分析.ppt_第5页
免费预览已结束,剩余49页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章核酸序列分析 2 1GenBank数据格式2 2序列数据库检索2 3核酸序列相似性分析2 4核酸的多序列比对2 5构建进化树2 6核酸序列的预测与鉴定2 7核酸序列的酶切位点分析 2 1GenBank数据格式 24 3 Click Search 1 Select nucleotide 2 Enter U49845 GenBank数据格式 长度 分子类型 来源 更新日期 登录号 24 作者 标题 生物 杂志 表2 1GenBank分类码 26 PRIRODMAMVRTINVPLNBCTVRLPHGSYNUNAESTPATSTSGSSHTGHTC primatesequences rodentsequences othermammaliansequences othervertebratesequences invertebratesequences plant fungal andalgalsequences bacterialsequences viralsequences bacteriophagesequences syntheticsequences unannotatedsequences ESTsequences expressedsequencetags patentsequences STSsequences sequencetaggedsites GSSsequences genomesurveysequences High throughputgenomicsequences High throughputcDNAsequencing 灵长类序列啮齿类序列其他哺乳动物序列其他脊椎动物序列无脊椎动物序列植物 真菌 藻类序列细菌序列病毒序列噬菌体序列合成序列未注释序列表达序列标签序列专利序列序列标签位点序列基因组探查序列高通量基因组序列高通量cDNA序列 Features 特性表 codingsequences 编码序列 翻译产物 表2 2特性表主要关键词 29 请看书本第29页 GenBankdataformat 4 4 核苷酸序列 2 2序列数据库检索 33 AllDatabases下拉菜单提供了分类提取数据的功能 用 序列号 提取核苷酸数据 1 选择Nucleotide 2 输入 AF310622 3 Click 提取结果 1 2 提取结果 2 2 用 序列号 提取蛋白质数据 1 选择Protein 2 输入 P15172 3 Click 提取结果 1 2 提取结果 2 2 Practice 请把刚才讲过的内容练习一遍 2 3核酸序列相似性分析 38 对一个新测定的核酸序列的序列数据 可以通过使用不同的关键词从数据库中检索有用的信息 还可以做以下的工作 单条序列的序列特征分析 序列的双重比对和数据库检索 多序列比对 通过多序列比对分析序列的模块 构建进化树 2 3 1相似性搜索 39 同源性 homology 指两条序列在进化上相关 来自于共同祖先 是一种已经发生的进化事件 取值 YesorNo 需要通过相关分析才能得出结论 例如 对bHLH转录因子序列的系统发生分析时 如果用不同建树方法得到的树形一致并且自举检验值高于50 时 认为序列之间有同源性 相似性 similarity 只是指两条序列之间的简单相似 取值 0 100 只需通过BLAST 或类似的程序 进行估算 同源 不一定 相似 39 人 猫 鲸和蝙蝠的前肢骨骼具有同源性 1 BLAST 40 BLAST basiclocalalignmentsearchtool基本局部比对搜索工具 BasicBLAST 5种 SpecializedBLAST 8种 Clickhere BasicBLAST 40 blastn blastp BasicBLAST 核酸序列Nucleotidesequence 蛋白质序列Proteinsequence 核酸序列Nucleotidesequences 蛋白质序列Proteinsequences blastn blastp tblastn blastx tblastx 查询序列Querysequence 数据库序列Databasesequences BasicBLAST blastn 用核酸序列检索核酸序列数据库blastp 用蛋白质序列检索蛋白质序列数据库blastx 把核酸序列翻译成蛋白质序列后检索蛋白质序列数据库 查询序列以所有6种读码框翻译后再进行比较 tblastn 用蛋白质序列检索核酸序列数据库 数据库中的核酸序列以所有6种读码框翻译后与查询序列比较 tblastx 把核酸序列翻译成蛋白质序列后检索核酸序列数据库 查询序列和数据库序列都以所有6种读码框翻译后再进行比较 6种读码框 5 TCTTCCTCAAAATAAAGAAGTATGGTAATC 3Frame 1TCTTCCTCAAAATAAAGAAGTATGGTAATCFrame 2TCTTCCTCAAAATAAAGAAGTATGGTAATCFrame 3TCTTCCTCAAAATAAAGAAGTATGGTAATCFrame 1GATTACCATACTTCTTTATTTTGAGGAAGAFrame 2GATTACCATACTTCTTTATTTTGAGGAAGAFrame 3GATTACCATACTTCTTTATTTTGAGGAAGA 3 AGAAGGAGTTTTATTTCTTCATACCATTAG 5 SpecializedBLAST 1 blastn 41 Clickhere blastn的界面与相关数据库 41 2 Selectdatabase 3 Click BLAST Pasteyoursequencehere Word TextorFASTAformat Blastndatabases 41 请参考表2 5的说明 Example2 1 44 使用blastn对下面的序列进行相似性检索 AAAAGAAAAGGTTAGAAAGATGAGAGATGATAAAGGGTCCATTTGAGGTTAGGTAATATGGTTTGGTATCCCTGTAGTTAAAAGTTTTTGTCTTATTTTAGAATACTGTGATCTATTTCTTTAGTATTAATTTTTCCTTCTGTTTTCCTCATCTAGGGAACCCCAAGAGCATCCAATAGAAGCTGTGCAATTATGTAAAATTTTCAACTGTCTTCCTCAAAATAAAGAAGTATGGTAATCTTTACCTGTATACAGTGCAGAGCCTTCTCAGAAGCACAGAATATTTTTATATTTCCTTTATGTGAATTTTTAAGCTGCAAATCTGATGGCCTTAATTTCCTTTTTGACACTGAAAGTTTTGTAAAAGAAATCATGTCCATACACTTTGTTGCAAGATGTGAATTATTGACACTGAACTTAATAACTGTGTACTGTTCGGAAGGGGTTCCTCAAATTTTTTGACTTTTTTTGTATGTGTGTTTTTTCTTTTTTTTTAAGTTCTTATGAGGAGGGGAGGGTAAATAAACCACTGTGCGTCTTGGTGTAATTTGAAGATTGCCCCATCTAGACTAGCAATCTCTTCATTATTCTCTGCTATATATAAAACGGTGCTGTGAGGGAGGGGAAAAGCATTTTTCAATATATTGAACTTTTGTACTGAATTTTTTTGTAATAAGCAATCAAGGTTATAATTTTTTTTAAAATAGAAATTTTGTAAGAAGGCAATATTAACCTAATCACCATGTAAGCACTCTGGATGATGGATTCCACAAAACTTGGTTTTATGGTTACTTCTTCTCTTAGATTCTTAATTCATGAGGAGGGTGGGGGAGGGAGGTGGAGGGAGGGAAGGGTTTCTCTATTAAAATGCATTCGTTGTGTTTTTTAAGATAGTGTAACTTGCTTAAATTTCTTATGTGACATTAACAAATAAAAAAGCTCTTTTAATATTAGATAA 使用blastn的步骤 2 Select nr nt 3 Click BLAST Pasteyoursequencehere Word TextorFASTAformat 搜索参数设定 搜索参数设定 可以在此输入生物名称 搜索参数设定 可以在此设定E值 可以选择不使用过滤器 可以选择不同打分矩阵 搜索参数设定 初学者一般不更改设定而选用默认设置 直接点击BLAST Waitforawhile Blastnresult 1 4 44 Blastnresult 2 4 45 比对分值颜色代码 Blastnresult 3 4 E值越小 相似性越大 E值 找出比本序列与查询序列更相似的概率 Clickhere 45 Blastnresult 4 4 低复杂度区域用小写字母表示 查询序列 核酸 数据库序列 核酸 Practice2 1 试对以下DNA序列做blastn分析 gtacgtccggcctggtggtgggttcgagcccaacttcatgctcttcgagaagtgcgaggtgaacggtgcgggggcgcaccctctcttcgccttcctgcgggaggccctgccagctcccagcgacgacgccaccgcgcttatgaccgaccccaagctcatcacctggtctccggtgtgtcgcaacgatgttgcctggaactttgagaagttcagttaaaaggaggcgcctgctggcctccccttacagtgcttgttcggggcgctccgctg 2 blastx Clickhere blastx 把核酸序列翻译成蛋白质序列后检索蛋白质序列数据库 查询序列以所有6种读码框翻译后再进行比较 blastx Clickhere Pasteyoursequencehere Word TextorFASTAformat Example2 2 使用blastx对下面的序列进行相似性检索 gtacgtccggcctggtggtgggttcgagcccaacttcatgctcttcgagaagtgcgaggtgaacggtgcgggggcgcaccctctcttcgccttcctgcgggaggccctgccagctcccagcgacgacgccaccgcgcttatgaccgaccccaagctcatcacctggtctccggtgtgtcgcaacgatgttgcctggaactttgagaagttcagttaaaaggaggcgcctgctggcctccccttacagtgcttgttcggggcgctccgctg Blastxresult 数据库序列 蛋白质 查询序列 翻译成了蛋白质序列 读码框为 2 3 tblastx Clickhere tblastx 把核酸序列翻译成蛋白质序列后检索核酸序列数据库 查询序列和数据库序列都以所有6种读码框翻译后再进行比较 tblastx Clickhere Pasteyoursequencehere Word TextorFASTAformat Example2 3 使用tblastx对下面的序列进行相似性检索 gtacgtccggcctggtggtgggttcgagcccaacttcatgctcttcgagaagtgcgaggtgaacggtgcgggggcgcaccctctcttcgccttcctgcgggaggccctgccagctcccagcgacgacgccaccgcgcttatgaccgaccccaagctcatcacctggtctccggtgtgtcgcaacgatgttgcctggaactttgagaagttcagttaaaaggaggcgcctgctggcctccccttacagtgcttgttcggggcgctccgctg tblastxresult 数据库序列 原本是核酸序列 被翻译成了蛋白质 读码框为 3 查询序列 翻译成了蛋白质序列 读码框为 1 Practice 请把刚才讲过的内容练习一遍 Summary 小结 GenBank数据格式用 序列号 提取核苷酸数据用 序列号 提取蛋白质数据使用blastn的步骤blastxtblastx GenBank数据格式 长度 分子类型 来源 更新日期 登录号 24 作者 标题 生物 杂志 用 序列号 提取核苷酸数据 1 选择Nucleotide 2 输入 AF310622 3 Click 用 序列号 提取蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论