




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学概论讲义,第4章后缀树的应用,精确字符串匹配问题最长重复子串问题最长公共子串问题DNA污染问题多字符串的公共子串问题遇难者身份识别问题最长公共前缀问题回文问题.,生物信息学概论讲义,后缀树的应用,精确字符匹配(ESM)生物应用识别DNA序列中的起始密码子ATG(RNA的转录翻译起始点)问题定义给定长度为n的字符串S,对任意长度为m的查询Q,要求发现S中所有Q的发生位置,生物信息学概论讲义,后缀树的应用,精确字符匹配(ESM)解决方案预处理:构建字符串S的后缀树O(n)查询:自根向下,根据路径标识向下匹配查询Q至节点x。如果不存在这样的节点x,则Q不在S中。O(m)节点x的子树中,每个叶子对应Q在字符串S中的一个发生。对节点x的子树,需要一次遍历。O(k),ESM的后缀树解决方案要好于其它的解决方案m+k2的子串aca,生物信息学概论讲义,后缀树的应用,多字符串的公共子串生物应用识别两个或多个基因组的保守区域,探索生物结构的本质特征问题定义给定K个字符串,对所有的k(2kK),计算至少被k个字符共有的最长公共子串的长度l(k),多字符串的公共子串问题是最长公共子串问题的变种,生物信息学概论讲义,后缀树的应用,多字符串的公共子串解决方案在每个字符串的末尾添加不同的终结符O(k)构建n个字符串的广义后缀树O(n)遍历建立的广义后缀树,计算每一个内部节点的C(v)值O(Kn)C(v)代表以节点v为根的子树中不同终结符的数目遍历广义后缀树,对每个内部节点v,如果l(C(v)v的字符串深度,令l(C(v)=v的字符串深度O(n),生物信息学概论讲义,后缀树的应用,多字符串的公共子串例给定字符串集合S=sandollar,handlot,handler,grand,pantry,计算l(4)和l(5)l(4)=3sandollar,handlot,handler,grand(2)l(5)=2sandollar,handlot,handler,grand,pantry,生物信息学概论讲义,后缀树的应用,遇难者身份识别问题生物应用识别遇难者(例如,在战争中死亡的士兵)身份问题定义给定一个长度为m的字符串Q和一个字符串数据库,查找该字符串数据库中所有包含Q的字符串,生物信息学概论讲义,后缀树的应用,遇难者身份识别问题解决方案(1)构建包含数据库中所有字符串的广义后缀树O(n)(2)遍历建立的广义后缀树,发现字符串Q的所有发生位置O(m+occ),生物信息学概论讲义,后缀树的应用,最长公共前缀问题定义给定长度为n的字符串S,对任意的位置i和j,发现S中Suffi和Suffj的最长公共前缀的长度解决方案构建字符串S的后缀树O(n)输出Suffi和Suffj字符串深度最大的公共祖先O(1),生物信息学概论讲义,后缀树的应用,回文问题生物应用特殊位点识别(如:限制性酶剪切位点)问题定义给定长度为n的字符串S,发现S中所有最大的回文给定长度为n的字符串S,发现S中所有最大的互补回文,生物信息学概论讲义,后缀树的应用,回文问题回文给定字符串S中的一个子串u,称其为一个回文,当且仅当u=ur。其中,ur代表u的反转字符串,例如u=acagaca是一个回文,因为acagaca=(acagaca)r,生物信息学概论讲义,后缀树的应用,回文问题回文如果Si.i+k-1=Srn-i+1.n-i+k,那么u=Si-k+1.i+k-1是一个奇数长度的回文,生物信息学概论讲义,后缀树的应用,回文问题回文如果Si.i+k-1=Srn-i+2.n-i+k+1,那么u=Si-k.i+k-1是一个偶数长度的回文,生物信息学概论讲义,后缀树的应用,回文问题互补回文给定字符串S中的一个子串u,称其为一个互补回文,当且仅当u=r。其中,代表u的互补字符串例如acaugu是一个互补回文最大回文字符串S中的一个回文u=Si.i+|u|-1被称为一个最大回文,当且仅当ii+|u|-1,Si.j都不是回文,生物信息学概论讲义,后缀树的应用,回文问题解决方案预处理:构建S和Sr的广义后缀树O(n)执行如下循环:Fori=1ton发现的最长公共前缀。如果最长公共前
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林重点项目-四平鹿产业园建设项目可行性研究报告
- 人教版八年级上册英语作文与口语结合方法
- 暑期英语口语夏令营计划
- 生物质天然气项目可行性研究报告
- 小学三年级科学复习与趣味实验计划
- 高校传染病防治工作组职责
- 合肥可医装饰设计有限公司介绍企业发展分析报告
- 手术室信息化管理职责
- 小学三年级下学期科技教育活动计划
- 二年级下册科学课堂反馈计划
- DB13T 2770-2018 焊接熔深检测方法
- T∕ZZB 2774-2022 商用车用气路电磁阀
- JJF 1343-2022 标准物质的定值及均匀性、稳定性评估
- 民法典侵权责任编课件
- 员工手册(格林豪泰)VDOC
- 高中数学苏教版(2019)选择性必修第一册考前必背知识点 素材
- 边坡复绿专项施工方案
- 幼儿园课件——《生气虫飞上天》PPT课件
- 幼儿园幼儿个人健康档案
- 部编版《道德与法治》三年级下册第11课《四通八达的交通》精美课件(含视频)
- 脑梗死标准病历、病程记录、出院记录模板
评论
0/150
提交评论