版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章数据库相似性搜索王红岩序言
序列两两比对的一个主要应用就是在数据库中基于相似性检索生物序列。这个过程包括提交查询序列和对查询序列与数据库中的每一序列进行两两比对。所以数据库相似性搜索就是一个大规模的序列两两比对。这种类型的搜索是一种最有效的用来推导新测定序列功能的方法。然而,第三章讲述的动态规划算法速度太慢因此大多数时候是不实用的。为了提高序列比较的计算速度需要特殊的搜索方法。这章将要介绍数据库搜索方法的理论和应用。数据库搜索的独特要求
对序列数据库进行搜索的算法有独特的要求。第一个标准是敏感性,它是指找到尽可能多的相似序列的能力。它是用正确识别属于同一家族的序列范围来度量的。这些正确识别的序列在数据库搜索中被认为是“真阳性“。第二个标准是选择性,也叫特异性,它是指排除不正确序列的能力。这些不正确的序列是在数据库搜索中被错误识别的无关序列,它们被称为”假阳性“。第三个标准就是速度,它是指从数据库搜索中得到结果所用的时间,这依赖于数据库的大小,有时速度可能是最重要的因素。理想上,人们总是希望在数据库搜索中得到最大的敏感性,特异性和速度。然而,同时满足这三个要求在实际中是非常困难的。通常是提高了敏感性就降低了特异性。而降低特异性又可能会使结果包含许多假阳性。同样的,提高速度经常会付出敏感性和特异性下降的代价。我们经常需要在这三个标准之间作出折衷。数据库搜索的独特要求
在数据库搜索和许多其它生物信息学领域中有两种基本类型的算法。一种是穷举法,它用一种严格的算法通过考察所有的数学组合来找一个特定问题的最佳的或者精确的解。动态规划算法是穷举法的一个例子,它在计算上是非常精确的。另一种是启发式方法,它是一种利用拇指规则(经验法则)来寻找经验上的或是近似最优结果的计算策略。本质上,这种类型的算法是一种根据一些标准缩小搜索空间的快捷方法。然而,这种快捷方法并不保证找到最佳或是最精确的结果。经常用它是因为要在不显著牺牲计算结果的正确性情况下和可以接受的时间内获得结果。启发式数据库搜索
用动态规划算法,比如Smith-Waterman算法,搜索一个大型数据库尽管是精确可靠的,但是速度太慢以至于在计算机资源有限的时候是不切实际的。十年前做的一个估计显示,用当时的常规计算机系统以一个包含100个残基的查询序列搜索一个包含300000个残基的数据库需要2-3小时。因此搜索速度成为一个重要的问题。为了提高比较速度必须使用启发式方法。启发式算法之所以表现出更快的搜索速度是因为它只考察那些用动态规划算法计算过的有可能匹配的序列。启发式数据库搜索
目前,主要有两种用于数据库搜索的算法:BLAST和FASTA。这些算法不保证能找到最理想的比对和真正同源的序列,但是比动态规划算法快50-100倍。提高速度是通过适度地牺牲搜索的敏感性和特异性实现的,而这种牺牲很容易被分子生物学工作者接受。两种算法都能通过识别相似序列片段来合理地预测序列的相似性。
启发式数据库搜索
BLAST和FASTA都是用基于单词的启发式方法来进行快速序列两两比对的算法。这是序列两两比对的第三种方法。它是通过寻找两条序列中显著的或是近似显著的相似连续字母来实现的。这些短的字符串叫做单词,它类似于点阵法中用到的窗口。一个基本的假设是两条相关序列中至少包含一个共同单词。在识别出匹配的单词后,用一个比较长的算法来从单词开始扩展相似区域。一但找到高得分的序列相似区域,就把这些高得分区域连接起来以得到一个全序列比对。基本局部比对搜索工具(BLAST)
BLAST程序是NCBI的StephenAltschul于1990年发明的,它目前已经成为最流行的序列分析程序之一。BLAST使用启式方发法比对查询序列和数据库中的所有序列。它的目标是找到相关序列间的高得分无空位片段。高于给定阈值的这种片段的存在说明序列相似不是随机的,它能帮助人们从数据库中不相关的序列中辨别相关的序列。BLAST通过下面的过程来完成序列比对。第一步是根据查询序列建立一个单词列表。一般地,每一个单词对于蛋白质序列来说包含3个残基,对于DNA序列来说包含11个残基。这个列表包含从查询序列中提取的所有可能单词。这个步骤也叫搜索种子。第二步是搜索出现这些单词的数据库中的序列。这步是识别包含匹配单词的数据库序列。基本局部比对搜索工具(BLAST)
第三步是用一个给定的得分矩阵给匹配的单词打分。如果一个单词的得分高于某个阈值就认为它是匹配的。第四步是通过用同样的得分矩阵给比对打分来从两个方向扩展单词。扩展一直继续直到比对得分由于失配降低到一个阈值之下为止(蛋白质序列的下降阈值是22而DNA序列是20)。得到的结果是叫做高得分片段对(HSP)的无空位连续片段对。在BLAST的原始版本中,最高得分的高得分片段对就作为最后的结果了。它们也叫做最大得分对。在最近的BLAST的改进的程序中可以进行有空位比对。在有空位的BLAST中,用动态规划算法从两个方向扩展选择的最高得分片段以引进空位。如果得分高于某个阈值扩展就继续;否则就终止。然而,总的得分允许临时低于阈值最后再达到阈值之上。在得到最后比对结果之前需要对末端区域进行修整。基本背局部梢比对坡搜索薪工具摊(B息LA源ST劫)变形BL酱AS欣T是缓一个缸包含单BL岩AS茧TN垦,B承LA菌ST齿P,祝BL极AS京TX崖,T尘BL够AS厅TN鞭和T侍BL股AS领TX版的程射序族睛。屯BL著AS景TN寄用一荒个核量酸序品列查拍询核趋酸数欧据库要。B务LA帅ST仆P用码一个须蛋白牛质序啄列作绕为查箩询序铺列来卫查询破蛋白请质序断列数乞据库破。B干LA秧ST洞X用兆核酸万序列芦作为债查询使序列展,它涉把查暑询序颠列按新照六雹种阅芹读框耐翻译勿成蛋帐白质斤序列涉然后藏查询烛蛋白感质序些列数乡丰据库稀。梦TB扔LA尸ST冬N用灰蛋白么质序指列作驰为查品询序晚列查医询核刘酸序标列数输据库威,查调询时剥把数肆据库吴中的廊核酸诸序列丑按照莫六种除阅读客框翻怖译成戚蛋白国质序贿列。些T液BL闯AS屿TX设用核洗酸序屋列作典为查损询序度列去森查询炸核酸萌序列狗数据疫库,芦查询输时查晶询序旨列和讽数据拣库中雕序列之都被司按照弟六种屿阅读症框翻钢译成厘蛋白姻质序得列。基本楚局部汪比对罗搜索允工具那(B冤LA宿ST瓦)变形如果贫要在探新测蝴定的鹿基因寻组序废列中景搜索罪编码孤蛋白家质的滔序列道就要狐用到防TB崭LA停ST什N,久它他会把涝数据弃库中骗的核凡酸序粒列按蛇六种冈阅读皆框翻垂译成帜蛋白捕质序谎列。般它可河以帮秒助人朋们识昨别出室还没伟有注家释的喷编码嘉蛋白煌质的榜基因魔。如辽果查选询序削列是紧DN移A序胖列,斜那策么可宣以用渠TB匠LA洗ST绢X进孝行蛋犬白质延水平膜的比终较。庭然搬而两谨个程状序都姑是非煤常精剩细的励所以充搜索辞过程非可能社很慢率。基本尝局部只比对倘搜索傲工具淘(B惊LA象ST梁)变形BL缝AS鼓T送we受b服熊务器诸()忍已经然被设乎计出莲来了介,它疼能简牢化选宅择程处序的芝任务猪。程肯序是羞基于理查询尽序列汤的类战型(障蛋白墨质序疲列,跌DN资A序彩列还哄被翻史译的叼DN恋A序苹列)羽组织甲的。齐除此舞之外亦,特援殊用饿途的量程序皆被单晨独编散组。则例如蒸,b被l2槐se芝q,法免疫悬球蛋床白B庆LA就ST衔和V股ec倾Sc弦ee妖n,赖一读个去立除序候列的修载体镇污染上的程稻序。螺被设刃计用撞来搜帽索基负因组睛数据分库的盲程序偶也被绸单独西列出锋来。基本浙局部辛比对影搜索申工具生(B床LA惊ST护)统计全显著造性BL认AS列T的役输出冒结果舅提供状一系烦列按户统计坑显著孩性分桌级的首匹配筹序列孝。显嚼著性祝分数甚帮助磁人们被从不雁相关撑的序爪列中著识别针出有该进化胃关系皂的序数列。鄙一般京说来使,只家有分庸数高基于某爬个阈因值的吊相似伐序列应才被杯显示武出来抛。这里碑的统拆计度骆量与牛单个译序列秩两两省比对恭稍微搏不同座;数分据库刘越大欣存在瓶的不短相关料序列聋比对丛就越陡多。行这就上需要霜一个芹新的惕参数愁来计主算进匆行序话列比次对的端总次冒数,则这个坐次数江是同握数据丸库的聚规模菊成正射比的闷。在欣BL削AS捏T搜刚索中霉这个扛统计肯量就挎是E蛇值(膛期望给值)条,这岂个值遵反映包了从罩数据句库中毯搜索网出的阶比对庭结果六是随郑机得榜到的血可能韵性。基本扛局部动比对阁搜索姓工具意(B仔LA伍ST膨)统计膀显著言性E值眠同用哗来评株估单递序列巧两两哲比对僻的P津值相贷关。博BL使AS毫T比凉较查着询序券列和孤数据假库中膝的所答有序直列,圾所以厌E值型是用展下面狐的公威式得肥到的市:E=忌m*醋n*槽P其中恢m是些数据巾库中拢总的赤残基夫数,非n查幅询序混列的纹残基访数,哭而P晴是指位一个蚀高得嚼分片利段对番是由月随机津得到内的可薯能性旧。基本顽局部饭比对旧搜索节工具认(B主LA兽ST君)统计没显著叫性例如蚊,用醋一个华含有森10竭0个站残基蝇的序枝列去斤查询挥一个岛共包崭含1哈012个的喇残基伍的数虏据库括,对田于数副据库既中每成一个段匹配左序列勺的无副空位笼高得容分片费段对学的P破值都显是1根×1栗0-2籍0。那按么E逝值就恋是这绣三个对值的蒸乘积顺,其犹结果衔表示杯为他10暴0×痕1012×1望0-2协0,等国于1票0-6。在剂BL日AS绑T的局输出垒结果耀中它唉被表副示成假l挡e-蜜6。驻它表壮示这颤个数磨据库糖中序玻列的庄匹配勺是随昂机发蝇生的坚可能去性是迎10-6。基本妥局部皂比对疮搜索丛工具梅(B垃LA优ST齐)统计液显著虾性E值情提供喘了一真个给艰定的锦序列解纯粹教是由吴于随如机匹母配得施到的狭可能仔性。揪E值韵越低扇,数择据库撤序列属匹配僻是随饺机发束生的尾可能或性就饼越小驾,因翁此匹掉配就持越显怠著。始对于桑E值茎的经咐验上淡的解泰释是犹这样枪的。想如果株E值勉小于刷le磨-5狐0,告那篇么数叙据库哗的匹嚷配序棒列是榆同源驱关系筐的可住能性谱就极弯高。待如呆果E摔值在枯le余-5土0至帽0.站01职之间裙,那庆么匹馆配序五列可范以被享认为翼是同叹源的伴。如柄果E斥值在秀0.缠01叨至1孩0之蜻间,吸那么教匹配润就是菊不显托著的榆,厉但是宜可以李暂时书被认友为具居有远注源关押系,胆如倘果有述其它辅的证泳据就棕可以援确认相它们袍的同周源关睬系。壳如果眉E值链大于缘瑞10作,那顾么序优列就凯被认浇为不动相关拣的或屿者具撤有极捞远的辩关系写以至拢于用悲现有龟的方制法无载法发预现。基本泪局部迈比对涌搜索睡工具隶(B剪LA赵ST腥)统计飘显著讨性因为E值很密可能拼受到授数据忘库大爸小的牢影响需,临一个脊明显缩慧的问启题是壶随着须数据榴库的园增大扔,终给定隔的匹菜配序便列的航E值墙也会浑增大后。因氏为两撇条序仗列的辞真正屋的进艰化关肢系是挺保守白的,姐所以雾随着门数据魔库的盈增长临序列豆匹配求的可猴信度奔就会块降低悔,也信就是枣说随岩着数释据库构的增围大可位能丢耍失先世前已油经确裕定的缝同源姿关系更。因省此,买需要牛一种遭替代违E值绘的计骗算方钟法。基本羽局部辽比对芽搜索膏工具屋(B巡寿LA良ST残)统计串显著羞性bi余t分蠢数是族除了昏E值贵之外梯在B嫌LA耗ST回的输贱出中狭用到便的另梨一个挎重要溜的统尤计指比示量忌。绘bi云t分属数不娃依靠源查询志序列铲的长新度和支数据帝库的庭大小陡衡量杀序列钩的相演似性待,需贷要用技严格树序列饺两两插比对撞分数帖对它认进行镜标准织化。喜bi侦t分压数(岗S’详)是放用下痒面的掉公式穿得到鸟的。S’锻=(λ×S培-落l妇nK国)/虚ln阀2其中λ是宁坎贝订尔分岁布常吃数,级S是津严格程序列较比对惕分数根,K端是与系使用凯的得等分矩额阵有绍关的静常数席。闭很明盾显,刊bi纲t分筹数与狠严格市比对婆分数齐是线熟性相踏关的爆。因梳此,恩b占it牙分数诞越高雅匹配拢的显劳著性生就越示高。疤不管建是搜涂索不饱同大崇小的麦不同将数据据库还沫是在缩慧数据葱库增甚长过宗程中欺搜索特不同暑时间众的同症一个分数据栋库,鸣B谦it症分数谎都提愈供了林一种妇固定茅的统府计指次示量幼。基本伍局部呼比对蓬搜索李工具必(B肝LA亲ST谅)低复京杂性咸区域对于敞蛋白疮质序供列和勺DN专A序轰列都包存在彻包含承高度款重复两残基仰的区挑域,移比如精重复振的短衡片段银,或锋者是村由少幻玉数残辈基组西成的背高度局重复泰片段炉。这瞧些区院域被芦认为罚是低狐复杂瓣性区这域(烘LC滩Rs磁)。足低复供杂性孕区域军在数奇据库争序列常中是亩非常建普遍趴的,繁估计威低复绝杂性扰区域功占公醒共数拼据库圆中蛋工白质周序列粱的1蛇5%柿。察查询召序列崇中的孙这些冶成分谣会引会起假向的数扔据库日匹配烘从而凑人为厕地提梦高了仇不相做关序倚列比姐对分论数。基本宋局部盼比对堂搜索伏工具躺(B披LA钩ST毁)低复虑杂性虏区域为了遣避免遵由于徐低复辟杂性独区域阶的匹拒配引脊起的仆高相词似得缓分使采真正越相似障的序塔列不笛显著离的问牧题,赠过滤糕掉查旗询序彻列和战数据璃库中通序列心的问反题区腔域以湾提高烘信噪吨比是愤非常厘重要颤的。律常用鹿的过帜程是牺掩蔽失。一迁共有诉两种环类型捆的掩跃蔽:定硬掩葱蔽和射软掩铸蔽。放硬掩炕蔽就晨是在耽BL糖AS筑T程省序中秘用一泉个意铲义不杏明确药的字竹符,胀如蜓核酸饰序列勾用的广N或酸蛋白援质序炉列用比的X果,来巨取代序问题御区域掏以避息免使菜用问婚题区便域比韵对从贯而避歼免假姑阳性经。缺熊点是被由于摊缩短烘了比送对的躲长度丽可能烛使真彼正同留源的干序列缠得分贸降低妄。软涨掩蔽炉保留墓问题登序列单但是物减小欠它们陪的作即用,任就是过在构屡建单裳词表粗的时均候忽松略它井们,慕但是镇在单乖词扩某展和贫最优迁化比删对时串使用饼它们最。基本歇局部准比对抛搜索息工具墨(B副LA吩ST泻)低复阵杂性述区域SE佣G是饲一个槐能在闲执行态数据舅库搜愈索前扮识别怨并掩筐蔽重厦复序酒列的抢程序昆。它赴通过旷比较阁某一绵区域呢残基阻的出箱现频辛率和姓在数价据库都中残俯基出己现的氧平均版频率鹅来识倦别低键复杂暖性区艘域。低如果喉查询民序列集的某缘瑞一区草域的户残基杜出现盈频率桥明显乓高于垃数据酿库中鬼的平聋均频态率,旧则这缎个区臂域就劝被标耻记为辨低复膝杂性常区域跃。S斜EG睛已经冶被集裙成到辆基于讽we塞b的散BL财AS甩T程病序中夸。需晨要一嘉个低碧复杂听性过馅滤器斜选项遍面板与来标吼记低盛复杂饺性区缠域。Re叨pe井at寨Ma域sk发er石(/)是一捏个用弃Sm肢it仁h-倍Wa虽te链rm庄an砌算法游通过盼比较恋查询希序列欲和包炕含重寻复序终列的狼固定绩的库望来识熄别重请复序云列的福独立灰的掩层蔽程灶序。帆如果币某一伸序列斤区域捕的比吊对得迅分高级于阈雀值,丛这个畏区域泉就被惧认为啦是一泥个低鉴复杂液性区抚域。驶对应净的碱现基被励掩蔽缓为N若或X谷。基本好局部隶比对苍搜索淘工具翠(B饮LA马ST培)BL赴AS勇T的效输出暖格式BL近AS蹈T的并输出毁包括走一个份图示蹦,一涨个匹饲配列持表和谣一个乌序列供比对待的文敏本说径明。程图示缘瑞包括磨带颜公色的辈横线润,通之过它孙们可朽以快描速识需别出猎数据狗库序揭列匹狐配的术数目造和匹乐配的庆相似载性得柏分。蹈横线盆的颜理色与兴匹配锁序列项的相膏似性嘉一致库(红疑色:蛮最相通关,姻绿色锈和蓝姿色:逆适度疫相关拜,黑铅色:餐不相蹈关)颈。横洞线的步长度位代表余了匹臭配序氏列相斯对于城查询状序列拨的跨帆度。裳每一脾条横垄线都尾被链墓接到鞠与这抢条序叮列相判关的絮文字惜说明令部分计。图游示的箱下面雾是一突组按斥E值贿递增栽的顺致序排省列的苍相匹嘴配序政列。锹每宫一个筋序列愁都包成含登愤录号润,数鬼据库逆记录逢的题避目(壮通常芦是一悦部分很),备bi触t分匙数和撇E值植。基本庆局部拾比对揭搜索伴工具佣(B趟LA菌ST掘)BL勺AS图T的腰输出款格式匹配渣序列夕列表走下面震就是方文本真说明温。它敢包括逼三个皂部分谎:头念部,脆统计岗资料框和比蛙对。颗头部吗包括将基因私索引拘号或任者是赖数据区库序轻列的裤参考裕文献晃号和止一行王的数贡据库马序列硬描述纷。在壮它下味面是绢搜索稍输出芳的统奏计资闸料,宅它包那括b术it洁分数础,E者值,蜓一骗致性代比例用,相眉似性竹比例矿和空士位。娱在具团体比汤对部钩分,扶查询旋序列束在一斜对序趁列的勿上部盗而搜顿索出抽来的业数据芦库序扩列在辽下部酸并且号被标摇号为匠Ob膛je量ct顺。在歇两条差序列仅之间情,相翠一致锻的残请基被概写在挥相应纲的位皇置,扶而不选一致拉但是叉相似梅的残行基用耍“+降”标夫记。赏查询壤序列土中任鸽何被息标记膛为低壁复杂胶性区龙域的骨残基碑都被蛇标记叔为X或N所以侍比对它不包帽含这帅些区尖域。FA歼ST零AFA油ST颈A(也FA迷ST滨A危LL座,)究实际悼上是艺第一泽个数舒据库榆相似畅性搜违索工舍具,粘它笋出现扔在B猫LA丈ST蚊之前盆。F浪AS恩TA乳用哈坐希策究略来蜻查找哑长度肝为k柜的一谱小段小连续寸的残假基之啄间的口匹配析。这副种残大基组短成的荡字符误串叫轧做k戏元组数,它妄和B辞LA象ST防中的艘单词驰是同晕义的类,但铸是通我常比呢单词蜻短。姿k塞元组妻的典乖型长况度是谎蛋白旧质序蜂列为勤两个旺残基骨而D弱NA廊序列冶为六和个残脖基。FA猫ST鹅A算抛法的伶第一赔步是莲用哈排希策共略识那别两挠条序索列中骆的k膀元组冈。安这种尊策略涉是构术造显杠示两透条序遍列中逮每一仔个k教元组哭位置些的查哪找表遗。就两条活序列君中的逼每一样个共拿同k泡元组土的位单置差冈是通宰过用载第一勤条序丹列中依的位执置减尽去第治二条厦序列两中的戴位置勉来得刻到的甜,这线个差引被表恰示为嘴位移偶。洗具有烫相同药位移匆值的锣k元词组被害连接光起来跌表示赠一段妙连续航的一宇致性练序列倾区域泪,它宵对应谜于二敞维矩命阵中潮的一选条连论续的绞对角员线。FA危ST闷A第二剩步是护缩小过两条假序列等之间会的高川相似晚区域疼。通嘉常,插在哈罪希阶防段能律识别视出两禁条序什列之王间的划许多汁对角搜线。店具有扔最密亮集对椅角线抚的前克十个开区域涛被识城别出标来作农为高赌相似撞区域土。对螺这些歌区域弓中的典对角纠线用裤一个狱得分豆矩阵挎进行恩打分搏。沿而同一欣条对吐角线乞的邻芽近的南高相驶似区片域被覆连接衫起来迁形成秤单一熔序列唉比对歉。这蹈个阶尺段允妇许应柏用空莫位罚业分从吹而在侵不同练的对熊角线五之间容引进无空位伸。引你进空任位之颂后的境得分膜需要旧重新魂计算跪出来旁。在坝第三士步中婶,用琴Sm影it格h-湖Wa鸡te业rm寄an次算法摇对引标进空见位的澡比对扎进一惹步提键炼以歇得到银最终末的比戏对。雅最后泳一步朝是向猫BL体AS前T算副法一亿样用逆E值叹对最尼终比怜对结擦果进相行统傍计评驴价。FA炮ST输A和B倍LA海ST挠相似描,F弊AS傍TA暂也有甜许多窗子程臭序。身欧洲奸生物诵信息拿学协逢会提雹供基震于w匹eb圾的F哗AS煤TA达程序拖允许预使用我蛋白速质或控核酸停序列歌作为门查询宪序列扑来搜渠索蛋勉白质隶序列食或核标酸序坑列数钳据库文。可振靠的丧程序捎的变夹形有患FA搭ST健X,业它先搅把D充NA摔序列捆翻译骡成蛋城白质删序列骨然后杯用这绵个蛋姓白质杯序列百查询术蛋白最质序阔列数叮据库阴,还胡有T仁FA弄ST芝X,定他以痒蛋白居质序左列作嘉为查绘询序泰列,羊用它摩去搜钥索翻膛译成乘蛋白趟质序旋列的务DN潮A序考列数妨据库励。FA产ST习A统计翻显著险性FA额ST甲A也伙使用沃E值疏和b拦it敢分数受。在凉FA孝ST网A中存估计贵这两纲个参略数本某质上刺和B赛LA亩ST才相同拌。不列过,咬FA厌ST秘A提迷供了学一个赤更具饥有统最计意粥义的您参量洁就是以Z分院数。档它课描述胳在数同据库严搜索茂中与津平均镜分数松的标吧准误扑差。亦因为识大多叨数的认与查丈询序傲列的辣比对吸都是驻不相渣关序虑列比切对,展所拆以得碧到的宪匹配判序列谦的Z佳分数驶越高哭,比衬对得谜分离芒得分敬分布患的平量均值风就越弱远,逼匹伤配就吃越显罪著。既如果叔Z分寺数大西于1介5就雅认为屯匹配棍是极乳其显爹著的袋,它霜们当准然就蝴是同脾源关拣系。厨如果乱Z分厌数在膛5到傍15砌的范婶围内恨,序镇列对冻被认启为有夫很高签的同昨源可羞能性陪。如茧果Z肉分数扩小于薄5,雅它们治的关步系就斗非常事不确粉定。FA喷ST否A与库BL眼AS屋T的那比较BL栋AS着T和弟FA纳ST耗A在逮常规娱数据邻库搜矿索中戒显示祸了同悦样好像的性殖能。术然饶而这骡两种铲方法协之间坐也存脉在一松些值仆得注劈燕意的杠不同浪点。但最主聪要的番不同梁是在粒搜索炮种子悔阶段拴。B用LA南ST拍是用剂替换笋矩阵钥查找中匹配涂的单真词,攻而F米AS顽TA五是用生哈希劣过程瓣识别板显著卖匹配耽单词贤。在窑默认扣情况聋下,武FA目ST嫌A扫侮描更鸽小的挤窗口殊。所殃以,苍它给干出比按BL梳AS笋T更寻敏感既的结处果。竞在李BL塌AS窑T中腔使用逼低复请杂性脑掩蔽旨技术锄,使装它得性到的闹结果蔬比F劲AS职TA餐具有窑更高山的特担异性距,因辫为它纳降低扶了潜繁在的惜假阳影性。顽BL耽AS狐T有迷时给喂出一惠条序围列的竭多个扣最高漠得分制比对暖,而类FA宗ST亩A只披能给榴出一倚个最妄终比扒对结状果。用S赵mi取th松-W垂at陷er盯ma适n算折法进据行数康据库傲搜索前面忙已经处提到着,严苍格的理动态财规划染算法汗通常斤不能连用来精进行相数据愉库搜乞索,稿因为孕它计朱算速狡度慢岩而且秀花费专代价指大。访启发驶法如签BL妹AS每T和啊FA集ST烟A达提高再了计霉算速帽度。朗然拆而,晚启发娇式方纵法在杜敏感积性方更面存窝在局塞限而蠢且不范保证蹄能找严到最涛佳比谎对。豪它们杂经常应不能橡找到巧数据清库中塞的远纲距离枣相关告序列爆。估膀计指知出对变于一头些蛋锅白质追序列午家族奇,B离LA油ST监会丢羽失3压0%部的真硬正同蚊源序沈列。终目前娇计算茫技术匹的发飘展,未如巨笛型计僻算机缓的并土行处望理,愿使得宜动态放规划抄算法心成为两能满掩足性碎能要荐求的喝数据农库搜阔索算熔法。用S纳mi胸th诸-W宗at毕er蛾ma拒n算碰法进默行数铸据库面搜索为了私实现雀这个孩目的忍,N殖ee搭dl铅em窃an各-W巴un电sc糊h晃和吩Sm泊it么h挡-W追at俯er睁ma丈n算晌法的裂机器非代码系必须史进行接修改珍以使断它们糖能在扰并行借处理课环境单中运转行从签而使版搜索跳过程跌能在秤合理识的时骑限内携完成筝。目霜前,意它的阳搜索冻速度支仍然扭比流贪行的惕启发拜式算蚂法慢味。所浮以,摧这种红方法互还不啄能用申在日各常工蛛作中访。不粥过,耐可以局利用如动态溪规划音算法疲在序珠列的雀水平亿上找泻到具吴有最混大敏餐感性凯的同彼源序筹列。泼经验沸上的疤测试虑显示要穷尽机式算字法确月实能菜比启嘴发式创算法谦得到斥更加洞优秀扩的结黎果。宰下面懂是一闻些基毙于动嚷态规凭划算须法的档用于堡数据勿库搜哗索的可we召b程缠序。用S涌mi奴th哄-W泼at锈er欢ma与n算采法进弦行数余据库绸搜索Sc疤an彻PS水(S似ca侍n乎Pr勺ot贯ei艘n欠)是一甚个基骄于w缠eb痛的适茫用于烛并行坏处理蛇的嘴Sm微it鉴h-鸦Wa培te章rm椅an县算法父的改障进版用本的鼠实现赔程序翼。稼它的编主要宇特点虫是可叨以像思PS浮
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某服装厂面料采购规范
- 病理科冰冻切片技师考试试卷及答案
- 护理伦理在多学科中的教育与培训
- 小肠梗阻的诊断与治疗中国专家共识(2023版)权威解读
- T∕CATAGS 56-2022 民用航空燃料储罐状态及控制规范
- 四川省眉山市仁寿县2026届招生全国统一考试仿真卷(五)-高考化学试题仿真试题含解析
- 2026春小学信息技术五年级下册期末练习卷(清华版新疆)含答案
- 河南省新乡市辉县市第一中学2026届高三第三次适应性考试化学试题含解析
- 吕梁市重点中学2026届高三下学期期末教学质量诊断(一模)化学试题含解析
- 慢性病临床分型标准化的循证医学实践路径
- 新闻编辑实践作业汇报
- 硬币清点管理办法
- 工业机器人专业介绍课件
- 独舞大赛活动方案
- 统编版八年级下册历史期末复习:材料题答题技巧+常考50题专项练习题(含答案解析)
- 电力拖动自动控制系统-运动控制系统(第5版)习题答案
- 第九讲:信息与大数据伦理问题-工程伦理
- 码头防汛培训
- GB/T 2878.1-2025液压传动连接普通螺纹斜油口和螺柱端第1部分:斜油口
- 2025陕西交通职业技术学院辅导员考试题库
- 2025年10月自考自考14056培训与人力资源开发押题及答案
评论
0/150
提交评论