版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章多元搜索引擎第五章所介绍的网络检索工具,如天网、搜狐等,每个URL都只代表一个搜索引擎或Web目录,检索只在本引擎的数据库内进行,都是单一的搜索工具。由于不同的网络检索工具数据库所覆盖的领域、资源类型、规模等均不同,检索方式也各具特色,对同一个检索提问,不同的网络检索工具会产生不同的检索结果。为了获得最全面的检索结果,用户不得不将同一个检索课题在多个搜索引擎上一次次地进行检索,因此要面对不同的检索界面,一次次地重复输入提问式,还要对反馈的检索结果进行筛选、去掉重复等,非常繁琐。多元搜索引擎产生的原因网络上还有许多专门针对某种类型的网络资源查找(如:FTP资源、Telnet资源、用户组资源等)和专为某种类型问题检索(如:查找人名、地名、统计数据等)而设计的专门工具,这些检索工具并不都为用户所了解或熟悉。为了克服用户面对品牌繁多、五花八门的网络检索工具而产生的无所适从,多元搜索引擎应运而生6.1多元搜索引擎
多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。可分为两种类型:搜索引擎目录和多元搜索引擎。重点记忆搜索引擎目录搜索引擎目录也即检索工具的检索工具,它将主要的搜索引擎集中起来,并按类型或按检索问题等编排组织成目录,帮助、导引用户根据检索需求来选择适用的搜索引擎;检索的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。搜索引擎目录只不过是设立了又一层门户,通过其组织、检索界面,为用户选择适用的检索工具提供积极的帮助,以克服用户面对众多的检索工具的无所适从。如:酷站大全/
多元搜索引擎多元搜索引擎,是将多个搜索引擎集成在一起,提供一个统一的检索界面;且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。又被称为simultaneousunifiedsearchindex(SUSI),可译为“并行统一检索索引”,即在用户输入检索词后,该引擎自动地利用多种检索工具同时进行检索。它是一种集中检索的方式,其最大优点就是:省时。不用就同一提问一次次地访问所选定的搜索引擎,每次均要输入检索词等。且检索的是多个数据库,检索的综合性、全面性也有所提高。
多元搜索引擎的优点6.2多元搜索引擎的检索特性每个多元搜索引擎均有其自身的特性,如:使用哪些引擎检索、如何处理检索提问、如何编辑和显示结果。有些是顺序检索,有些是同时检索;有些将提问转化为目标引擎的语法,其他的则以“相当于”来发送检索请求。正是因为多元搜索引擎的这些特性,所以无法进行单个的特点比较。不过,通过对10余个多元搜索引擎的研究,可以找出一些共同的选项和特性。多元搜索引擎的检索特性(1)可检索引擎的数量和名称即一个多元搜索引擎可检索哪些和检索多少搜索引擎。这在有些多元搜索引擎的检索界面上可以一目了然,但有些多元搜索引擎则未加详细说明,将检索引擎的数量和名称隐藏在帮助信息或FAQ中。(2)检索提问搜索引擎目录只是将主要的搜索引擎集中罗列,并导引用户按检索资源类型或检索问题等选择相应的检索工具。它并未将各个搜索引擎的检索功能加以合并,检索时使用的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。因此其检索界面上可见一系列的检索提问框,每个列出的搜索引擎对应一个检索框,使用该搜索引擎的检索句法输入检索词或提问式,单击递交(submit)或检索(search)后分别检索每个搜索引擎。如:ALL-In-One。而并行式的多元搜索引擎的检索界面则非常简单,大多只有一个提问框。与大多数流行搜索引擎的作法类似,均支持布尔检索选择,允许检索者按某种检索句法(syntax)形成自己的提问式。在用户输入检索提问式后,该引擎自动地利用多种检索工具同时进行检索。这里要特别注意的是由于不同的搜索引擎的检索机制、算法及对提问式的解读均不同,没有一个共同规范,某些搜索引擎可能不支持用户所使用的检索句法。因此有的多元搜索引擎在发出提问式时,即将提问转换为每个引擎的检索句法,或者是以“相当于”(asis)直接传送给目标引擎。(3)其他检索选项
①等候时间使用并行检索式的多元搜索引擎进行检索时,由于同时检索多个数据库,所需检索时间较长,可事先设定等候时间为10秒、15秒或30秒等。②检索作业方式使用搜索引擎目录按照列表检索时,对多个引擎是顺序检索还是同时检索,这个差别将使得处理时间、结果返回方式等有差异。③其他检索参数该多元搜索引擎是否支持布尔算符、自然语言和词组等检索策略?可供选择的其他检索参数等。(4)检索结果选项大多数多元搜索引擎的检索结果按相关的搜索引擎排序,即将各搜索引擎的查找结果合并,并报告与结果相对的搜索引擎名称。如Cyber411将检索结果按来源引擎分组,去重后显示一个结果列表。有些则显示一个简单的主题并链接到相关网页。有些与普通搜索引擎结果界面非常相似,显示主题和简介。另有一个相关排序方法是显示结果数和它的来源引擎,如Excite得到10个检索结果,HotBot得到1个等等。有一两个多元搜索引擎,例如Inference-Find,按分类排序并显示极简短的主题。VerioMeta-search的高级检索为检索者提供从8个引擎获取10个结果的选择,结果按表返回,并为每个结果排序和打分。检索结果选项(续)较好的多元搜索引擎应显示去重合并后的、可链接的、有信息使用价值的检索结果,并按相关度排序。至少,检索结果显示应该包括题名、URL、简介和与结果相关的搜索引擎的信息。(5)创建自己的Web检索服务选择一个满意的多元搜索引擎与选择单一引擎一样复杂。但是在选到一个适合自己风格并按照自己要求加以个性化设置后,就会有效地在多个网络搜索引擎的数据库中检索。检索者可以很快地确定结果,如有必要,还可以返回到特定的一两个引擎进行扩展检索。
总之,多元搜索引擎能方便地检索多个搜索引擎,扩大了检索范围,提高了检索的综合全面程度,又能对用户选择、使用网络检索工具提供指南、导引。6.3多元搜索引擎介绍
6.3.1常用的搜索引擎目录(1)ALL-in-One
网址:http://www.allonesearch.com/①编制者
WilliamCross,自1995年6月以来,已经有5千多万人次访问,ALL-in-one是一个典型的搜索引擎目录。
ALL-in-One首页点击Generalsearch中的MetaCrawler点击Generalsearch中的DogPileALL-in-one搜索引擎目录②收录范围它将500多个因特网最佳搜索引擎、数据库、索引和目录检索工具集中在一个站点,类似于检索工具大全。这些专业搜索引擎分为40个大类。每类提供数十个引擎。③检索方法首先选择系统列出的类目表每类目下会提供多个检索工具。如选择检索“WorldWideWeb”资源,它会按字顺排列数十个搜索引擎供选择,有大型搜索引擎和目录,如AltaVista,HotBot,Lycos,Infoseek等,也有不知名的工具。ALL-in-one类目若选择检索“people”,则会列出如Switchboard,PeopleFinder等人物查询工具。每个引擎单独提供一个检索框,有的可选命中记录数(如YahooPeopleSearch),或检索方法(简单检索或高级检索)。选择一个检索工具,输入检索词后,即进入该搜索引擎的真正检索界面。点击people类目下的yahoopeoplesearchALL-in-one检索结果显示与评价④结果显示按照单个引擎的检索结果显示模式来显示。⑤评价
ALL-in-one检索页面是因特网现有多种检索工具的汇编,它们组合在一起形成一个统一的界面,体现了“所有引擎在一起”(ALL-IN-ONE)的检索特点。省却用户记忆众多搜索引擎地址的麻烦,但每次只能选择一个检索工具,同一检索词需要进行多次反复检索;统一的检索界面,丧失了许多引擎的特色检索功能。6.3.2常用多元搜索引擎(1)DOGPILE网址:http://www.dogpile.com①
DOGPILE是最老、最受欢迎的多元搜索引擎之一。DOGPILE②收录范围它支持因特网上约25个比较有名的搜索工具。这些搜索工具及其对应的网上资源有以下几类:万维网:万维网检索提供Looksmart,GoTo.COM,DOGPILEWebCatalog,DOGPILEOpenDirectory,DirectHit,A,InfoSeek,RealNames,AltaVista,Lycos,和Yahoo!共11个引擎与目录;Usenet:支持Deja.corn和Altavista等引擎;
FTP;检索FTP的工具是FastFTPSearch;DOGPILE收录范围新闻:查询Newscrawler的工具是Thunderstone;这是个智能新闻检索软件,能在世界各地的网上新闻媒体上检索并实时更新其内容。检索时只需输入检索词并按Fetch按钮。DOGPILENewscrawler将从世界有名的在线新闻媒体中查找并返回最新的匹配信息。其他:Quoteserver是检索StockQuotes的工具,而Infospace可以查询YellowPages,WhitePages和Maps。此外查询Weather用WeatherUnderground.DOGPILE检索特点③检索特点界面和方法:DOGPILE的Metasearch界面提供简单的检索,支持网络流行的多种检索工具,只需输入检索词,然后提交(go
fetch)即可。DOGPILE具有智能化的搜索程序和易用界面。支持逻辑运算符AND(与),OR(或)和NOT(非),括号(),缺省值是AND,支待+包含),一(排除)和””(短语)。DOGPILE结果报告④结果报告每个结果依次说明搜索引擎名称,检到结果数目,所用的语法格式、显示记录数目。查询结果不再进行排序,所以结果可能存在重复。以检索“e-commerce”为例说明DOGPILE的各项检索功能。首页选择“Websearch”,输入检索词后,按“GoFetch”。结果显示:ViewbyrelevanceDOGPILE结果报告还可以选择viewbysearchengine:第一行显示:SearchEngineOverture:Results1-5for"e-commerce"五条信息显示完毕,接下来:SearchEngineWebSearchPicks:Results1-10for"e-commerce"DOGPILE结果报告
SearchEngineLookSmart:Results1-5of5for"e-commerce"SearchEngineWebCatalog:Results1-5of117for"e-commerce"SearchEngineGoogle:Results1-10for"e-commerce"DOGPILE评价⑤评价检索结果返回速度较快,跟一般搜索引擎差不多。但由于DOGPILE不对查询结果进行集成处理,因此DOGPILE的查准率很大程度上依赖于它所提交的搜索引擎的查准率。但是,DOGPILE往往将检索者的提问式优先提交给一些较优秀的搜索引擎,如AltaVista和Yahoo!等。总的来说,DOGPILE是比较好用的多元搜索引擎之一。(2)MetaCrawler(2)MetaCrawler网址:http://www.metacrawler.com或/search.html①编制者MetaCrawler是最早的多元搜索引擎之一,最初由华盛顿大学创建,现属于Go2Net网络公司。MetaCrawler检索特点②检索特点
MetaCrawler允许检索者进行多项设置,使用前最好作个性化的设置:可以设置缺省界面检索;可以设置缺省的布尔逻辑操作(OR,AND,或词语);可以限制页面结果的来源(Everywhere、NorthAmerica,Europe,Asia,Australia,SouthAmerica,Africa,Antarctica)或美国教育、商业或政府站点;有超时设置(从最快5秒到两分钟);MetaCrawler检索特点每个来源的结果数目(10到30个);如果选择强力检索界面,则所有选项均可在检索前设置。主要有:结果显示摘要,结果排序;匹配选项有(any,all和Phrase);检索范围是TheWeb或Newsgroups;
每页显示数目10到30个;可使用的引擎数(缺省为10个),即;AltaVista,Excite,Infoseek,Lycos,WebCrawler,MetaCrawler检索特点Looksmart,Thunderstone,GoTo,DirectHit和A。不过,Web检索只包括主要搜索引擎LyCOS,InfoSeek,WebCrawler,ExCite,AltaVista和YahoO。
MetaCrawler能自动使用这些单个检索工具检索,然后将检索结果汇集起来,去重后显示给用户。MetaCrawler最近增加了许多其他类型的数据库,如计算机产品、用户组、档案和股票价格。MetaCrawler结果显示③结果显示与DogPile基本一致。MetaCrawler首先列出搜索引擎名称,然后有简短摘要,按照检索者选定的方式排序(相关性或searchengine)。MetaCrawler评价④评价
MetaCrawler的检索功能强大,无疑是多元搜索引擎中的佼佼者。(3)其他集合式搜索引擎简介①BEAUCOUPSEARCHENGINESHttp:///
罗列许多常用和分类查询引擎。提供检索框分别检索14个搜索引擎。Beaucoup首页②DEBRIEFING
检索7个主要引擎、结果去重并排序。高级检索允许检索者指定一个URL并限制在该网站检索。DEBRIEFING主页其他集合式搜索引擎简介③HIGHWAY61
检索5个引擎并将检索式转换为每个引擎的语法。可以设置等待时间、结果集成后排序。HIGHWAY61首页④INTERNETSLEUTHhttp://www.isleuth.com
顺序检索6个较大的引擎。先显示一个引擎的结果,然后检索下一个引擎。提供主题分类选择,用于检索特定主题站点或引擎较为合适。INTERNETSLEUTH首页⑤MAMMAHttp://
号称“搜索引擎之母”。mammasearches同时检索7个搜索引擎,将检索式转换成适合每个引擎的语法进行检索。所用引擎列表隐藏在强力检索(thePowerSearch)中。检索者可以选择引擎进行查询。MAMMA首页
PROFUSIONProFusion提供9个引擎,可在其中选择,或者请求它检索“最佳”的3个或“最快”的3个来完成检索。PROFUSION首页
VERIOMETASEARCHhttp://search.verio.net检索8个引擎,从每个引擎获取10个结果;独特之处在于能够比较引擎,结果显示用表格列出,并给出每个记录的分值和排位。VERIO首页③Searchenginewatchhttp://www.searchenginewatch.com
对常用搜索引擎进行评估,并有引擎列表。
北极星UR
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 碳汇计量评估师安全操作水平考核试卷含答案
- 健康评估本科试题及答案
- 2025年惠州招聘考试题库及答案
- 四级日语押题真题及答案
- 社工伦理试题题库及答案
- 2025年星巴克外卖员考试题及答案
- 2025年智能电网成套设备项目安全调研评估报告
- 2025年有关一拖的实习报告3
- 2025年机械装备配套产品市场现状调研及前景趋势预测报告
- 2025年杭州吉月兆焊切技术有限公司(企业信用报告)-图文
- 2025-2026学年人教鄂教版三年级科学上册(全册)教学设计(附目录)
- 煤炭交易相关知识培训课件
- 月子餐培训课件下载
- 《新能源水电解制氢工程设计规范》(征求意见稿)
- 全面可视化管理手册
- 事业单位物业管理制度
- 消防车乐高课件
- 供水漏控管理制度
- 阴道上皮内瘤变诊治中国专家共识(2024年版)解读
- (高清版)DB34∕T 4991-2025 岩沥青+SBS复合改性沥青混合料设计与施工技术规范
- 神经外科临床诊疗指南及操作规范
评论
0/150
提交评论