已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1/7互联网基础性技术元搜索引擎概述互联网基础性技术元搜索引擎概述元搜索引擎是互联网基础性技术,其对于互联网的发展起到了巨大的推动作用。针对元搜索引擎的研究,能够有效地提升对互联网的使用效率论文联盟。本文主要就元搜索引擎的基本特点、工作原理以及系统结构等几个方面对其展开研究,同时也就其存在的问题进行初步的探讨,希望能够对从事相关工作的人员有所启发。一、元搜索引擎概述元搜索引擎元搜索引擎是由检索请求提交机制、检索接口代理机制、以及检索结果显示机制所组成的信息收集与处理程序。请求提交的主要功能是将用户的个性化信息检索要求,提交给检索接口代理机制,其中包括的内容有所采用的搜索引擎的种类,检索时间、以及数量等。“接口代理”在接到请求后,将所提交的信息转换成计算机可以识别的语言,并且从本地数据库内调去用户所需要的信息,并且将信息提交给“结果显示”,结果显示会将信息进行重新整理,并且以用户能够识别的方式进行输出。这是元搜索引擎的基本工作机制。元搜索引擎的原理2/7元搜索引擎是一种双层客户机,或者说是一种以服务器为基础的系统。其主要的功能就是根据客户检索请求,向单个或是多个搜索引擎提出检索要求,然后由具体的搜索引擎执行。搜索引擎执行元搜索引擎检索请求后将检索结果反馈给元搜索引擎,元搜索引擎则从多个搜索结果中整理出最佳的结果反馈给用户。不同的元搜索引擎可能在机制上存在着一定的差异,但是其基本原理是相同的。元搜索引擎的分类元搜索引擎可以分为目标搜索式引擎、提问搜索式引擎等。这种分类主要是根据搜索引擎的编译方式和显示结果来区分的。不同的搜索引擎存在着很大的区别。目标式搜索引擎可以连续对目标进行搜索。另外一些则是根据不同的提问,同时进行搜索。提问式搜索引擎具有将检索提问变成目标搜索引擎的提问语言,而有一些则原封不懂的发送给目标引擎。元搜索引擎还可以根据功能进行划分,其中多线搜索式当今搜索引擎的主流,ALLINONE式搜索引擎也是一种十分流行的搜索引擎模式。二、元搜索引擎的系统模块研究GUI图形化用户接口GUI图形化接口的主要功能是实现用户与程序之间的信息交互,其能够将用户所发出的原始信息转换成计算机可以识别的语言,并且将搜索结果以图形的方式反馈给用3/7户。GUI图形化用户接口,能够以使用命令的方式,实现人机交互,并且将用户的查询请求提交给系统。同时,GUI界面能够为用户设定搜索引擎成员列表,根据不同的搜索引擎特性,为用户选择最为适合的引擎。并且自动设定等待时间、反馈结果数量以及反馈方式等。这部分信息可以保存在客户端的用户COOKIE中,以便用户下次调取,从而提高使用效率。COOKIE的主要功能就是保存搜索记录,并且对于搜索结果进行深入的整理和挖掘,便于用户的调取和使用。查询预处理器查询预处理器的主要功能是将原始查询请求进行分类处理,并且通过交叉语言检索功能以及自然语言检索功能进行编辑,然后将所需要查询的信息进行重新分类整理。成员搜索引擎调度器用户可以根据搜索习惯以及搜索历史,设定具有个性化的搜索引擎,也就是说元搜索引擎能够为用户提供个性化的搜索服务。如果用户并不满意自己的设定的成员搜索引擎,则可以根据成员搜索引擎的调度机制,将主题、领域以及区域等信息,添加到原有的成员搜索引擎之中,从而改变原有引擎的搜索习惯。例如,用户可以添加相应时间、反馈数量等等,从而生产出符合自己需求的搜索引4/7擎列表。由于成员搜索引擎的信息经常发生变化,如果将它们的代码固定在元搜索引擎得主程序中显然是不合理的,因此我们采用了成员搜索引擎描述文件,以XML进行描述,采用形式化描述,对于每个新加入的成员搜索引擎,只要按照这个形式为其建立一个描述文件,就很容易将其加入到系统中。查询分发器查询分发器的主要功能是接受成员引擎的调度列表,通过调用数据库信息,读取成员引擎的信息。并且根据这些信息,启动相应的成员引擎,同时向它们发送查询信息。查询信息的主要内容有主机信息;连接信息;查询参数的格式信息等。查询功能主要依靠的是数据库连接,其中部分信息是通过查询代理来进行的。一方面可以减少数据库的连接次数,另一方面可以在最大程度上集中使用查询信息,从而提高查询速度。查询代理查询代理的主要功能是提供元搜索引擎所需的交互接口。其具体的机制是首先从分发器中提取查询格式,然后向分发器回馈查询参数信息,而后根据查询结果将查询信息进行本地化处理,如果成员搜索引擎无法支持元搜索引擎的高级检索功能,那么其必须将查询信息转化成其所能够接受的格式。比如不支持短语检索,通配符功能等。5/7在处理的时候,删除原来的查询串中的这部分请求信息。而后,元引擎将本地化的查询结果反馈到成员引擎论文联盟。由于部分服务器可能存在着不可用的情况,因此可以先行执行类似于PING的命令程序,这一程序的主要功能是检测服务器是否可用,如果发现不可用,那么查询器会自动停止发送查询请求,从而转向其他服务器,这样可以有效地缩短查询时间。综合处理模块综合处理模块是元引擎的核心模块,元引擎的搜索效率主要是由综合处理模块所决定的。综合处理模块由若干个功能不同的模块所组成,因而具有综合处理能力。其主要包括以下几部分结果收集模块。该模块的主要功能是同步接收成员引擎的反馈结果,并且将其反馈给用户。网页过滤模块。该模块可以过滤重复信息,根据用户的所设定的要求,以及时间、领域等,将不符合条件的信息过滤,从而确保信息更为准确。网页排序模块。该模块的主要功能是,根据用户设定的要求,将反馈信息进行系统化的排序,从而方便用户检索对比。综合模块的主要功能就是对搜索结果进行综合性的处理,并且通过GUI将信息反馈给用户。同时,综合模块6/7还具有搜索评价功能,并且将搜索记录自动记录进用户的COOKIE之中,通过记录用户的检索习惯,从而提高检索的效率。数据库数据库是元搜索引擎的重要组成部分之一,其主要包括实际意义上的数据库,以及一些系统配置文件与设置信息等。这些信息有关于自然语言的问答,成员搜索引擎的信息、用户信息等。在具体实现的过程中,可以将这些信息存储在客户端之中,从而减少服务器的存储压力。三、总结互联网拥有庞大的信息资源,并且在不断地膨胀之中。搜索引擎的开发与利用直接关系到用户对于有效信息资源的获取。不仅如此,搜索引擎对于企业内部的数据库管理也具有现实意义,因此针对搜索引擎的研究是十分必要的。经过研究,笔者发现,目前搜索引擎主要存在的问题是如果扩展其独立搜索的能力,从而提高检索的查全率。然而实现这一目的的主要困难在于成员搜索引擎的自治性集成存在一定的技术难点,尤其体现在检索界面的差异,文档索引方式的差异等方面。在今后的研究中,我们将对这些问题进行深入的探索,尝试设计出具有自身特色的搜索语法,并且改善搜索引擎的检索评价机制以及成员引擎的自动调度功能,从而让整个搜索系统更加智能化,进而7/7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省遂宁市射洪中学2025-2026学年高一上学期12月考试政治试卷
- 成本承担主体的明确与管理
- 成本协同机制下的资源整合
- 成本管控视角下患者就医费用优化与体验提升
- 淋巴瘤概述与护理核心要点
- 甲亢患者日常护理与康复指导
- 过敏预警机制:幼儿园餐点护理的饮食安全防线
- 成本数据真实性审计与合规性管理-1
- 幼儿园餐点护理:特殊饮食需求应对策略
- 中药离子导入案例分析课件
- 编制竣工资料协议书
- 变压器绝缘测试评分表
- 2025年宁夏银川经开发展集团有限责任公司招聘笔试参考题库含答案解析
- 空桶回收协议
- 近八年宁夏中考数学试卷真题及答案2024
- 建筑物区分所有权一郑晓俐课件
- 园区安全管理培训
- 2025年江西江铜华东铜箔有限公司招聘笔试参考题库含答案解析
- 2024年人教版四年级数学上册 第5单元《平行四边形和梯形》能力提升卷(含解析)
- 安踏集团零售管理培训手册
- 薄膜物理与技术-5薄膜的形成与生长
评论
0/150
提交评论