




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i 摘 要 摘 要 搜索引擎是信息社会与网络环境下大众用户广泛使用的一种工具, 它以其方 便、快捷、易用等特性为人们普遍接受。但是信息的爆炸式增长,使得搜索引擎 检准率与检全率不高、缺乏人性化服务等缺点在用户使用时也一一暴露出来,让 广大用户在息查询时遇到了一定的困难。随着社会的发展和科技的进步,人工智 能等技术与搜索引擎的结合催生了智能搜索引擎。 智能搜索引擎以其独有的智能 化、人性化和学习性等特征,不断完善与强化搜索引擎的功能,受到广大网络用 户的欢迎。 智能搜索引擎除了在传统信息检索领域内应用外, 也逐渐被应用于社会信息 服务各方面之中。图书馆作为传统信息中心的地位随着网络的出现而逐渐动摇, 而智能搜索引擎又对图书馆的信息服务产生了冲击。在信息社会与网络环境下, 图书馆能否与智能搜索引擎合作,充分利用智能搜索引擎的特点和优势,在信息 服务领域有新的发展,正是本文的写作的出发点。本文在详细分析多 agent 技术 和智能搜索引擎的特点后,构建一个多 agent 智能搜索引擎,并重点分析、研究 其在图书馆服务工作中应用的可行性以及如何应用, 从而为国内图书馆工作的深 化发展提供理论指导。 文章首先对搜索引擎、智能搜索引擎和 agent 的概念、特点进行了介绍;之 后阐述了多 agent 智能搜索引擎的系统结构、工作流程和各 agent 的功能结构; 然后分析了多 agent 智能搜索引擎在图书馆应用的优势、影响和意义;最后详细 论述多 agent 智能搜索引擎在图书馆服务工作几方面中的应用,包括信息检索、 图书馆个性化信息服务、 查新咨询服务以及多 agent 智能搜索引擎与图书馆跨界 合作的具体实施等。 文章的创新之处主要有: 对比分析了搜索引擎与智能搜索引擎在各方面的优 劣;全面系统地总结了 agent 的技术特点;构建以 agent 技术为基础,综合元搜 索技术、信息检索技术、数据挖掘技术、多 agent 协作策略的多 agent 智能搜索 引擎;分析、研究智能搜索引擎在图书馆信息服务工作各方面的应用可行性与具 体操作,尤其是智能搜索引擎与图书馆跨界合作各个层面的详细实施。 关键词 关键词:智能搜索引擎;agent;图书馆;图书馆服务;跨界合作 ii abstract with features of convenient, fast, easy-to-use, search engine runs as a widely used net tool which is generally accepted by public users in information society and network environment. but as the explosive growth of information, disadvantages of search engine, such as the low ratio of precision and recall in retrieval, lack of humanistic service, were exposed in using and made lots of users experiencing kinds of difficulties. and according to the development of society as well as science and technology, artificial intelligence technics combined with search engine make birth of intelligent search engine. intelligent search engine are welcomed by the majority of net users for its particular characteristics of intelligence, humanization and learning, with functions of constantly improving and strengthening in retrieval. in addition to the application in traditional information retrieval, intelligent search engine has been applied to almost every aspect of information social services. librarys status as information center has been shaked by the appearing of internet, and now library information services have been influenced by intelligent search engine once more. in the information society and the network environment, this article aims to explore whether library can cooperate with intelligent search engine, so as to make full use of their superiorities and advantages and also get new development in information services. after a detailed analysis on the characteristics of multi-agent technology and intelligent search engine, this paper builds a multi-agent intelligent search engine, and makes mainly research on its application in library service work, in order to provide theoretical instructions for domestic library works to make further development. this paper, firstly, introduces the concepts and features of search engine, intelligent search engine and agent; secondly, describes the structure and work processes of multi-agent intelligent search engine, discusses the functional structure of each agent in multi-agent intelligent search engine; then analyzes the advantages, impacts and significances of multi-agent intelligent search engine in library application; finally discusses several applications of multi-agent intelligent search engine in library works, including information retrieval, library humanized information services, novelty search service, reference and consulting service, and concrete implementation of crossover cooperation between multi-agent intelligent search engine and library. iii main innovation of the article: compared and analysised the advantages and disadvantages of search engine and multi-agent intelligent search engine; summed up the characteristics of agent technology fully and systematically; built a multi-agent intelligent search engine, which is based on meta retrieval, information retrieval, data mining technics and multi-agent collaborative strategies; analysised and researched the applications on multi-agent intelligent search engine in library service works, especially the concrete implementation of crossover cooperation between multi-agent intelligent search engine and library. key words: intelligent search engine; agent; library; library service; crossover cooperation 湘潭大学湘潭大学 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权湘潭大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。 涉密论文按学校规定处理。 作者签名: 日期: 年 月 日 导师签名: 日期: 年 月 日 1 第一章 绪论 1.1 研究背景 自从 1991 年 internet 诞生以来,它已经发展成为拥有约上亿用户、几千万 个站点、数十亿个网页的巨大分布式信息空间,而且这些数字仍以每 4 至 6 个月 翻一番的速度迅猛增加。 随着网络信息的爆炸式增长, 人们越来越关心怎样高效、 准确的检索出自己想要的信息资源。 网络上虽然有庞大的信息资源, 但是 internet 所固有的开放性、动态性、异构性、资源分布的分散性等特点,使得人们很难快 捷准确的检索出自己想要的信息, 于是出现了专门帮助人们检索网上信息资源的 检索工具搜索引擎(search engine)。搜索引擎的使用越来越受到网络用户的 欢迎,它已经成为网络环境和信息时代的一个重要且普及的工具,帮助用户查找 所需要的信息,并提供学习和休闲娱乐等信息服务。但目前的搜索引擎存在的一 些问题,诸如检索速度慢,无效链接多,重复或不相关信息多,搜索结果不具有 个性化不能因人而异等问题不能很好地满足用户的检索需求。智能搜索引擎,尤 其是智能 agent 技术的出现弥补了传统搜索引擎在用户使用时的一些不足, 强化 了智能搜索引擎的优势, 并且依靠其自身的智能化给用户带来许多新的更加人性 化的功能。 搜索引擎尤其是智能搜索引擎在信息检索方面的强大优势使得人们对图书 馆这一传统信息中心的依赖与信任逐渐减弱,在网络环境和信息时代下,图书馆 各项工作受到了搜索引擎的冲击。从搜索引擎应用现状来看,主要是互联网搜索 服务、 企业电子商务以及知识管理应用 (包括企业内网搜索、 文档管理系统等) 。 图书馆界在分类、 检索等领域具备的传统优势与搜索引擎这一新型网络工具的联 合,对图书馆工作与服务的开展将充满机遇与挑战。对于搜索引擎在图书馆应用 的研究国内尚无多少先例。因此,本文就网络环境下搜索引擎与图书馆的关系, 搜索引擎对图书馆的作用,以及搜索引擎能否应用于图书馆、在图书馆什么方面 应用以及如何开展应用等问题做一次系统的研究和探讨。 1.2 研究目的和意义 搜索引擎已经成为信息时代一个重要且普及的网络工具, 它主要帮助人们在 网络上查找所需要的信息, 并且主流搜索引擎门户网站还能为上网冲浪的人们提 供学习、交流和休闲娱乐等多种功能。尽管搜索引擎的搜索能力在不断完善,搜 索功能在不断扩大, 但是传统搜索引擎仍然在广大网络用户进行检索信息时存在 2 一些缺陷,诸如检索界面不够人性化、检索返回的冗余重复信息过多等。智能搜 索引擎, 尤其是智能 agent 技术的出现从一定程度上弥补了传统搜索引擎在网络 用户使用时的一些不足,强化了智能搜索引擎的检索优势并能提供人性化的服 务,并且依靠其自身的智能性给网络用户带来许多新的功能和体验。面对智能搜 索引擎的强大功能和特点, 如何将其合理的应用到图书馆中充分发挥其优势为社 会大众服务,是本文研究目的所在。 本文试图在深入研究多 agent 智能搜索引擎和图书馆服务工作的基础上, 利 用智能搜索相关技术和图书馆服务工作的特点, 把智能搜索引擎应用到具体的图 书馆各项服务工作中,以期达到改善图书馆服务工作水平,提高图书馆服务工作 质量,拓展图书馆信息服务功能。这对于处在信息社会和网络之下的图书馆扩大 信息服务规模、 更好的为科研和教学进行综合服务以提升图书馆信息服务竞争力 和社会影响力具有重要意义。 1.3 研究现状简述 搜索引擎, 尤其是智能搜索引擎以其强大的功能在社会各领域越来越多的被 人们所使用,也越来越多地受到国内外学者的重视,这也使得众多学者从各个角 度对其进行了研究。 1.3.1 国外研究现状 搜索引擎的鼻祖是加拿大麦吉尔大学(university of mcgill)计算机学院的 三名学生 alan emtage、peter deutsch、bill wheelan 开发出的 archie 软件,而后 的 excite、yahoo、lycos、infoseek、google 等搜索引擎也纷纷在技术上推陈出 新,不断拓展搜索引擎的功能。智能搜索引擎的出现缘于人工智能、知识发现等 技术与搜索引擎技术的结合, 因此国外学者对智能搜索引擎的研究多从技术角度 出发,介绍新的搜索算法、研究性的搜索技术来提高搜索引擎的功能。主要研究 有: (1)搜索引擎算法研究。hersovici m, heydon a, mitzenmacher m 等人提出 智能搜索引擎的网络蜘蛛搜索算法鲨鱼搜索算法, 能够避免搜索与主题不相 关的网页,从而提高检索命中率 1;filippo menczer, gautam pant, padmini srinivasan 等人论述了智能搜索引擎中的网络蜘蛛所使用的深度优先算法、 pagerank 等搜索方法 2。 (2)搜索引擎技术研究。andrew mccallum, kamal nigam, jason rennie 等 人介绍了一种新的爬行器net spide, 因其具备巩固学习机制可以避免在搜索 过程中搜索与主题无关的网页信息,从而被大量应用在网络智能搜索引擎中 3; 3 marat kanteev, igor minakov, george rzevski 等人介绍了一种使用语义网理解技 术构建的多 agent 元搜索引擎,并论述了它在网页分析、分类、个人咨询等方面 的应用 4。 (3)智能agent研究。marina roesler和donald t. hawkins首次从信息专业的 角度介绍并论述了agent技术的重要性,以及如何帮助用户完成计算机工作从而 改变个人习惯 5。ernest perez则分别介绍了agent的定义、特点,并对搜索agent 和任务agent的功能、应用做了分析 6。 1.3.2 国内研究现状 中文汉字的复杂性使得中文搜索引擎的发展与国外相比在技术方面比较落 后。但是随着谷歌登录中国、百度公司的建立、北大天网的创立等,搜索引擎很 快成为国内网络时代第三次发展浪潮的领军者, 对中文搜索引擎的研究状况也随 之发生了改变。 国内计算机与软件方面的专家学者在智能搜索引擎技术方面进行 了广泛的探讨,而我国图书情报人员也敏锐地抓住了搜索引擎发展的机遇,对智 能搜索引擎在图书馆各方面的具体应用进行了可贵的探索,主要研究有: (1)智能搜索引擎技术研究。刘敏提出了“以网对网”的提高搜索引擎智 能水平的思路,介绍了基于 innernet 的 internet 信息检索策略以及其相较于传统 搜索引擎的特点 7。皮鹏,张国印提出一种采用分布式 agent 技术,以词典作为 信息匹配和交互的媒体,能够很好地对用户的兴趣进行自适应学习,对用户提供 个性化的信息检索服务的专题型搜索的智能元搜索引擎方案, 并给出了该方案框 架结构和具体算法的描述 8。 (2)智能搜索引擎系统研究。韦鲁玉,丁华福从现有搜索问题入手,开发设 计了一个基于 agent 的个性化智能信息检索系统模型, 该模型由用户信息检索个 性 agent、 信息搜索 agent 和信息过滤 agent 三个模块构成,对三个模块中的关键 技术进行研究后,结果表明该平台可减少搜索范围,加快搜索速度 9。 (3)智能搜索引擎在图书馆个性化服务的应用研究。黄毅就智能 agent 技 术在数字图书馆中如何实现 internet 信息自动搜索,提供个性化主动服务进行了 研究 10。邹凯,汪全莉认为智能搜索引擎应用于数字图书馆个性化服务体系,不 仅能有效发挥智能搜索引擎数据挖掘、知识发现的功能,同时也能较大地加深数 字图书馆个性化服务体系的主动性、智能性优势 11。刘崇学分析并介绍了智能搜 索引擎的优势,构建了以智能搜索引擎为中心的数字化图书馆个性化服务系统, 并认为智能搜索引擎在个性化服务支持方面还需要在技术方面进行改进 12。 (4)智能搜索引擎在图书馆信息资源的应用研究。张秀华,赵伟,赵智博 提出一种基于 multi-agent 的具有智能性、协作性、灵活性等优点的图书馆网络 信息资源整合系统,并给出了系统的整合目标、整合的技术路线、系统的体系结 4 构和各 agent 的功能及运行机制 13。 (5)智能搜索引擎在图书馆个性化信息搜索的应用研究。贾宏论述了运用 “网对网”智能技术的智能搜索引擎在数字图书馆信息搜索中的应用 14。颜世伟 介绍了几种主要网络搜索引擎开展的学术搜索服务业务, 并分析了学术搜索对图 书馆、专业期刊数据库商等学术信息整合、服务单位及信息服务人员的影响 15。 我国台湾的 min-huang ho, yue-shan chang, shyan-ming yuan 等人构建了一种 具有信息过滤功能的多 agent 搜索引擎octopus,并研究了其在个性化网络 搜索服务中的应用 16。毛军从以网络为中心的信息服务出发,分析了图书馆信息 服务与搜索引擎跨界合作的技术框架,然后结合谷歌地图,归纳了跨界合作的具 体方法、流程、难点以及带给我们的启示 17。 (6)智能搜索引擎在图书馆知识共享的应用研究。胡誉耀探讨了智能搜索 引擎在知识共享过程中于知识搜索、知识推送的应用,提出了基于智能搜索引擎 的知识共享模型, 并给出了智能搜索引擎为适用知识资源高效共享需要改进的相 关技术 18。 1.4 研究内容和研究方法 本文旨在系统地研究智能搜索引擎对图书馆信息服务的作用, 并为国内图书 馆利用智能搜索引擎开展本馆的信息服务工作提供一定的指导。 文章首先对国内 外智能搜索引擎的理论研究、应用研究和技术研究作了概述;接着对搜索引擎和 智能搜索引擎的概念、工作原理和系统框架进行了介绍,包括 agent 与多 agent 系统的概念和特点;之后介绍多 agent 智能搜索引擎系统的设计思路、工作流程 和各agent的功能结构; 然后分析了多agent智能搜索引擎在图书馆应用的优势、 影响和意义;最后详细阐述智能搜索引擎在图书馆信息服务工作几方面中的应 用,包括信息检索、数字图书馆个性化信息服务、查新咨询以及智能搜索引擎与 图书馆信息服务跨界合作的具体操作实施等。 本文的研究充分遵循理论与实践相结合的原则, 力求使文章既具备深厚的理 论基础,又具有很强的应用性。在搜集大量相关文献的基础上,调查访问众多国 内外图书馆、信息检索系统和搜索引擎站点,通过对案例的研究和检索系统分析 的来增强文章的应用性和现实感。文章的理论研究以归纳总结为主,应用指导以 举证为主。 5 第二章 多 agent 智能搜索引擎系统与功能分析 2.1 搜索引擎工作原理及体系结构 2.1.1 搜索引擎发展简史 搜索引擎(search engine),又称搜索机,web 搜索器,是伴随 www 网络出 现的检索网上信息资源的新工具。1990 年加拿大麦吉尔大学(university of mcgill)计算机学院的三名学生 alan emtage、peter deutsch、bill wheelan 开发 出了 archie,它能定期搜集并分析 ftp 服务器上的文件名信息,提供查找分别 在各个 ftp 主机中的文件。 虽然 archie 搜集的信息资源不是网页 (html 文件) , 但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检 索服务, 所以 archie 就是现代搜索引擎鼻祖。 随后, 国外的 excite、 yahoo、 lycos、 infoseek、google 和国内的百度、北大天网、搜狗、中搜等搜索引擎纷纷登台亮 相,相继推出自己的搜索引擎和特色搜索服务。在这一发展过程中,搜索引擎历 经目录检索、全文检索的阶段,并且逐步向元搜索、智能搜索的方向发展。 2.1.2 搜索引擎工作原理概述 搜索引擎作为一个系统有着它的基本工作原理,现代搜索引擎一般采用如图 2.1 所示的被称之为三段式的工作流程,即:网页搜集、预处理和查询服务 19。 图 2.1 搜索引擎三段式工作流程 (1)网页搜集 搜索引擎作为软件系统是工作在某个数据集合上的程序, 这个软件系统操作 的数据不仅包括内容不可预测的用户查询, 还要包括在数量上动态变化的海量网 页,并且这些网页不会主动送到系统来,而是需要系统去抓取。如果在用户查询 的时候搜索引擎即时去网上抓来成千上万的网页,一个个分析处理,和用户的查 询匹配,既不可能满足搜索引擎的响应时间,也会影响搜索引擎的系统效益。所 以,大规模搜索引擎服务的基础是有一批预先搜集好的网页。对网页的搜集有两 种主要方式:一是定期搜集,又称批量搜集,即每次搜集来的网页替换掉上一次 网页搜集 预处理服务 6 搜集的内容。这样做的好处是系统实现比较简单,但缺点是两次搜集的间隔时间 长(如早期北大天网每 3 个月搜集一次,google 是 20-28 天搜集一次) ,时新性 不高,而且重复搜索还带来服务器额外带宽的消耗。二是增量搜集,即开始搜集 一批网页,往后只是搜集新出现的网页和那些在上次搜集后有过改变的网页,并 且将前次搜集后已经不存在的网页从库中删除。 这样做的好处是系统表现出来的 信息时新性比较好,缺点是系统的搜集和建立索引的过程比较复杂。 (2)预处理 预处理作为搜索引擎三段式的中间结构具有举足轻重的地位。 首先是要为搜 集来的原始网页建立索引并保存到索引库中, 而有了索引就能为搜索引擎提供网 页快照功能。之后对索引网页库中的网页进行分析,提取网页正文信息消除重复 或转载网页,进行链接分析。最后利用切词技术把正文信息切分成索引词,然后 将分析网页后得到的索引词表创建按倒排文件(包括倒排表和索引词表) ,同时 将网页中包含的不重复的索引词汇聚成索引词表。 (3)查询服务 经过前两个步骤后,传递到服务阶段的数据包括索引网页库和倒排文件,倒 排文件中包括倒排变和索引词表。在查询服务中首先要考虑的是查询方式,即系 统允许用户提交查询的形式。一般来说搜索引擎面对的是用户的查询短语,就英 语来说它是一个词的序列,就中文来说它是包含若干个词的短语或语句。之后根 据用户输入的查询短语,利用分词等技术获得向量表示,然后执行检索算法进行 网页检索。最后对搜索引擎系统检索得到的相关网页集合,根据查询检索词的相 关度和权值按照固定的输出格式“标题url摘要”显示给用户浏览。 2.1.3 搜索引擎体系结构及各模块功能作用 按照前面所论述的搜索引擎工作原理,可以给出通用搜索引擎的体系结构 (如图 2.2 所示) ,其结构中各模块的功能作用描述如下: (1)搜集器(一般称为 robot 或 spider) :其功能是在互联网中漫游,发现和 搜集信息。它要尽可能多、尽可能快地搜集各种类型的新信息,还要定期更新己 经搜集过的未更新信息,以避免无效链接。 (2)索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用 于表示文档以及生成文档库的索引表。并从中抽取出索引项,将文档表示为一种 便于检索的方式,生成文档库的索引表并存储在索引数据库中。 (3)检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关 度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息。首先采 用与分析、索引文档相似的方法来处理用户查询请求。然后按照某种方法来计算 用户查询与索引数据库中每个文档之间的相关度。最后,将相关度大于一定权值 7 的所有文档按照相关度递减的顺序排列,返回给用户。 (4)控制器:对于效率,控制器考虑的是如何利用尽量少的资源(计算机设 备、网络宽带、时间)来完成预定的网页搜集量。对于质量,指的是在有限的时 间,搜集有限的网页,希望它们尽量是较重要的网页。 (5)分析器:其功能是对搜集器下载的文档进行分析以用于索引。文档分析 技术一般包括分词、过滤和转换等,这些技术往往与具体的语言以及系统的索引 模型密切相关。 (6)用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。 在查询输入界面中, 用户按照搜索引擎的查询语法指定待检索词条及各种简单或 高级的检索条件。在输出界面中,搜索引擎将检索结果展现为一个线性的文档列 表,其中包含了文档的标题、摘要和链接等信息。由于检索结果中相关文档和不 相关文档相互混杂,用户需要逐个浏览以找出所需文档。 图 2.2 通用搜索引擎体系结构 2.2 agent 内涵及其特点 2.2.1 agent 的产生与发展 agent 起源于 20 世纪 70 年代的人工智能(ai, artificial intelligent)领域。20 控制器 搜集器 原始数据库 索引器 检索器 索引数据库 用户接口 用户 分析器 用户行为 日志数据库 internet 8 世纪 80 年代中后期,人工智能技术与分布式计算技术相结合,出现了分布式人 工智能(dai, distribution artificial intelligent)这个研究方向,作为分布式人工智 能的构成因素的 agent 一词也越来越多地被提到, 由于它突破了长期以来人工智 能研究进展不大的局面,因此受到人们的重视。1993 年首次召开了 agent 形式 化模型的国际会议, 同年 y. shoham 提出了面向 agent 编程的 aop 的概念。 1994 年 1 月, 美国 general magic 公司演示了他初次公开的 agent 软件。 1994 面 3 月, aaai 春季年会的主要议题是 software agent,参加者除了计算机、软件工程领 域的专家学者,还来自机器人、知识表达、知识库系统、数据库、机器学习、认 知科学、心理学、计算机图形学、人机交互等其他领域,这意味着 agent 的研究 集成了来自多种研究领域的重要成果。自此,agent 研究融入了主流计算机的各 个领域,产生了一系列新的思路、方法和技术,各种类型的软件 agent 大量用于 信息处理、办公自动化、交通管理、私人助手等。 2.2.2 agent 的概念与内涵 目前,尽管 agent 一词被广泛使用、agent 技术在继续研究,但由于 agent 内涵丰富因而它的概念表述也一直存在着争议而没有统一的定义, 以下列举一些 比较普遍的定义: 从一般词面意义上来讲,agent 一词一直被译为“代理” ,国内也有部分学 者将其译为“智能代理” ,即代理用户去处理各种各样的事物; 人工智能研究人员一般认为,agent 是不仅具有自主、社交、反应、预动能 力的软硬件系统,同时它还具有一些人才具有的概念,如知识、信念、目的、义 务等 20; 在计算机领域,agent 被看作是分布式系统或协作系统中能持续自主发挥作 用的计算实体 21; shoham 认为, agent 就是一种实体, 它可以被看成由许多心智状态(如信念、 能力、选择和承诺)所组成 22。 虽然对 agent 在概念表述上不同的研究人员有不同的认识, 但总的来说大家 对 agent 的内涵普遍存在一些共识,主要是: (1)agent 是具有自主性的抽象实体,它具有感知能力、问题求解能力和 与外界进行通讯能力等; (2)agent 是人机交互通达信息资源的中介,它涵盖了用户需求的定义、 分析和存储以及信息的输入、需求匹配和结果发送各个方面。 2.2.3 agent 的特点和优点 与 agent 概念描述一样,对 agent 的特点也有着不同的说法,总的来说可以 9 将 agent 的特点归纳为以下几点: (1)自主性。agent 最基本最主要的特性,它是指 agent 可以在没有人或其 他 agent 直接干预的情况下运作,而且对自己的行为和内部状态有一定的控制能 力。它的含义包括 agent 应该能够感知环境,对预知的和非预知的事件做出适时 的反应,而且这种反应应属于自身的计算资源和控制机制,由内部机制决定自身 的行为。 (2)协作性。指 agent 能够通过某种 agent 通信语言与其他 agent 交换信 息,这是 agent 协商与协作的基础。 agent 独立但不孤立, 能够同其它 agent 主体 进行信息交换,在单个 agent 不能独立完成某项任务时,它能借助通讯机制与其 它 agent 进行协作来达到预期的目标。 (3)反应性。指 agent 能够及时地感知和响应其所处环境的变化。由于采 取了以知识库为基础的语义分析, agent可以利用自然语言与用户进行人机交互, 通过运用灵活的常识性联想功能有效地理解用户的请求, 从而在与用户交互查询 过程中为其提供详尽的修正、 改进或补充意见, 通过与用户的一步步交互, 启发、 引导用户表达出真正的需求意图,同时对搜索结果做出合理的解释。 (4)主动性。指 agent 能主动产生目标,分析和获取用户的个性信息并根 据用户的兴趣模型了解用户的潜在需求,采取主动的行为。agent 允许用户充分 表达个性化需求,通过深入挖掘用户的个人需求、习惯、爱好和兴趣,为其提供 “量身定制”的个性化信息服务,并且还能够主动地将用户所需信息推送到用户 面前。 (5) 持续性。 agent 是连续运行的,其状态在系统运行过程中始终保持一致。 为于完成用户的委派,agent 能够连续执行,即使用户离开时也能正常执行。 (6) 学习性。 agent 具有学习知识和经验,能够进行相关的推理和智能计算。 agent 能够感知环境,并能对环境信息和突发事件做出及时的响应,它的 robot 软件通过启发式学习能选择最佳策略和时机跨异构、跨平台自动的收集整理信 息,在线完成功能的动态调整;它又可以学习记忆用户的兴趣爱好,建立用户兴 趣模型来指导自己的决策,使之符合用户的需求。 从 agent 概念与特点上看,agent 区别于传统搜索引擎系统的显著特性在于 它具有与其所处环境、其它 agent 和人进行交互、协调、协作和学习的能力。 agent 除了具有现在搜索引擎具备的快速检索、相关度排序等功能外,还增加了 用户角色登记、用户兴趣自动识别、内容的语义理解、智能化信息过滤和推送等 多种功能。由于它采用自然语言理解技术进行信息检索,对知识具有一定的分析 和处理能力,故将信息检索从目前基于关键词层面提高到基于知识(或概念)的层 面,能从众多资源中过滤出对用户最有价值的信息。 10 2.2.4 多 agent 系统的优势概述 agent 在智能搜索引擎中从事信息获取、信息过滤、信息收集、为用户服务、 了解用户兴趣所在等工作,这些工作并不是由一个 agent 独立完成,而是要求一 个 agent 能够与其他 agent 互操作,在平等的交互基础上相互协调,于是多个 agent 协同并行工作构成了多 agent 系统。 多 agent 系统(multi-agent system, mas)指具有不同目标的多个 agent 对其 目标、资源等进行合理的安排,以协调各自行为,最大程度地实现各自的目标, 它由多个 agent 组成,每一个 agent 又是一个自治计算实体,具有目标、知识和 能力 23。单个 agent 的往往将重点集中在对人类单个智能品质的研究与模拟上, 无法充分刻画或恰当地模拟人类的全部智能行为;而 mas 主要在逻辑上或物理 上分离的多个 agent,协调其智能行为,即知识、目标、意图及规划等,实现问 题求解 24。因此 mas 是优于仅由单个 agent 控制的系统,通过 agent 间合作, mas 不仅改善了每个 agent 的基本能力,而且从 agent 的交互中进一步理解了 社会行为。 同时 mas 组织结构为 agent 成员提供一个交互的框架, 为每个 agent 成员提供一个多 agent 群体求解问题的高层观点和相关信息, 以便合理地分配任 务并使这些 agent 成员能够更好地协同工作。 因此相较于单个 agent, mas 具有 提高自适应性、可靠性、灵活性和重用性等优势,可以完成各个环节的协调与合 作。 2.3 多 agent 智能搜索引擎概述 2.3.1 多 agent 智能搜索引擎系统介绍 相对于搜索引擎,笔者认为智能搜索引擎(intelligent search engine,ise)就是 运用人工智能(ai)、数据挖掘(data mining, dm)、自然语言理解等现代技术, 将传统的基于关键词的检索提高到基于知识或概念的检索, 在服务器端记录用户 个人资料操作习惯,以知识逻辑推理机制明确用户检索目的,通过搜索器进行智 能化信息搜集,并且过滤、推送信息至用户的系统。 而多 agent 智能搜索引擎(multi-agent intelligent search engine, maise)是 在智能搜索引擎的基础上综合运用了 mas、主动搜索和元搜索技术相结合的搜 索引擎。maise 其本身不提供大型的搜索信息预存数据库,而是根据用户需要 将检索请求分发到其他实际的独立搜索引擎或主动搜索 agent 上, 对这些独立搜 索引擎或主动搜索 agent 所返回的结果在本地数据库进行分析处理后再将搜索 结果返回给用户。 11 maise 的实现采用了多 agent 协同工作的方式,其体系结构如图 2.3 所示, 系统共分七大模块:用户 agent、数据库管理 agent、主动搜索 agent、元搜索 agent、系统管理 agent、本地数据库、控制器,各模块用于分别实现人机交互、 用户兴趣学习、系统数据管理、信息搜索、多 agent 协同等功能。 图 2.3 多 agent 智能搜索引擎系统体系结构 2.3.2 多 agent 智能搜索引擎系统工作流程 多 agent 智能搜索引擎的工作流程在通用搜索引擎的三段式工作原理基础 之上,又有一些不同,主要是多 agent 系统在智能搜索引擎中的智能化运作,其 工作流程按照如下步骤进行: ()用户提出查询请求,用户 agent 接受该请求,产生用户的个性化的查 询请求。 ()接收用户查询请求,用户 agent 接收用户查询请求后依据用户的实际 需求将查询请求传递给主动搜索 agent 或元搜索 agent。 ()对查询请求进行分析,如果用户需要主动搜索,则主动搜索 agent 需要根据用户的查询请求生成不同类型的网络搜索 robot(如: www robot, bbs robot,news group robot) 对信息进行固定范围、深度、响应时间的主动搜 索;如果用户需要元搜索,把用户查询请求转化成符合所对应的元 agent 搜索引 用户接口 用户 agent 系统管理 agent数据库管理 agent 本地数据库 元搜索 agent 主动搜索 agent robot/spider 控 制 器 internet 用户 12 擎语法的查询请求;此外,数据库管理 agent 还要将查询词条保存在本地数据库 当中的历史文档里。 ()将要分送的查询请求转化为对应目标搜索引擎的查询语法格式,并将 其发送至各个对应的搜索引擎。 ()收集从各个选中的搜索引擎返回的结果,分析、合并查询返回结果, 消除无效的链接页面,去除重复冗余的信息;数据库 agent 记录主动搜索的网址 和元搜索的信息返回情况,用于用户个性化模型的维护;然后,主动搜索 agent 和元搜索 agent 对查询返回的结果进行归并、排序。 ()用户 agent 将归并、排序后的查询结果生成 html 页面提交给用户, 根据用户的要求,把文档按照相关性从高到低的顺序,按照统一的格式返回给用 户,并记录用户的链接点击和网页停留情况,以及用户对搜索结果的评价反馈。 2.3.3 多 agent 智能搜索引擎各模块功能作用分析 用户 agent(user agent) 用户 agent 工作在每个客户端,负责接收用户的查询请求及其它指令,传递 收集到的信息以协调智能搜索引擎系统完成用户的任务。 它还能通过保持对话记 录集中发掘用户的操作习惯,为用户提供更多的智能、合作建议和帮助,进而为 用户提供其所感兴趣内容和与其最相关的内容。 用户 agent 具体功能是负责和用户交互,给用户提供一个友好的交互界面; 依据用户提供的目标样本和反馈信息生成和维护用户个性模型; 接受用户传来的 请求并阐明它, 将请求转换成恰当的查询语言传送给系统管理 agent 和数据库管 理 agent;在信息查询过程中,能和用户进行交互以帮助问题的求解;能接收系 统管理 agent 传来的结果并呈现给用户,由用户对结果进行反馈评价,并对用户 的反馈结果进行学习、动态的修改和完善用户个性模型。 用户 agent 中包含算法或技术主要有:用户 agent 选择模式算法、用户个性 化模式生成算法、用户反馈结果聚类算法、数据挖掘技术、语义网络技术、短语 识别技术、同义词处理技术等。 系统管理 agent(manage agent) 系统管理 agent 是整个智能搜索引擎系统的运转枢纽,负责把众多的信息 agent 集成一体,接受其它 agent 的服务请求,选择合适的 agent 与请求 agent 协作以共同完成任务, 监视任务的完成情况; 负责用户与其它 agent 之间的通信, 转换请求与应答的表达方式,为用户获得信息提供统一界面。 当用户登录系统时,系统管理 agent 根据用户登录情况激活相应的用户 13 agent,如果是新用户注册,要创建全新的用户 agent 并通知数据库管理 agent 创建相应的数据表。协调是指具有不同目标的多个 agent 对其目标、资源、思维 状态等进行合理安排,调整各自行为,以最大程度实现各自目标。maise 中的 用户 agent,元搜索 agent 和主动搜索 agent 并不是一直处于活动状态, 为了节省 系统资源,系统管理 agent 会根据实际需要对他们进行挂起、激活操作。当用户 没有提出搜索请求时元搜索 agent 和主动搜索 agent 一般处于挂起状态, 一旦用 户发出搜索请求,相应的搜索 agent 就会被激活;而当系统长时间处于闲置状态 时,系统管理 agent 也会激活主动搜索 agent 命令其进行智能主动搜索,检查用 户常用网站的更新情况。协调的目标是解决各个 agent 在按照各自的目的、知识 与能力进行活动时可能出现的矛盾和冲突。 对控制器信息的管理和监控也是系统 管理 agent 的主要工作之一,它可以根据实际情况设置控制上信息的优先级,来 及时地对用户做出响应,并删除过时、无用的信息,来释放内存空间。 系统管理 agent 包含的算法或技术主要有:相关度排序计算、成员 agent 调度策略、网页净化与消重技术、通信机制等。 主动搜索 agent(search agent) 主动搜索 agent 是本系统中主动搜索功能的具体实现者, 主要完成的工作是 产生不同类型的网络 robot 对用户指定网址的 www,bbs,news group 上 的信息进行指定范围、深度、响应时间的主动搜索和对网络 robot 返回的搜索结 果进行统计和排序,并对所派出的网络 robot 进行智能管理和监控。 主动搜索 agent 的工作和智能性主要体现在:当用户提出主动搜索请求后, 主动搜索agent通过控制器获得用户agent发出的用户请求细节, 系统管理agent 按照用户的实际要求催动网络 robot 产生不同类型的网络 robot,按照不同的网 络协议将 robot 发送到 internet 上;在 robot 搜索的过程中还要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年心血管科常见心血管疾病影像学诊断模拟答案及解析
- 2025年传染病防控知识考察试卷答案及解析
- 生物医药发展新质生产力
- 2025年胃肠病学常见疾病诊治考核答案及解析
- 民族团结与家乡变化课件
- 2025年产科紧急情况处理演练答案及解析
- 2025年耳鼻喉科常见急性疾病处理策略模拟考试卷答案及解析
- 新质生产力的“三新”解读
- 2025年妇产科产前诊断常见问题考核模拟测试答案及解析
- 2025年肝胆外科胆囊息肉处理技术考试答案及解析
- 卒中防治中心建设情况汇报
- 遗体异地接收证明范本
- GB/T 42676-2023半导体单晶晶体质量的测试X射线衍射法
- (完整版)贵州三年级地方课程教案
- 临床基本检查方法和检查程序课件
- 红金消结片对“乳腺增生”的疗效观察
- 青海2023届高校毕业生就业报告出炉:医学和法学就业率最高
- 生理学 第九章 感觉器官的功能
- 静脉血栓栓塞症预防与护理课件
- 西门子低压电器快速选型手册
- 养羊与羊病防治技术课件
评论
0/150
提交评论