



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语义搜索的分类一按语义搜索引擎服务内容的分类语义搜索引擎从人们头脑中的概念到在搜索领域占据一席之地经历不少坎坷。语义网出现后,语义搜索迎来了高速发展的机遇期。虽然语义搜索服务内容主要集中在传统搜索引擎不擅长的语义网搜索方面。不过语义搜索引擎也试图拓展服务范围,提供比传统搜索引擎更全面的服务。语义搜索引擎的服务内容主要包括以下几个方面:知识型搜索服务、生活型搜索服务、语义工具服务等。 (1)知识型搜索方面,主要针对语义网知识信息资源。其中包括:词典型搜索服务。一种形式是如同使用电子词典一样, 通过关键词直接查询与关键词对应的概念。这些概念由语义搜索引擎索引的本体文件中提取。另一种形式则是对在线百科全书的搜索服务,如PowerSet,这一点与传统搜索引擎近似,但语义搜索引擎在信息的组织上远胜于传统搜索引擎。语义网文档(SWD)的查询服务。用户可以通过语义搜索引擎查询所需的语义网文档和相关的语义网文档。Falcons 为统一资源标识符(URI)定义的语义网对象和内容提供基于关键词的检索方式。Swoogle 从互联网上抽取由RDF 格式编制的语义网文档(SWDs),并提供搜索语义网本体、语义网例证数据和语义网术语等服务。领域知识查询。部分语义搜索引擎提供了针对某个或某几个专业门类的信息检索服务, 用户可以选择自己所需相关信息。Cognition 以搜索法律、卫生和宗教领域为主。个别语义搜索引擎提供针对特定领域的多媒体语义搜索服务,如Falcon-S 对足球图片的搜索服务。不过多媒体语义搜索面临与传统多媒体搜索相似的困境,缺乏有效的语义标注。对多媒体信息的辨别和分类能力仍有待提高。(2)生活型搜索方面,语义搜索引擎在传统搜索引擎力所不及的诸方面发展迅速。社会网络搜索。部分语义搜索引擎提供社会网络搜索功能,这种功能可以实现通过姓名、著作、所在单位等信息中的一条或几条, 查询与这些信息有关联的更多信息,如我国的ArnetMiner。资讯搜索。目前语义化的网络搜索服务能够更有针对性, 更准确地为用户提供新闻资讯。Koru就是这方面的代表。(3)语义工具服务。这是语义搜索引擎所属的研究机构的一个较为独特的方面, 和传统搜索引擎提供的桌面搜索等工具不同, 语义搜索引擎提供的语义工具一般不是对语义搜索功能的直接移植, 而是对文档的相似性、标注等进行处理用的。这些工具可以为语义搜索引擎的索引对象进行前期数据加工,同时也供科研使用。理论上讲语义搜索引擎能够提供包括普通网络文档检索在内的所有类型网络文档搜索服务, 但是由于语义搜索引擎对网页的索引方式不同, 微处理器需要比传统搜索更长的时间才能分析完一个页面, 因此很多语义搜索网站只能扫描到外部网站的二级页面,这样将难以满足用户全网络搜索的需求。二按语义搜索引擎服务模式分类语义搜索引擎高速发展的阶段正值传统搜索引擎发展的平台期, 虽然语义搜索引擎暂时尚不具备传统搜索引擎的市场竞争力, 但是它们却可以很容易地借鉴传统搜索引擎的成功服务模式, 用相同或相似的方式提供自己的特色服务。(1)传统型服务模式。这些来源于传统搜索引擎的服务方式可以称作传统型服务模式。语义搜索引擎所借鉴的服务方式主要是其中的两种: 即简约型服务模式和专门型服务模式。简约型服务模式。由于用户的检索行为对信息检索系统的服务模式产生巨大的影响, 因此如何在尽可能不影响用户检索体验而实现方便快捷的搜索服务,则成为语义搜索引擎的一个重要标准。许多语义搜索引擎就采取了与传统搜索引擎相一致的搜索界面,并允许用户以关键词的方式提交搜索请求,尽可能贴近用户操作习惯。专门型服务模式。语义搜索引擎对搜索对象的标引和信息提取等要求高于传统搜索引擎, 导致其信息加工时间延长而不利于全面网络搜索。因此语义搜索引擎扬长避短,展开专门领域的垂直搜索。(2)创新型服务模式。语义提取和运用是语义搜索引擎的独到之处, 因此也有很多语义搜索引擎以此为契机, 摒弃了传统搜索引擎简化单一的服务模式,以用户的搜索行为和搜索服务特色为基础,推出了创新的搜索服务模式。即精确应答服务模式、刻面搜索服务模式和查询引导型服务模式等。精确应答服务模式。除直接搜索语义网文档之外, 语义搜索引擎还能够根据某一个查询需求获得相关的本体数据, 可以通过输入关键字与某一个分类,某一个语义关联或者实例信息匹配,并将相关的部分本体文件以片断的形式反馈给用户, 这种简洁的搜索结果就是用户提出的问题的答案。这类的典型代表包括Swoogle, Falcons, Sindice 和Watson。刻面搜索服务模式。为了更好地发挥语义搜索对用户搜索过程的指导作用, 语义搜索引擎在用户接口方面做出了很大改动, 采取了更为复杂但符合用户使用习惯或具有针对性的搜索界面。其中著名的当属刻面搜索(faceted search),这种搜索方式不但可以集成分词过滤或多种搜索条件, 而且还可以针对不同的搜索结果类型分开显示【10】。查询引导型服务模式。语义搜索引擎在实现查询提问的歧义消除方面拥有独到的优势。在有了更好的语义匹配作保障的情况下, 通过引导用户逐步细化查询可以更准确地呈现搜索结果。koru 采用了独特的横向三页面模式(如图2 所示),按照建立适当查询、浏览文档列表、深入阅读所选文档这一网络用户检索习惯的步骤逐级引导用户。三按本体技术在语义搜索中的作用分类可将语义搜索分为三类:基于传统搜索的增强型语义搜索、基于本体推理的知识型语义搜索及其他形式的语义搜索。(1) 基于传统搜索的增强型语义搜索这一类型的语义搜索利用语义技术来改善传统搜索的效果。其核心仍然是传统的搜索引擎,本体技术以多种途径被用来增强关键字搜索,改善搜索的查全和查准率。关键词在本体中被检索,其他不同的概念通过图搜索的方式也被检索出来,与这些概念相关的词被用来扩展或者约束搜索。(2)基于本体推理的知识型语义搜索这一类型的语义搜索以本体构建的知识库为主体,通过本体知识库推理实现知识发现型的语义搜索。根据搜索对象的不同,我们可将其分为概念搜索和关联搜索。21概念搜索根据用户查询的复杂程度,概念搜索可分为两类,一为简单概念搜索,二为复杂约束概念搜索。简单概念搜索知识库中包含有正式的语义信息,主要是指概念、实例和关系。事实上用户感兴趣的数据并不是抽象的领域知识如“人”这样的笼统概念,而是属于某个概念的具体实例信息。因此,概念搜索的任务是快速有效地检索出属于某个概念的所有实例。简单概念搜索中用到的一般性方法是关键字和概念之间的匹配算法。复杂约束概念查询在查询中,可能会出现诸如此类的复杂约束查询,如:检索所有的老师,这些老师在20世纪60年代出生,同时指导80年代出生的硕士生完成研究生阶段学习,该查询属于典型的复杂约束概念查询。复杂约束概念查询在实现的过程中,万方数据通常需要检索出一组概念,概念之间通过特定的联系被连接在一起。在语义Web环境中,复杂约束概念查询的形式化不难实现。主要问题在于对用户来说如何表达复杂的约束查询并不容易。因此,研究者们在用户查询接口方面已经展开了相关研究,其目的在于尽可能为用户提供较直观的查询模式。文献33实现了图形化的用户接口GRQL,该接口可创建基于本体浏览的图模式查询。查询定制的步骤为:首先选中本体中的概念,所有与此概念相关的属性被显示出来以供扩展。然后点击选中的属性,通过约束该属性扩展查询图,也可选择该属性的值域概念作进一步扩展。其他约束操作也可以在查询模式上执行,如可将某些概念限定为子概念,也可限定某些属性为子属性。文献34描述了另一种图形化查询界面。用户给出了领域模式来选择查询开始点,查询的定制可以通过属性限制概念,也可以是概念的可兼容性替代,例如用子概念或父概念替代此概念。22关联搜索大部分研究者都将语义搜索定义为语义网中对资源的搜索,利用基本推理功能,找到用户需要的相关资源。该定义满足了大部分情况下的用户请求,但遗漏了实际上可能普遍存在的一类搜索,称作“关联搜索”,关联搜索在语义Web中搜资源间的关联关系,资源间的链接路径在某些特定领域比资源本身更具价值,比如在国家安全领域通常需要搜索资源之间的链接关系,这些关系可能意味着某些潜在的安全威胁。关联搜索中的主要问题在于,如何定义链接的兴趣尺度,且这种定义方法不仅能够消除用户不感兴趣的关联关系,而且可以搜索到数据之间复杂的、隐藏的关联关系。关联关系搜索的结果排序38-39也是语义搜索需要解决的关键技术,知识库中实体之间关系的个数可能会超出实体本身,语义关联就是指实体之间的复杂关系。传统搜索引擎采用的搜索结果排序方法只能对文本信息进行排序,无法对结构信息排序,无法满足语义搜索结果的排序。目前多是结合传统搜索引擎结果排序算法和信息检索技术,尝试新的语义搜索结果排序方法。(3)其他类型的语义搜索华盛顿大学(University of Washington)Turing中心是一个多学科交叉的研究中心,其开发的KnowltAll系统用于提取web上的信息,目的在于构建一个人工智能系统,该系统在足够长的生命周期内可构建基于整个web的知识库,以实现未来用信息提取的方式取代搜索引擎。语义搜索通过推导出知识库中的隐含知识,实现对语义的识别,如利用包含关系扩展搜索中的语义。文本注解形成RDF图。RDF图的遍历通过spread activation算法实现。本体中的弧线根据兴趣给出权重,附加信息和查询相关联。上海交通大学和香港科技大学联合提出一种增强的语义搜索模型4 7。该模型认为关键字是本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论