第2章-第3节-3-cql.doc_第1页
第2章-第3节-3-cql.doc_第2页
第2章-第3节-3-cql.doc_第3页
第2章-第3节-3-cql.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.2.检索语言入门检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。因此,编制检索语言的目的就是不但能够保证不同的标引人员描述文献特征的一致性,而且能够保证检索提问词与文献标引词的一致性。 知识服务平台首页、检索结果等页面的检索输入框默认接受的检索语言为PairQuery。输入CQL:/前缀,可以直接输入CQL语言检索。“专业检索”功能默认接受CQL检索语言。 11.2.1.CQL语言1. CQL语言简介CQL:Common Query Language的简写,它是一种正式的检索语言。可以向检索系统发出检索请求,其检索表达式可以映射到具体的检索系统中去(例如:RMS DB Server、SQL等检索系统)。CQL是一种非常直观的检索语言,其设计目的是使人易读、易写。如想了解更详细信息,请参考CQL: /standards/sru/specs/cql.html 2. CQL与传统检索语言的区别传统的检索语言一般有两种情况:一种是功能强大而表达性强的语言,对于非专业人员既不容易读,也是不易写的(如SQL、PQF、XML Query);另一种是简单而直观的语言,它不能够表达复杂的一些概念(如CCL或Google的检索语言)。CQL的目的就是把检索表达的这种简单性和直观性与Z39.50的Type-1检索有机地结合在一起,就像界面上任何一个语法正确地文本一样,CQL可以特意定制一些如“do what you mean”作为一些简单的每天的查询。当然,如果需要的话,也允许使用一些方法表达复杂的概念。11.2.2.CQL语言说明及样例1. 简单词表示不需要加入任何运算符和修饰符,直接输入检索词进行检索。例如:计算机。2. 关系表达式a. 关系运算符 =: o 相当于模糊匹配,用于查找匹配一定条件的记录。例如:论文题名=计算机辅助设计 研究,表示查找论文题名是“计算机辅助设计 研究”这个字符串或是包括“计算机辅助设计 研究”的一串字符串,注意:只能在“计算机辅助设计 研究”的前后插入字符,不能在“计算机辅助设计 研究”字符串内插入任何字符。o 精确等于某个值。 exact:能精确匹配一串字符串。例如:作者 exact 王明,是指查找作者是王明的记录。 all:当检索词中包含有多重分类时,它们分别可以被扩展成布尔运算符“and”的表达式。例如:论文题名 all “北京 上海 广州”,可扩展为:论文题名=“北京” and 论文题名=“上海”and 论文题名=“广州”,表示查找论文题名中包括“北京、上海、广州”的记录。 any:当检索词中包含有多重分类时,它们分别可以被扩展成布尔运算符“or”的表达式。例如:论文题名 any 北京 上海 广州可扩展为:论文题名=“北京” or 论文题名=“上海” or 论文题名=“广州”,表示查找论文题名中包括“北京、上海、广州”或其中之一的记录。b. 关系修饰符 支持通配符“*”。*:表示匹配任意0个或多个字符,如果表示单个字符“*”,那么可以用转义字符“*”来表示。例如:计算机*研究,表示查找包括“计算机研究”、“计算机软件研究”、“计算机辅助设计研究”等的记录。3. 布尔表达式a. 布尔运算符 and:用“与”组合检索项,表示查找包括这两项的记录。例如:北京 and 上海,表示查找包括北京和上海的记录。 or:用“或”组合检索项,表示查找包括这两项或仅其中任一项的记录。例如:北京 or 上海,表示查找包括北京和上海或其中之一的记录。 not:使用“非”查找包括某一项而非另一项的记录。例如:软件 not 硬件,表示查找包括软件但不包括硬件的记录。下表为具体的检索样例。表11.1.检索样例检索词含义软件检索数据库所有字段中含有“软件”的记录论文标题 = 软件检索数据论文标题字段中含有“软件”的记录软件 and 测试检索数据库所有字段中含有“软件”和“测试”的记录软件 or 测试检索数据库所有字段中含有“软件”或“测试”的记录论文标题 = 软件 and 论文标题 = 测试检索数据库论文标题字段中含有“软件”和“测试”的记录论文标题 = 软件 or 论文标题 = 测试检索数据库论文标题字段中含有“软件”或者“测试”的记录论文标题 = 软件 not 论文标题 = 测试检索数据库论文标题字段中含有“软件”但是不含有“测试”的记录作者 exact 杨美琴检索数据库作者字段精确为“杨美琴”的记录企业名称 all 万方 股份 公司检索数据库企业名称字段中含有“万方”和“股份”以及“公司”的记录企业名称 any 万方 股份检索数据库企业名字段中含有“万方”或“股份”的记录论文标题= 软件 and 论文标题= 测试 not 作者=顾江萍检索数据库论文标题字段中含有“软件”和“测试”,但是作者字段中不含有“顾江萍”的记录11.2.3.PairQuery查询语法知识服务平台首页、检索结果等页面的检索输入框默认接受的检索语言为PairQuery。它比CQL更简单、更易学习。 1. 每个PairQuery表达式由多个空格分隔的部分组成,每个部分称为一个Pair,每个Pair由冒号分隔符“:”分隔为左右两部分,“:”左侧为限定的检索字段,右侧为要检索的词或短语。 2. 限定的检索字段以及“:”可以省略,省略时候的含义是在任意字段中检索。 3. 检索方式介绍: 模糊检索:直接输入的任何词或者短语,表示在全部字段中检索。 精确检索:检索词部分使用引号”或书名号括起来,表示精确匹配。精确匹配依据字段的不同,含义有所不同,分别对应cql的=和exact匹配方式。 字段限定:PairQuery采用“字段名+冒号”的方式进行字段限定。例如:Title:数据挖掘。为了简化用户的使用和记忆负担,PairQuery的中对同一字段的限定字段名可以有多种形式,例如“Title”、“标题”、“题名”均代表对Title字段进行限定检索。 日期范围:日期范围的检索采用Date:1998-2003的形式,“-”前后分别代表限定的年度上下限,上限和下限可以省略一个,代表没有上限或下限,但“-”不可省略。4. 补充说明:PairQuery中的符号(空格、冒号、引号、横线)可任意使用全角、半角符号及任意的组合形式。 5. PairQuery与CQL的关系 知识服务平台首页、检索结果等页面的检索输入框默认接受的检索语言为PairQuery。如果想在知识服务平台首页、检索结果等页面直接输入CQL检索,需要在输入cql语句之前先输入 cql:/前缀。“专业检索”功能默认接受CQL检索语言。 表11.2.PairQuery与CQL对应关系PairQueryCQL说明数据挖掘Cql.anywhere all “数据挖掘”“数据挖掘”Cql.anywhere=”数据挖掘”数据挖掘Cql.anywhere=”数据挖掘”Title:“high speed CPU design”Title =“high speed CPU design”“”代表精确匹配Title:high speed CPU designTitle all “high speed CPU design”Title:数据挖掘Title all “数据挖掘”Title:“数据挖掘”Title=“数据挖掘”Author:”韩家玮”Author exact “韩家玮”作者字段做了整字段索引,则自动转换为exact检索匹配方式数据挖掘 韩家玮Cql.anywhere all “数据挖掘 韩家玮”数据挖掘 Author:”韩家玮”Cql.anywhere all “数据挖掘” and author exact “韩家玮”标题:数据挖掘 Author:韩家韦 范明Title all 数据挖掘 and (Author exact 韩家韦 or Author exact 范明)标题:数据挖掘 Author:韩家韦 范明Title all 数据挖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论