




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节计算机文献检索策略 计算机文献信息检索包含制定检索表达式 制定合理的检索策略 检索策略的调整三个过程 一 检索表达式及构成要素二 计算机检索策略的制定三 调整计算机检索策略 检索表达式的基本含义 检索表达式是一个既能反映检索课题内容 又能为计算机识别的式子 是进行计算机文献信息检索的依据 它主要是运用各种逻运算符号 逻辑位置符号及逻辑限制符号 把检索词连接组配起来 确定检索词之间的关系 准确表达检索课题的内容 构成检索表达式的基本要素 一 检索词 二 运算符 检索词 表达检索课题主题概念的名词术语 包括叙词和自由词 叙词是规范词 大型数据库都有自己专用的词表 检索者可以从选择合适的词进行检索 关键词 构成检索表达式的基本要素 一 检索词 二 运算符 1 布尔逻辑算符常用的布尔逻辑算符有三种 分别是逻辑或OR 逻辑与AND 逻辑非NOT 下面分别简释它们各自的含义与用法 1 逻辑或 OR 逻辑或 OR 可以扩大信息的检索范围 使用它相当于增加检索词主题的同义词与近义词 能提高检索的查全率 2 逻辑与 AND 逻辑与 AND 可以缩小信息的检索范围 提高检索的查准率 3 逻辑非 NOT 逻辑非 NOT 可以用来排除不希望出现的检索词 它与逻辑与 AND 的作用类似 能够缩小命中信息的范围 提高检索的查准率 新浪的使用 搜狐的使用 百度的使用 雅虎的使用 2 邻近检索位置检索也叫全文检索 邻近检索 所谓全文检索 就是利用记录中的自然语言进行检索 词与词之间的逻辑关系用位置算符组配 对检索词之间的相对位置进行限制 这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法 不同的检索系统其位置算符的表示方法不尽相同 美国DIALOG检索系统的位置算符的用法意义如下 1 W With W 表示该算符两侧的检索词相邻 且两者之间只允许只有一个空格或标点符号 不允许有任何字母或词 顺序不能颠倒 W 也可以简写为 例如 Aircraft design可检索出含有Aircraftdesign的文献记录 Computer aided design可检索出含有Computeraideddesign的文献记录 2 nW nWords nW 表示在此算符两侧的检索词之间最多允许间隔n个词 实词或虚词 且两者的相对位置不能颠倒 例如 laser 1w printer可检出含有laserprinter和lasercolorprinter的文献记录 3 N Near N 表示该算符两侧的检索词相邻 但两者的相对位置可以颠倒 例如 computer N network可检出含有computernetwork networkcomputer形式的文献记录 4 nN nNear nN 表示此算符两侧的检索词之间允许间隔最多n个词 且两者的顺序可以颠倒 例如computer 2N system可检出含有computersystem computercodesystem computeraideddesignsystem systemusingmoderncomputer等形式的文献记录 5 S Subfield S 表示其两侧的检索词必须是在文献记录的同一子字段中 而不限定它们在该子字段中的相对次序和相对位置的距离 在文摘字段中 一个句子就是一个子字段 例如computer control s system可检出文摘中含有 Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystemfortestinginnerwallsofpipes 这样一句话的文献记录 这样的文献记录也是可以被检索到的 DesignofaSystemforDataAcquisitionandComputerControlofaPulmonaryPhysiologyLab 6 F Field F 表示其两侧的检索词必须是在文献记录的同一字段中 而它们在该字段中的相对次序和相对位置的距离不限 例如 water pollution F control表示在同一个字段中 如篇名 文摘 叙词等 同时含有waterpollution和control的文献记录均可检索出来 3 截词检索截词检索是计算机检索系统中应用非常普遍的一种技术 由于西文的构词特性 在检索中经常会遇到名词的单复数形式不一致 同一个意思的词 英美拼法不一致 词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等 所谓截词 就是指在检索词的适当位置截断 不同的检索系统其截词检索的表示是不同的 例如 美国Dialog系统用 表示截词符 有以下截词方式 1 后方截词后方截词 也称前方一致 它是将截词符放在一串字符的后面 用以表示以相同字符串开头 而结尾不同的所有词 后方截词又分为词尾的有限截断和词尾的无限截断两种情况 1 词尾的有限截断相同字符串后可能变化一个字符时 则在其后使用一个 例如用system 可以查出sytem和systems的文献 相同字符串后可能变化两个以上字符时 则在其后连续使用若干个 代替可能变化的字符 例如 表示两个字符 表示三个字符 以此类推 2 词尾的无限截断相同字符串后可能变化任何字符串时 则在其后使用一个 这种方法可以查找出含有相同字符串的所有检索词 例如 comput 可查出compute computer computing computation computerisation等等 2 中间截词中间截词又称中间屏蔽 是一种用截词符屏蔽词中不同字符的方法 例如 woman 和 women 可用 wom n 代替 defence 和 defense 可用 defen e 代替 截词符具有 OR 运算符的功能 能够扩大检索范围 而且减少了输入检索词的时间 节约了机时 4 字段限制检索1 检索系统中的限制检索在检索系统中 使用缩小和限定检索范围的方法称为限制检索 限定检索条件多种多样 主要和常用的是字段限制 通常数据库中可供检索的字段分为主题字段和非主题字段 其中 主题字段如题名 Title 叙词 Descriptor 标识词 Identifier 文摘 Abstract 等 非主题字段如作者 Author 文献类型 DocumentType 语种 Language 出版年份 PublicationYear 等 2 搜索引擎中的限制检索搜索引擎中的字段检索多表现为前缀符限制形式 其中 表示内容特征的主题字段有Title Keywords Subject Summary等 表示外部特征的非主题字段限制有image text等 此外 搜索引擎还提供了带有典型网络检索特征的字段限制类型 如主机名限制 host URL限制 url E mail限制 from 新闻组限制 newsgroups Link限制 link 网址限制 site 等 这些字段限定了检索词在记录中出现的位置 用来控制检索结果的相关性 5 短语检索短语用 表示 检索出与 内形式完全相同的短语 以提高检索的精度和准确度 因而也有人称之为 精确检索 exactsearch 6 括号检索用于改变运算的先后次序 括号内的运算优先进行 7 自然语言检索即直接采用自然语言中的字 词 句进行提问式检索 同一般口语一样 如 布什是谁 流星是什么 这种基于自然语言的检索方式又被称为 智能检索 intelligentsearch 特别适合不太熟悉网络检索技术的人士使用 支持自然语言检索的又中文的baidu 英文的google AltaVista Excite Infoseek HotBot AskJeeves等 8 多语种检索提供多种语言的检索环境供用户选择 系统按用户选定的语种进行检索并反馈结果 支持多语种检索的如中文天网 英文AltaVista等 9 模糊检索又称概念检索 当我们输入一个检索词时 搜索引擎不仅反馈包括了该关键词的网址 同时也发来与关键词意义相近的内容 例如 我们查找 查询 一词时 模糊检索会反馈来包含了 查询 查找 查一查 寻找 搜索 等内容的网址 反馈网址的排列 一般是完全符合关键词的在最前边 其次是相近的 现在大多数搜索引擎都有这种功能 只是模糊的程度不同 10 区分大小写的检索输入时 如果用户的检索式用小写字母表示 搜索工具既匹配大写又匹配小写 如china 将检索出china 瓷器 China 中国 但如果用大写字母表示 搜索工具认为用户指定了只要大写 就只会查找那些与用户键入的输入形式完全相同的结果 如China 只检索出China 以上十种检索方法中 自然语言检索 模糊检索 多语种检索和区分大小写的检索是网络检索所特有的 在实际的检索中 往往将上述多种检索技术混合使用 如要查找标题中含有 网络营销 的资料 可以利用布尔逻辑运算符AND OR和截词检索 区分大小写检索 并将检索结果限制在题名字段 ti WebORInternetORWWW ANDmarket 一 检索表达式及构成要素二 计算机检索策略的制定三 调整计算机检索策略 计算机检索策略 又称计算机检索提问逻辑 是对计算机检索的全面规划 在操作上主要指检索系统和文献数据库的选择和检索表达式的编制 1 分析检索课题 明确检索目的2 选择检索系统和文献数据库3 确定检索词及检索途径4 制定检索表达式和检索顺序 一 检索表达式及构成要素二 计算机检索策略的制定三 调整计算机检索策略 调整策略之间 首先分析造成检索结果不理想的原因 对于检索出文献数量较多的情况 应分析是否可能是如下原因造成 a选用了多个多义性的检索词b截词截得过短c输入的检索词d应该使用 与 AND 却使用了 或 OR e优先运算符 使用错误 对于检索出文献数量较少的情况 应分享是否是如下原因造成 a检索词输入错误b遗漏重要的同义词或隐含概念c检索词过于具体d没有使用截词算符e位置算符和字段算符号使用的过多f使用过多的 与 AND 算符 针对上述原因 如果属于需要扩大检索范围 提高检索结果检全率的 调整策略的方法有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外架承包合同4篇
- 2025贵州黔南州瓮水街道招聘公益性岗位人员20人模拟试卷带答案详解
- 2025哈尔滨铁道职业技术学院辅导员招聘5人考前自测高频考点模拟试题及完整答案详解
- 2025年上海事业单位真题
- 2025年福建省泉州市华侨大学分析测试中心招聘模拟试卷附答案详解(考试直接用)
- 2025河南中医药大学第一附属医院(郑州)招聘131名考前自测高频考点模拟试题及答案详解(夺冠)
- 助理个人工作总结合集15篇
- 2025辽宁抚顺高新热电有限责任公司招聘专业技术人员的二次考前自测高频考点模拟试题及答案详解(各地真题)
- 2025黑龙江黑河北安市招聘乡村医生21人模拟试卷及一套答案详解
- 2025河南推拿职业学院招聘6人考前自测高频考点模拟试题附答案详解(黄金题型)
- 2022年全国中学生生物学竞赛(上海赛区)(有解析)
- 公开课氯气的性质课件省公开课金奖全国赛课一等奖微课获奖课件
- 基本公共卫生服务居民健康档案课件
- 10kV试验报告模板-大全
- 英语专业导论(第2版)PPT完整全套教学课件
- 民航安检理论与实务整套教学课件
- 软式棒垒球-上手传接球教案高一上学期体育与健康人教版
- 生物医药强国战略研究
- 舒适护理:床上擦浴
- GB/T 23985-2009色漆和清漆挥发性有机化合物(VOC)含量的测定差值法
- 卓乐对刀仪说明书
评论
0/150
提交评论