2计算机检索基本知识_ppt课件_第1页
2计算机检索基本知识_ppt课件_第2页
2计算机检索基本知识_ppt课件_第3页
2计算机检索基本知识_ppt课件_第4页
2计算机检索基本知识_ppt课件_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单击此处编辑母版标题样式 单击此处编辑母版副标题样式 *青岛理工大学图书馆1 计算机检索基本方法 p贾芳华 p pQQ:149552480 p青岛理工大学图书馆信息部 第一节 计算机检索的基本概念和技术 一、计算机检索的概念: 计算机检索:就是在人和计算机的共同作用下 完成的文献信息的存取操作。它是指信息用户 借助于特定的计算机系统,通过科学合理的手 段和途径,从其存储的大量数据信息中获取自 己所需特定信息的过程。可分单机检索、联机 检索和网络检索三大类。 p单机检索指一人一机交互作用完成的检索。 p联机检索指用户利用检索终端,通过通信网 络接通中心检索系统,由中心检索系统根据用户 构造的检索策略查出用户所需特定信息的过程。 p网络检索借助于开放式的网络系统完成的信 息查询操作。 p网络检索本身包含了两重含义: n利用网络通道完成联机检索,是利用网络这一通道检 索上网的专业性数据库和联机检索服务系统,必须遵 守传统的计算机联机检索的基本规则,其实质仍属于 联机检索的范畴; n网络搜索。主要指基于搜索引擎的网络信息检索。搜 索引擎在网上所起的作用就像我们平常查阅科技文献 时所用到的EI和SCI。 二、计算机检索技术 常见文本检索技术包括: l布尔逻辑检索 l字段检索 l位置算符检索 l加权检索 l截词检索 l短语检索等 p逻辑算符举例 n查找关于“动物保护”的文献: “动物”和“保护” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检 出记录中既涉及动物又涉及保护的相关文献。 n查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者 要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献 中包含三者任意一种即被检出。 n查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 n检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽 培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番 茄)*(种植+栽培+培育) 项目名称:耐高温粘接剂研究 维普: (题名=高温*粘接剂) 9篇 维普: (题名=高温*(粘接剂+胶粘剂+粘合剂+粘结剂 +黏合剂+胶黏剂+粘固剂+胶结剂) 195篇 p运算优先级顺序为NOT、AND、OR,可以用括号 “( )”改变它们的运算顺序。 如A and (B or C),检索顺序为先B或C,然后再与A p在某数据库中,用A检索得到100条结果,用B检 索得到70条结果,那么: 1.【A AND B】最多有_条结果,最少有_条结果; 2.【A OR B】最多有_条结果,最少有_条结果; 3.【A NOT B】最多有_条结果,最少有_条结果。 2.字段检索 是限定检索词在资源记录中出现的字段范围 的一种检索方法, 例如VIP中 T限定检索词出现在题名中 K= 限定检索词出现在关键词字段中 EBSCO中主要字段代码: p作者-AU p文章题名TI p全文TX p文摘AB p关键词(作者给出)KW p主题SU p刊名SO p国际统一刊号IS p图像FM 字段限制检索使用方法:先键入字段代码,然后输入检索式,如“TI information W2 management”。 作者的输入方式特别规定为“姓,名”格式,如“AU Wiley, Ralph”。 3.位置算符检索 位置检索是通过对各个检索词在检索结果中出现的相 对位置进行限定的一种检索方法。按照对各检索词之 间应该满足的位置关系要求的不同,可以有多种不同 类型的位置检索,例如邻近检索、同句检索、同字段 检索等。 p例如(CNKI中) 1、检索在摘要的一句中顺序包含“遗传学”、“农业”,并且间隔 小于2个词的期刊文章。 检索式:摘要=遗传学 /PREV 2 农业 2、查找王维的一首诗,诗中包含“晚来秋、清泉石上流”,要求 查找全诗及诗名。 检索式:全文=晚来秋 /SEN 2 清泉石上流 (同段,在两句之内 按词序出现) 4.加权检索 该法是从量的角度对检索词加以限制和表述, 其侧重点不在于判定检索词或字符串与别的检 索词或字符串是什么关系,而在于判定检索词 或字符串在满足检索逻辑后对文献命中与否的 影响程度。它强调的是检索词之与命中文献( 或课题)的相关程度和重要程度。 例如CNKI中 =str $ N设定检索词出现的次数 5.截词检索 又称部分一致检索,是在检索词的适当位置 进行截断,然后使用截词符代替,利用截断 的词的一部分进行检索。它利用某些检索词 的词干或不完整词形加上截词符,以表达概 念的完整意义进行检索。其实质是利用计算 机特有的指定位对比判断功能进行检索词与 索引词之间的对比匹配。可有效处理具有同 一词干的检索词,名词的单复数、动词不同 形式,英美不同拼写等,有助于提高查全率 例如 p无限后截断 physic*可将physic, physical, physician, physicist, physicists纳入检索范围 p有限后截断 acid? 可将acid, acids, acidic纳入检 索范围 p前截词 *computer 将检索出 computer、 minicomputer 、 microcomputer等单词的文献。 p中截断(屏蔽检索) colo?r 可将colour, color纳入检索 范围 propell?nt? 可将propellant,propellants,propellent, propellents纳入检索范围 6.短语检索 短语检索是使用专门的运算符号把多个检索词汇组织 成特定的短语,完成检索任务。是一种固定词组检索 。一般使用“”(英文半角)。例如使用“联想电脑”作 为入口词,其检索效果就比使用“联想产品*电脑”好, 更比使用“联想*电脑”的字面组配形式好的多。 很多通信类专业术语的缩略语中间都带有“-”符号(如 -,-,-,- 等),使用这些缩略语检索的时候有两种处理方法:一 是用逻辑“与”(*);二是要用上下引号(“”)把词语引起 来作为一个整体(短语)检索。否则检索结果就会有 很大的出入。 除以上几种主要的检索技术与方法外,文本信息还 有一些辅助性的检索技术与方法: p检索结果的排序输出。 p导航与浏览 p检索结果的可视化 p检索结果的翻译 p区分大小写检索 p繁简体汉字转换 p中英文混合检索 ASCE检索规则 通配符 布尔逻辑算符 浏览相关记录后,用“社会保障”取代“社会保障 制度”,以减少限制条件,其命中量大幅增长; 再舍去“研究”一词,查 全率明显提高。 在检索中对于一些不能明确表达主题内容、没有检索意义的泛指概念 ( 如研究、方法、作用等) ,一般不宜使用。通过初步摸底后再进行主 题分析,确定了3个主要的概念组面“中国”、“社会保障”、“综述”; 经 过多次“交互扫描”后的浏览、分析、选择,尽可能全面地选取表达各 概念组面的相关检索词; 然后确定最终的检索式,便可以进行正式检 索了。 由于查全率和查准率之间存在着一种“互逆”关系,因此高查全率和高查准率 难以同时获得; 在检索时,应该根据实际需要,对检索结果的查全率或查准率 有所侧重。 n1) 如要确保查准率,便限定在题名字段检索,其检索式如下: (中国+ 我国+ 国内+ 全国) * (社会保障+ 社保)* (综述+ 述评+ 评述) n2) 若要提高查全率,首先可以考虑去掉“中国”这个概念组面( 在国内数据 库检索时,可以省略) ,增加命中量; 另外指定在“题名或关键词”字段搜 索,以扩大查找范围。故使用下列检索式: (社会保障+ 社保) * (综述+ 述评+ 评述) 有些仅从题名无法识别的综述、述评文献,因维普期刊库二次加工标引的关 键词“综述”、“述评”可被检索到。通过进一步浏览,分析命中文献,发现与“ 社会保障”相关的词语还有“社会福利”、“社会救助”、“社会保险”、“社会养老 ”,等等,因此再增补检索式如下: 社会* ( 福利+ 救助+ 保险+ 养老+ 就业) * ( 综述+ 述评+ 评述) 最终获得理想的查全效果。 7、编排具体的检索程序 n如果是同时结合使用多种检索手段:则应确定各种手 段的先后; n如果选用了多种工具或系统:则应确定使用各种工具 的先后(一般按相关程度安排先后); n如果准备了多个检索提问式,则应排出使用的先后顺 序。 8、检索式的反馈调整 n试检并初步浏览检索结果 n使用合适的相关反馈调整方法,对检索结果进行优化 “变”是检索策略的永恒主题 一个令人满意的检索工作基本都是在 “检索 阅读 策略调整 再检索” 的过程中不断调整和完善的 三、正式检索 输入检索词或检索式 四、获取并整理检索结果 获得了比较满意的结果后,要进行结果的整理, 包括输出格式、显示顺序、去重、全文下载等。 五、分析评价检索操作与检索结果 最后环节是对本次检索进行分析和评价,主要包括: n检索结果分析 n检索系统功能的评价和认识 n检索操作中存在的主要问题等。 一般在对检索操作和检索结果进行分析和评价时,需要涉 及并使用到很多指标,最为常用和重要的两个检索效果评 价指标就时查全率和查准率。 p计算机检索的步骤 n课题分析 n选择检索系统 n确定检索途径和检索方法 n确定检索词 n制定检索策略,编制检索式 n实施检索、分析检索结果、索取原文 n调整检索式,优化策略 检索案例1 课题:一种海水淡化的方法及装置 一、内容要点: 本方法采用精馏法,尤其是减压精馏法来除盐。其 主要特征: 1.在脱盐器(精馏塔)内有分离介质,如填料或分离 塔板等; 2.有明确的精馏段、提馏段; 3.塔顶有回流控制装置。 二、选用的检索数据库 中文科技期刊数据库 中国学术期刊全文数据库 中国优秀学术论文数据库 中国学位论文全文数据库 EBSCO Springer 三、选用的检索词及检索策略 p中文词: 海水? 脱盐 淡化? 海水脱盐 海水淡化? p外文词 sea water(seawater海水);desal?(desalinate 、desalt、desalinize,etc脱盐);distill?(蒸馏 );rectif?(精馏);fractionat?(分馏); reflux(回流);backflow(回流、逆流) 中文数据库 1、海水?and (脱盐?or 淡化?) 2、海水脱盐?or海水淡化? 3、#1 or #2 外文数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论