版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Information RetrievalInformation Retrieval(IRIR) 蔡志勇蔡志勇 中国化工信息中心中国化工信息中心20062006年年8 8月月 网络信息检索网络信息检索v基础知识vInternet 网上的主要科技信息资源 v国家科技图书文献中心网络服务系统信息源信息源 在图书情报领域,信息源被解释在图书情报领域,信息源被解释为为“人们在科研活动、生产经营活动人们在科研活动、生产经营活动和其它一切活动中所产生的成果和各和其它一切活动中所产生的成果和各种原始记录,以及对这些成果和原始种原始记录,以及对这些成果和原始记录加工整理得到的成品记录加工整理得到的成品” 存在
2、形式存在形式v记忆:记忆: 口头信息源口头信息源 非文献信息源非文献信息源v实物:实物: 实物信息源实物信息源v文献:文献: 文献信息源文献信息源文献信息源文献信息源v文献是“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。 按文献生产加工层次划分的按文献生产加工层次划分的文献形式文献形式v一次文献v二次文献v三次文献 一次文献 v专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献 v人们对自然和社会信息进行首次加工(固化)而成的文字记载 v内容上是分散的、无系统的 v不便于管理和传播 二次文献 v目录、书目、索引、文摘 v对一次文献进行再加工,通过整理、提炼和压缩 v按
3、其外部特征(题名、作者、文献物理特征)和内容特征序化 v一次文献特征的汇集 三次文献 v专题报告、综述、进展以及手册、百科全书、年鉴 v利用二次文献,选择有关的一次文献再加以分析、综合 v系统性、综合性、知识性和概括性 v高效率地了解某一领域的状况、动态、发展趋势和有关情况 主要的一次文献信息源v图书 v期刊 v报纸 v专利文献 v标准文献 v产品样本 v会议文献 v“灰色文献” v档案文献 v科技报告 v政府出版物 v学位论文 其他信息来源v解剖分析实物样品v参加会议v参观考察v学术交流v引进技术v外贸往来v电视、广播网络信息源网络信息源v利用网络是当今获取信息的最主要途径(首选) v无时间
4、和空间限制 v文字、图像、影视、声音等多种媒体 v数据库、全文文本、电子函件、文件传输、电子布告、电子论坛等多种服务v人工智能、专家系统、超文本、友好界面等检索技术 v服务内容、方式、深度、广度、效果和效益 文献检索基础知识 用户利用文献信息检索语言在文献信息检索系统(工具书、印本文摘、数据库、网站、搜索引擎等)中,通过检索途径:如题名、著者、分类号、主题词、关键词、ISSN、ISBN等,进行所需文献、信息的查找。数据库内存储的是书目、索引、文摘等二次文献。用户检索到是某主题的一系列文献条目(有文献题名、出处、收藏机构),据此再查找原文对数据库进行数据或数字资料检索,如科研数据、统计数字、化学
5、分子式等或称事项检索。查找专门的事实材料,如名人、机构名录、产品等(1)对原始文献检索(2)用检索词在数据各字段中进行对应扫描和查找以图象、图形或图文信息为检索内容的信息查询以文字、图象、声音等多媒体信息为检索内容的信息查询。通过此检索,各种信息实时集成和处理,使检索界面有声有色、交互友好,检索结果图文并茂、丰富多彩检索语言是文献信息资源系统(数据库、网络信息等)中标识和检索文献信息的计算机识别语言。 题名著者序号引文分类检索主题检索关键词检索从文献外部特征进行检索从文献内部内容进行检索图书分类法以科学分类为基础,结合文献内容性质及其特征(如地区、时代、形式、体裁等),按照一定 的逻辑体系,区
6、分、组织和检索文献的一种方法。国内外著名的图书分类法有:美国国会图书馆图书分类法(LC)杜威十进分类法(DC)国际十进分类法(UDC)中国图书分类法中国图书资料分类法分类检索特征分类检索特征:(1)分类目录浏览有助于无经验用户充分利用等级体系分类表的长处,从学科专业角度获取所需文献信息(2)能按用户所需扩大或缩小检索范围,并可将检索提问限定在某一类目下,提高查准率(3)能检出检索词的上下文内容,消除同形异义词(4)可进行多语种查询(因分类表采用不依赖语种的标识符号,即使用不同的语种编制的分类表索引,通过分类系统的中介转换可实现多语种检索)(5)促进跨库浏览和检索(6)可分成若个专业表进行学科专
7、业文献信息组织与检索(7)有利于网络信息资源的聚类、代码标识来组织信息。表表1 中国图书分类法中国图书分类法基本大类基本大类A 马克思主义、列宁主义、毛泽东思想、 N 自然科学总论 邓小平思想 O 数理科学和化学B 哲学、宗教 P 天文学、地球科学 C 社会科学总论 Q 生物科学E 政治、法律 R 医学、卫生。 。K 历史、地理 Z 综合性图书 表表2 “N 自然科学总论自然科学总论”的二级类目的二级类目 0 自然科学理论与方法论 6 自然科学参考工具书 1 自然科学现状、概况 7 自然科学文献检索工具书 。 。 5 自然科学丛书、。 99 情报学、情报工作中图法是等级分类体系,按照知识概念之
8、间的逻辑关系,逐级组织和检索文献。 中文科技期刊数据库全国报刊索引数据库中国学术期刊全文数据库,中国教育网、“超星“数字图书馆、解放军医学图书馆“医星网”采用中图法进行文献类目组织和检索。文献检索的基本步骤v 明确检索需求,分析检索主题。v 选择相应的检索工具或数据库执行检索。v 确定执行检索的检索词。v 构造检索表达式。v 提交检索表达式。v 显示与优化检索结果,若对检索结果不满意, 修改检索表达式再次执行检索,直到检索到合 适的结果。主要内容文献检索基本方法q布尔检索q字段检索q二次检索q全文检索q模糊检索通过分类,以及通过分类,以及 / 或者或者 对题名、著者、关键词等进行检索对题名、著
9、者、关键词等进行检索目前常用的检索基本方法主要有:布尔检索布尔检索 采用布尔运算符连接检索词进行检索概念的逻辑组配来查询所需文献信息。布尔检索运算符的写法v英文表示:前后词之间要空格v符号表示:不用空格v有的网站,空格表示“与”检索范围v全文检索:准确性差v字段检索:准确性高,甚至是唯一的,如ISBN、ISSN等。全文检索 全文检索有两种含义。一种是指在全文文本中查找含有特定字符串数据的信息,各个因特网网站的站内检索系统以及搜索引擎常为此类;另一种是指在数据库的全部字段中检索。专用数据库系统中常为此类。 字段检索 利用文献信息标引项(刊名、题名、作者、机构、关键词、摘要、分类、ISSN、ISB
10、N等)进行相应文献信息检索检索方法 选择相应的文献信息标引项(字段名),后填写检索词 字段检索二次检索二次检索 : 对一个较广的检索结果范围进行再度缩小范围的检索 二次检索方法 在第一次检索结果的基础上再赋检索词,进行二次检索二次检索模糊检索与精确检索v模糊:包含关系v精确:等于关系v适用于字段检索v全文检索不适用有的系统提供有同义词配置功能。如配置了“电脑”与“computer”为同义词后,检索“电脑”,则包含“computer”的文献也会出现在检索结果中。检索的常用策略 扩检与缩检 扩检与缩检是检索过程中经常面临的问题。用户在检索前应该拟定好扩检与缩检的策略,也就是说,在拟定检索策略时,应
11、该同时考虑如命中文献太少或太多时如何处理的办法。扩检 扩检是指初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法。扩检的方法主要可以有以下几种: 概念的扩大 范围的扩大 增加同义词 年代的扩大。缩检 缩检是指开始的检索范围太大,命中文献太多,或查准率太低,需要增加查准率的一个方法。缩检与扩检相反,即概念的缩小、范围的限定、年代的减少等。此外,还可以通过以下方法进行限定: 核心概念的限定 语种的限定 特定期刊的限定 主要内容截词检索v不同网站不同:?、%、$v提高查全率:如coat%,代表coat、coats、 coating、coated、coatings等v用于某种不确切的情况公开
12、(告)号 =EP 00001494 $位置检索vand :任意位置v空格或引号:词组比较:“environment protection” environment and protectionIR IR 科技期刊经历发展、巩固、竞争、淘汰过程后,出现一批面向某学科、刊载该学科文献信息量最大、质量很高的期刊,称其为“核心期刊”。 核心期刊核心期刊指的是刊载与某一学科(或专业)有关的信息指的是刊载与某一学科(或专业)有关的信息较多,且水平较高,能够反映该学科最新成果和前沿动较多,且水平较高,能够反映该学科最新成果和前沿动态,受到该学科读者特别关注的那些期刊。态,受到该学科读者特别关注的那些期刊。中
13、文核心期刊中文核心期刊要目总揽北京大学图书馆 2004年版外文核心期刊外文核心期刊要目总揽外文核心期刊要目总揽北京大学图书馆北京大学图书馆 20052005年版年版查找IR IR 期刊的影响因子(期刊的影响因子(Impact FactImpact Fact)E. CarfieldE. Carfield 1972 1972年提出年提出 期刊的影响因子是国际通行的衡量期刊质量的一个定量指标。通常, 期刊的影响因子越大,它的学术影响力和作用也就越大。期刊的影响因子:期刊的影响因子: 该刊前该刊前2年发表论文在统计当年被引用的总次数年发表论文在统计当年被引用的总次数 前前2年发表论文总数年发表论文总数
14、外文期刊的影响因子外文期刊的影响因子印本工具书JCR(Journal Citation Reports )ISI Journal Citation Reports (Science Edition) 网络数据库中文期刊的影响因子中文期刊的影响因子中国科学引文库中国科学引文库(中国科学院文献情报中心)(中国科学院文献情报中心)中国知网vhttp:/ vhttp:/v中文期刊:1989开始一次文献资源期刊一次文献资源政府出版物美国四大报告 vPB报告:商业部出版局(office of the publication board vAD报告:ASTIA(美国武装部队技术情报局 ) Document/
15、Accessioned Documents vDOE报告:department of energy 美国能源部 vNASA报告:美国国家航空及宇宙航行局(national aeronautics and space administration NTIS的检索vNSTL网:1990年后(1978年后的可索取原文)vNTIS网站:小部分原文vDialog联机检索: 文档号 6(1964-)NTIS网v主页:National Technical Information Service v1990-v简单检索v高级检索v词组检索:加引号Information Bridge vDOE(美国能源部)的信息之桥 v可以方便快捷的进行全文的免费下载(1995-) v主页:/bridge/index.jsp一次文献资源标准v种类国际标准:ISO、IEC区域性标准:ECMA(欧洲计算机制造商协会)国家标准:GB、ANSI(美)专业标准:ASTM(美国
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 经济预测与分析报告教程
- 游戏策划与用户体验设计技巧
- 电力行业安全教育培训的挑战与对策
- 数字营销策略的优化与创新实践
- 物联网技术下的智能家居智能化发展
- 金融产品风险管理标准化流程
- 政府机构财务透明度提升策略
- 体育教练员面试全解析:教学与训练的要点
- 智慧城市建设的科技支撑与展望
- 行业标准化与企业文化建设的关系
- JJF 2119-2024低气压试验箱校准规范
- 曳引力和导轨计算介绍演示文稿
- 中国移动IP承载网
- 高考备考标点符号专项训练50题
- GB/T 27663-2011全站仪
- 部编人教版道德与法治五年级下册全册课时练习讲解课件
- 高流量湿化治疗仪AIRVOTM操作流程
- 天津市公务员录用审批表相关表格
- 团队训练集茫茫人海
- 思想政治学科教学新论课后习题第二版刘强
- 教师礼仪规范第二章师表课件
评论
0/150
提交评论