版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章社科信息检索工具第一页,共三十九页,2022年,8月28日第一节信息检索的概念1、检索的起源信息检索起源于图书馆的参考咨询和文摘索引工作.从19世纪下半叶开始发展,至20世纪40年代.索引和检索已成为图书馆独立的工具和用户服务项目。20世纪中叶以前,信息存储和传播主要以纸质介质为载体,信息检索活动也围绕着文献的获取和控制展开。第二页,共三十九页,2022年,8月28日2、检索的基本原理信息检索是指将信息按照一定的方式组织和存储起来,并根据用户的需要,找出所需信息的过程。广义的信息检索包括信息的存储和检索两个过程,而狭义的信息检索只包括后一个过程,即为处理解决各种问题而查找信息的存储过程就是按照主题词表或分类表及使用原则对原始信息资源进行处理,形成信息特征标识,为检索提供经过整序的信息集合的过程。第三页,共三十九页,2022年,8月28日信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:
第四页,共三十九页,2022年,8月28日3、信息检索手段从技术手段上分:手工检索(手检)和计算机检索(机检)手工检索(manualretrieval)使用的多为印刷型或书本型检索(paper-basedretrieval)工具,早些有检索卡片,现在使用最多的是检索刊,它们定期地将最新收集到的信息、文献加以汇总、组织和报道。手检的技术要求不高,以人的劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。手检工具能提供的检索点十分有限,检索结果往往不尽人意。第五页,共三十九页,2022年,8月28日计算机检索(computer-basedretrieval)
它通过数据库系统来实现的。
检索系统包括:计算机主机设备、外部存贮器、输入输出设备、终端设备、通信设备等硬件设施,还需要控制、提供检索的软件系统,包括:通信软件、操作系统、应用程序等,以实现对数据库的信息存取。
检索过程是在人与机器的合作、协同下完成的,它们经常用实时的(realtime)、交互的(interactive)的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。计算、比较、选择的匹配任务是由机器来执行的,而人则是整个检索方案的设计者和操纵者。第六页,共三十九页,2022年,8月28日计算机检索的优势计算机检索明显优于手工检索,主要表现:检索的信息量大、数据更新快、检索功能强、检索结果输出的多样性。第七页,共三十九页,2022年,8月28日第二节社科信息检索工具2.1.1检索工具的定义检索工具是人们用来报道、存储和查找各类信息的工具。包括传统的二次、三次印刷型检索工具,缩微阅读检索工具,基于计算机的光盘检索系统、联机检索系统,以及基于Internet的网络信息检索系统、网上工具书、搜索引擎、Archie、Wais等各种信息检索工具和检索系统。
第八页,共三十九页,2022年,8月28日检索工具的类型按照检索手段的不同,检索工具可分为手工检索工具、机械检索工具和计算机检索系统。按照著录形式的不同可分为:目录型检索工具、题录型检索工具、索引型检索工具、文摘型检索工具、全文型检索工具等。按照载体形式的不同可分为:书本式检索工具、卡片式检索工具、缩微式检索工具和机读式检索工具等。第九页,共三十九页,2022年,8月28日2.1.2手工检索工具手工检索工具是传统的检索工具,主要是各种类型的工具书。工具书是人们根据一定的需要,广泛收集某一范围的有关资料,按特定体例或方式编排,提供基本知识和文献线索的一种特殊类型的图书,是检索文献信息的重要工具。根据工具书的体例和功用,可分为检索类工具书、词语类工具书、资料类工具书、表谱类工具书、图录类工具书和边缘类工具书六种类型。下面对此分别介绍
第十页,共三十九页,2022年,8月28日检索类工具书按著录内容划分,检索类工具书大致可分为以下四种:目录、题录、文摘、索引。目录(Bibliography/Catalogue):通常是以文献的“本”、“种”、“件”等为单位,对一批相关文献外表特征的揭示和报道。例如:《全国新书目》、《全国总书目》、《全国报刊简明目录》等。题录(Title):它报道和揭示单篇文献的外表特征,是在目录的基础上发展起来的一种检索工具。它与目录的主要不同点在于著录的对象不同,目录的著录对象是整部文献,而题录的著录对象是文献中的论文或部分内容。例如:美国《化学题录》、《中文科技期刊题录数据库》等。第十一页,共三十九页,2022年,8月28日文摘(Abstract):是系统著录、报道、积累和揭示文献信息外表特征和内容特征的检索工具,是重要的二次文献。它是对文献中的论文或内容进行浓缩,概括地描述其主要论点、数据、结论等,并著名其出处,按一定的规则编排起来的一种检索工具。文摘分三种:指示性文摘、报道性文摘和评论性文摘。例如:《新华文摘》、《经济学文摘》等。索引(Index):是将文献信息中的题名、人名、地名、字句及参考文献等分别摘录出来,并著名出处,按一定的规则编排起来的一种检索工具。例如:《经济科学论文索引》、《社会科学引文索引》(SocialScienceCitationIndex,SSCI)等。第十二页,共三十九页,2022年,8月28日传统的手工目录卡片第十三页,共三十九页,2022年,8月28日现在传统目录卡片已被电子目录替代电子目录各项著录有序,有标目,馆藏目录还常带有馆藏地点、馆藏状态、索书号等项列表,以下是INNOPAC的中英文电子目录。
第十四页,共三十九页,2022年,8月28日题录(bibliography,bibliographiccitation)也是对文献外部特征的描述,由一组数据项的固定组合形成题录型条目,书写、印刷型条目如“文献类型的识别”一节中的样例。题录一般以内容上独立的文献单元,如一篇文章或书中某一部分、某一章节或整个出版物作为其著录的基本单位。以下是一条电子条目。题录通常包括:作者(或含其所在单位)、篇名和来源出处及文种等,由出处导向原文。
第十五页,共三十九页,2022年,8月28日文摘Abstract(原意“抽取”)
文摘分:1)指示性文摘——指示性文摘侧重揭示文献的主题、研究方法、结论、用途和参考价值,不涉及具体的内容。2)报导性文摘——报导性文摘比较详细地报导文献的主要内容、观点、方法、设施,以及必要的数据、图表和参考资料。3)评论性文摘(criticalabstract),其中包括文摘评论员的分析与评介。文摘是对一份文献的内容做实质性的简略、准确的描述,无须补充解释和评论。它用少量的文字将文献浓缩加工,以揭示文献的主要观点、论据、数据等,是当代报导学术动态的简捷明快的方法。检索者可以从文摘中直接找到所需信息,如果不满足,再去查找原文。从这个意义上说,文摘是集书目、索引和一次文献三者于一体的特殊检索工具。第十六页,共三十九页,2022年,8月28日文献的文摘型电子条目如下:第十七页,共三十九页,2022年,8月28日词语类工具书词语类工具书包括各类字典、词典,主要提供字词的形、音、义和使用方法,以及学科名词术语的含义、演变和发展。字典以字为单位,按一定次序排列,说明形体、读音、意义和用法;词典,也作辞典,以词语为单位,按一定次序排列,解释词汇的概念、含义和用法。例如:《辞海》、《汉语成语大词典》、《社会科学大词典》等。第十八页,共三十九页,2022年,8月28日资料类工具书资料类工具书能够为读者提供各种基本知识或某一课题的具体资料。主要包括百科全书、年鉴、手册、名录、类书、政书等。百科全书是人类知识的总汇,是记录人类知识最全面、最系统的大型综合性工具书。它概述了人类—切知识领域的基本资料,对每一学科提供定义、原理、方法、历史及现状、系统和参考书目等方面的资料,被誉为“工具书之王”、“没有围墙的大学”。年鉴是汇辑一年内时事动态、学科发展和各项统计资料等重要资料,按年度出版的工具书。手册也称指南、便览、大全等,是把某一学科或某一专题的概括性又具体实用的知识、资料和数据汇编在一起。名录是专门收录人名、地名、机构名以及其他事物名,按照一定规则进行排序,并予以简要揭示和介绍的工具书。类书是收录古代文献资料,按类别或韵目编排,提供检索、征引使用的工具书。政书是汇集历代或某一朝代的政治、军事、经济、文化、外交等方面的法律、法令和法规制度史料的工具书。第十九页,共三十九页,2022年,8月28日表谱类工具书表谱类工具书是以表格或其他较为整齐的形式,记录史实、时间、地理等资料,并附以简略的文字说明,以反映史实和时间。主要包括年表、历表和专门性历史表谱3种类型。年表是按年代顺序编制,专供查考历史年代、历史纪元及历史大事的检索工具。如《中华人民共和国大事记》等。历表是一种把不同历法的历日按一定的次序汇编在一起,以相互对照的表格,提供查找和换算不同历法的年、月、日的工具书。专门性历史表谱主要用于查考人物、职官、地理和数据等专题资料,如《中西回史日历》等。第二十页,共三十九页,2022年,8月28日图录类工具书图录类工具书是以图形、图像、符号等为主体,附以简略的文字说明,以反映各种事物、人物的空间特征和形象特征的工具书。它包括地图、历史图录、文物图录、人物图录、艺术图录、科技图像等。地图是地球表面自然和社会现象在平面图上的缩影,以反映各种事物和景象的地理分布及其在空间与时间上的相互制约、内在联系和发展动态。历史图录是以图形、图像等揭示历史人物和事物的工具书。第二十一页,共三十九页,2022年,8月28日.边缘类工具书边缘类工具书主要指那些介于工具书与非工具书之间,既具有一般图书的阅读功能,又具有工具书的查检功用的文献。它主要包括资料汇编、史书、方志等。资料汇编有针对性地摘编文献信息的片断或全文,按专题或学科分类编排,提供读者阅读或查检。包括法规资料汇编、条约资料汇编、统计资料汇编等。第二十二页,共三十九页,2022年,8月28日2.1.3机械检索工具机械检索工具是手工检索工具向计算机检索系统过渡的中间检索工具。它主要包括两种类型:机电检索工具(如打孔机)和光电检索工具(如缩微机)。机械检索工具利用机械装置改进信息资源的存储和检索方式,但是只能对某一固定存储形式的信息资源进行特定检索,过分依赖于设备,检索操作复杂,成本很高,并且检索质量和效率也不理想。所以很快被计算机检索系统所取代。第二十三页,共三十九页,2022年,8月28日2.1.4数据库数据库的类型:数据库的类型多种多样。数据库有网状数据库、层次数据库、面向对象数据库、Web数据库、多媒体数据库、移动数据库、智能数据库、实时数据库、并行数据库、分布式数据库、联邦式数据库、模糊数据库、演绎数据库和统计数据库等。第二十四页,共三十九页,2022年,8月28日数据库的类型11.按信息处理层次划分,数据库可分为书目数据库、文摘数据库和全文数据库。全文数据库:全文数据库(Full-textdatabase)是将文献全文以机读版的形式存储起来,并可与相应的软件配合提供文中检索和全文输出的数据库。第二十五页,共三十九页,2022年,8月28日数据库的类型22.按照收录的文献类型划分分为期刊论文数据库、书目及图书全文数据库、专利数据库、学位论文数据库和产品数据库等。3.根据收录文献信息的范围划分分为综合性数据库和专业性数据库。4.按媒体信息划分分为文本数据库、数值数据库、声音数据库、图像数据库、视频数据库和多媒体数据库。第二十六页,共三十九页,2022年,8月28日数据库的结构数据库一般由文档、记录、字段这三个自上而下的层次构成。通常一个数据库至少包括一个顺排文档和一个倒排文档。顺排文档是按文献记录的输入顺序(即文献序号)排列的文档,又称为主文档。它将全部记录按照存取号的大小顺序依次排列形成文献信息集合,是数据库的主体内容。第二十七页,共三十九页,2022年,8月28日倒排文档倒排文档是把顺排文档中的标引词抽出,按标引词的字母顺序依次排列而成的文档。如果将顺排文档看作是某种印刷型检索工具的正文部分,那么倒排文档就相当于它的辅助索引。
第二十八页,共三十九页,2022年,8月28日字段(Field)在文摘数据库中,一条记录应包含原始文献的题名、作者、出处、出版时间、分类号、文摘、主题词或关键词等字段。每一个字段都有一个相应的标识符,以便计算机识别。例如在Dialog系统中,常用标识符及含义为:标识符字段名au= 作者字段jn= 期刊名称字段py= 出版年字段cs=机构名称字段dt=文献类型字段la=语种字段第二十九页,共三十九页,2022年,8月28日2.1.5计算机检索系统计算机检索系统一般可分为光盘检索系统、联机检索系统和网络检索系统等。联机检索(OnlineRetrieval)是20世纪60年代发展起来的一种提供人机对话的检索技术,是指用户利用终端设备(包括检索终端、调制解调器和打印机),通过国际(卫星)通信网络,与本地计算机检索系统或远程计算机检索系统的主机联结,从而检索世界各地存储在计算机数据库中的信息资料。第三十页,共三十九页,2022年,8月28日联机检索系统联机检索系统主要有以下四种服务方式:(1)回溯检索(RS,RetrospectiveSearch)是用户对检索系统中积累多年的文献信息数据库进行检索,查找一定时间范围内或特定时间以前的文献信息的一种联机检索方式。通过RS进行专题检索或情报调研,可全面系统地了解有关文献信息的线索。(2)定题检索(SDI,SelectiveDisseminationofInformation)是指在回溯检索的基础上,定期从文献数据库中检索出回溯检索日之后出现的新的文献信息的一种联机检索方式。(3)联机订购联机检索的结果通常是一些文摘或题录形式的二次文献。联机检索系统可以为用户提供原始文献的联机订购服务。(4)电子邮件联机检索系统为用户提供E-mail和电子邮政的功能。第三十一页,共三十九页,2022年,8月28日网络检索系统网络检索系统是通过因特网提供网络数据库、出版物、书目、动态信息等网上信息资源查询和利用的检索系统。早期的网络检索工具主要是基于传输和下载网上信息,包括远程登录(Telnet)、文件传输服务(FTP)、电子邮件(E-mail)、电子公告栏(BBS)、新闻组(USENET)等。FTP获取信息资源的最大问题是查找需要的资料必须预先知道这些资料存放在哪个文件服务器中,随着FTP服务器的增多,这个问题变得越来越严重,于是人们就开发出Archie、WAIS、Gopher系统,以解决寻找FTP资源的困难。第三十二页,共三十九页,2022年,8月28日2.2检索途径信息检索途径一般包括文献信息的内容特征途径和外表特征途径。内容特征途径:主题途径分类途径代码途径外表特征途径:题名途径责任者途径机构名称编号途径其它途径第三十三页,共三十九页,2022年,8月28日内容特征途径1.主题途径主题途径是按文献信息的内容主题进行检索的途径,对课题进行主题概念分析,提炼主题概念,选择能表达主题概念的语词,确定主题词、关键词、叙词或标题词。传统的手工检索依据的是各种主题索引或关键词索引,主题索引或关键词索引按检索词的字顺排列,用户根据确定的检索词按照字顺进行查找,从检索词下的索引款目,即可找到所需文献的线索。计算机检索视检索系统的检索规则而定,如检索系统提供了主题词索引,用户必须先查主题词索引,然后使用规范的检索词才能检索。2.分类途径分类途径是一种按照文献信息所属学科(专业)类别进行检索的途径。对课题内容进行分类分析,按分类法进行分类,获取分类号。传统的手工检索依据的是按分类编排的分类目次表或分类索引,按类逐级进行检索。计算机检索时提交分类号进行检索即可。分类检索能较好地满足族性检索的要求,提高课题信息的查全率。第三十四页,共三十九页,2022年,8月28日2.3检索标识检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。它与检索途径相对应,是检索途径的具体化。如主题途径的检索标识就是主题词,分类途径的检索标识是分类号,著者途径的检索标识是著者姓名,其它的则依此类推。第三十五页,共三十九页,2022年,8月28日检索标识的确定检索标识的确定,一般应考虑以下基本原则:(1)检索标识必须反映课题内容和信息需求。(2)检索标识和数据库的标引标识应相一致。(3)所选检索工具或系统具有叙词表或主题词表的,优先选用叙词
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 邢台市新河县2025-2026学年第二学期三年级语文第五单元测试卷部编版含答案
- 巢湖市庐江县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 鹤壁市淇县2025-2026学年第二学期三年级语文期中考试卷(部编版含答案)
- 长沙市望城县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 渠道拓展方案
- 深度解析(2026)《CBT 3798-2016船舶钢制舾装件涂装要求》
- 深度解析(2026)《2026年退役光伏组件回收处理企业的商业模式与绿色融资渠道》
- 嫁接理论考试试卷及答案
- 9《端午粽》跨学科公开课一等奖创新教学设计
- 社会学资格考试中等试题及答案
- 2025福建省晋华集成电路有限公司校园招聘笔试历年常考点试题专练附带答案详解
- 哔哩哔哩国创线下活动招商方案
- 2026年甘肃甘南碌曲县卫健系统招聘工作人员50人笔试备考题库及答案解析
- 国际税收 课件全套 张伦伦 第1-10章 国际税收概论 -国际税收发展
- 4.1 人要有自信 课件 2025-2026学年统编版道德与法治七年级下册
- 2026年消防设施操作员(中级监控)真题及答案
- 山东电工电气集团招聘笔试题库2026
- 传统医学出师考核和确有专长考核实施方案(试行)
- 2026年大连职业技术学院单招职业技能考试题库及答案详解(名师系列)
- 高级卒中中心建设与管理指南
- 天津市河东区2025-2026学年高三一模检测试题生物试题试卷含解析
评论
0/150
提交评论