文献信息资源检索与利用课件.doc_第1页
文献信息资源检索与利用课件.doc_第2页
文献信息资源检索与利用课件.doc_第3页
文献信息资源检索与利用课件.doc_第4页
文献信息资源检索与利用课件.doc_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献信息检索与利用第1章 文献信息资源与文献信息检索1.1 信息1.1.1 信息的含义: 广义的信息指的是客观世界中各种事物的存在方式和它们的运动状态的反映。用通俗的说法,可以认为信息就是客观世界一切事物存在和运动所能发出的各种信号和消息。 狭义的信息指的是能反映事物存在和运动差异的、能为某种目的带来有用的、可以被理解或被接受的消息、情况等。Information一词理解为狭义的信息时,常被译为情报。 中国国家标准GB4894-85则将关于信息定义的两类表述合并为:信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。1.1.2 信息的特征1.载体依附性 信息既不是物质,也不是能量,它存在于客观事物中,必须依赖一定的载体才能体现出来,如语言、文字、声音、图像等。2.价值性及价值相对性 信息的价值是对客观事物属性反映的深度和真实程度的认识,但信息对不同认识水平的人所产生的作用和有效性也不相同。3.时效性 信息的时效性是信息的重要特征,是指信息从出发、接收到进入利用的时间间隔及其效率。信息的时效性与信息的价值性密不可分。4.可传递性与可扩散性 信息可以进行空间和时间上的传输,传输速度越快,效用就越大。科技的发展,使传播信息的网络覆盖面越来越大,从而使信息得以迅速扩散开来。信息的可扩散性与信息传递技术的发展密切相关,信息的扩散速度与传递技术的发展成正比,即传递技术发展得越快,信息扩散的速度就越快。5.共享性 信息能够同时为多个使用者所利用,信息扩散后,信息载体本身所含的信息量并没有减少。这是信息与实物、能量等的根本区别。6.可加工性 信息的可加工性指的是信息是可以加工处理的,如信息的有序化、压缩、提取和再生。信息通过标引、分类、组织等有序化处理后,便于检索;通过筛选、分析、综合、归纳、总结等,可以发现信息中蕴涵的规律;通过录放机、计算机等设备可以提取存储在磁带、磁盘中的信息;搜集到的信息经过处理后可以用语言、文字、图像等形式再生等。7.具有无限性信息的无限性指无限的信息量可以基于有限的物质,或有限的物质可以包含无限的信息量。1.1.3 信息的分类 按层次分类,信息可分为语法信息、语义信息和语用信息; 按内容分类,信息可分为自然信息和社会信息; 按内容的表现形式分类,信息可分为文献型、数据型、声像型及多媒体型; 按传递方向分类,信息可分为前馈信息和反馈信息。1.2 知识1.2.1 知识的含义: 从广义上来说,知识是人类社会实践活动的经验总结,同时,也是人类社会包括人工环境、人工智能所创造的一切经验形态、智慧形态的总和,并且都外化为知识信息。因此,知识就是经验和信息,其表现形式是人类社会经验和信息的符号系统。 从狭义上讲,知识是人类社会实践创造活动的产物,是一切思想体系、理论体系、工具体系的总和。可以说,知识是现实世界的数字符号系统,是思想、理论、工具、逻辑的数字符号系统。1.2.2 知识的特征1.实用性 虽然知识有不同的定义,但是其共同的特征是具有实用性,知识必须能应用才能称为知识。2.无体性 知识通常通过人力资本与技术才能具体呈现,如传统的书面、文件、口耳相传、物质实体、组织制度,乃至无边的信息网络均成为信息与知识传播的重要渠道。3.无穷性 知识是一种资源,经由创造、分享、累积,可以不断发展。因此与其他资源不同的是,知识是无穷尽的,其他资源会愈用愈少,知识是愈用愈多,有无限潜能。1.2.3 知识的分类 1997年,世界经济合作与发展组织在以知识为基础的经济报告中将知识分为两类。(1)编码知识:又称显性知识,指经过人的整理和组织后,可以编码化和度量,并以文字、公式、计算机程序等形式表现出来,还可以通过正式的、系统化的方式加以传播,便于其他人学习和掌握。(2)意会知识:又称隐性知识,是与人结合在一起的经验性的知识,很难编码化并将其文字化或者公式化,它们在本质上以人为载体,因此难以通过常规的方法收集到它,也难以通过常规的信息工具进行传播。1.3 文献1.3.1 文献的含义1.国际标准化组织文献情报术语国际标准对文献的解释是:“在存储、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存储有信息或数据的载体。”2.文献的三个基本要素: (1)知识;(2)载体(媒介);(3)记录手段(文字、图形、符号、视频、声频等)。1.3.2 文献的等级1.零次文献 零次文献是最原始或者是不正式的记录,大多数未经公开传播,包括口头交谈、参观展览、参加报告会、听取经验交流演讲、实验的原始记录、工程草图等。2.一次文献 一次文献又称原始文献,是以著者本人的研究工作或研究成果为依据撰写的论著、论文、技术说明书等。 判断一次文献不是根据它的载体、存在形式及出版方式,而是根据它的内容性质,只要是作者根据自己的科研成果而发表的原始创作,都属于一次文献。3.二次文献 二次文献是人们把大量的、分散的、无序的一次文献收集起来,按照一定的方式进行加工、整理,使之系统化便于查找而形成的文献。二次文献中的信息是对一次文献信息进行加工和重组而成的,并不是新的信息,它的主要类型有目录、题录、索引、文摘等。4.三次文献 三次文献是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。它通常是围绕着某个专题,利用二次文献搜索的有关的一次文献,采用科学的方法,对文献的内容进行深度的加工、编写而形成的,如各种综述、述评、学科年度总结、年鉴、数据手册等1.3.3 文献的载体类型1.印刷型 印刷型是以纸质材料为载体,以印刷为记录手段而形成的文献形式。如图书、期刊以及各种印刷资料。2. 缩微资料 缩微资料又称为缩微复制品。它是以印刷型文献为母体,采用光学摄影技术,用摄影的方法把文献的影像缩小记录在感光胶卷和胶片上,借助于专门的阅读设备进行阅读的一种文献形式。3.视听资料 视听资料又称声像资料。是一种非文字形式的文献,包括录像资料和录音资料。4.电子出版物 电子出版物是指以数字代码方式将图、文、声、像等信息存储在磁光点介质上,通过计算机或具有类似功能的设备阅读使用的文献,也称计算机阅读型。5.网络出版物 随着计算机技术特别是网络技术的迅猛发展和普及,出现的超文本、超媒体,集文字、声音、图象于一体的网络出版物是通过计算机网络出版发行的正式出版物。1.3.4文献的出版类型1.图书 图书是指以印刷方式单本发行的,内容比较成熟,资料比较系统,有完整定型的装订形式的出版物。2.期刊 期刊也称杂志,指有固定名称,用卷、期或年月顺序编号,以印刷方式复制的,以纸介质为载体的,成册的连续出版物。3.专利文献 专利文献主要是指专利说明书,即专利申请人为取得专利权,向专利主管机关提供的该发明的详细说明书。4.科技报告 科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段性进展报告。5.学位论文 学位论文是指为申请硕士、博士等学位而提交的学术论文。6. 会议文献 会议文献是指各种科学技术会议上所发表的论文、报告稿、讲演稿等与会议有关的文献。7.标准文献 标准文献是指标准化工作的文件,是技术标准、技术规格和技术规则等文献的总称。8.科技档案 科技档案是指单位在技术活动中所形成的技术文件、图纸、图片、原始技术记录等资料,是生产建设和科研活动中用以积累经验、吸取教训和提高质量的重要文献。9.产品技术资料 产品技术资料通常指国内外生产厂商或经销商为推销产品而出版发行的一种商业性宣传产品。10.政府出版物 政府出版物是指各国政府部门及其设立的专门机构发表、出版的文件,可分为行政性文件和科技文献两部分。11.报纸 报纸是有固定名称,以刊载各类最新消息为主,出版周期短的定期连续出版物。 报纸的特点:内容新颖、报道速度快、出版发行量大、影响面宽。1.4 文献交流1.4.1 文献交流论 文献是信息交流的重要物质基础,是以文字、图像、符号、声频、视频等为主要记录手段的一切知识载体,是人们在社会实践活动过程中,为了满足特定需要而创造的。 在人类社会实践的全部活动中,“交流”是不可缺少的部分。交流是一切社会交往的实质。 文献交流是人类交流活动中的重要部分,在文献交流过程中,文献本身是交流的对象,同时又是交流的工具。1.4.2 文献交流的特性 文献交流的本质是对文献及其内容的传递、交流与共享。(1)时效性。文献交流具有较强的时效性,也称为“文献老化”,既有些文献随着时间的推移,其内容价值就减少甚至消失。 也有些文献随着时间的推移,其价值是愈加增强的,如名著、历史文献等。(2)模糊性。由于文献既是物质产品也是精神产品。精神产品在使用的过程中,其价值的测度很难确定。因为文献交流的障碍及交流对象的不同,交流的广度、深度不同,从而影响文献价值的发挥。1.5 信息传播 传播指人类交换信息的一种过程。信息传播是人与人之间通过有意义的符号进行信息传播、信息接受和信息反馈活动的总称。1.5.1 传播的含义1.传播的基本元素是传播者、信息内容、信息通道和受传者。2.传播的基本内容是信息3.传播的基本性质是通过信息运动而展开的社会活动1.5.2 信息化社会信息传播的特征1.全球化2.表现形式多样化3.受众接发信息的主动化 最主要表现为:(1)互动性;(2)个性化;(3)异步性。4.专业化1.5.3 信息传播原则1.真实性原则2.针对性原则3.时效性原则4.有序性原则5.量性原则第2章 文献信息检索基本原理2.1 文献信息检索的原理和意义2.1.1 文献信息检索概念 文献信息检索,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,即从众多的文献信息源中,迅速而准确地查找出符合特定需要的文献信息或文献线索的过程。2.1.2 文献信息检索的类型1.按内容划分 按照文献信息检索的内容,可划分为数据信息检索、事实信息检索和文献信息检索。(1)数据信息检索 以文献中的数据为对象的一种检索,如查找某种材料的电阻,某种金属的熔点。(2)事实信息检索 以文献中的事实为对象,检索某一事件发生的时间、地点或过程,如查找鲁迅生于某年。(3)文献信息检索 以文献原文或关于文献的信息为检索对象的一种检索。2.按组织方式分 按文献信息检索的组织方式,可分为全文检索、超文本检索和超媒体检索。(1)全文检索 是指对存储于数据库中整本书、整篇文章中的任意内容信息的信息检索,用户可以根据自己的需要从中获取有关的章节、段落等信息,还可以进行各种频率统计和内容分析。(2)超文本检索 是对每个节点中所存信息以及信息链构成的网络中信息的检索,是对信息在系统中组织方式不同而言。(3)超媒体检索 是对文本、图像、声音等多种媒体信息的检索,是超文本检索的补充。其存储对象超出了文本范围,融入了静态、动态及声音等多种媒体的信息,信息存储结构也从单维发展成多维,存储空间也在不断扩大。3.按检索设备分 按文献信息检索的检索设备,可分为手工检索和计算机检索。(1)手工检索 简称“手检”,是指人们通过手工的方式来存储和检索信息。(2)计算机检索 计算机检索是指以计算机技术为手段,通过计算机软件技术、网络和数据库及通信系统等现代检索方式进行的信息检索,检索过程是在人、机的协同下完成的。2.2 检索语言2.2.1 检索语言的概念和作用 检索语言是一种人工语言,它是各种信息组织、存储和信息检索时所用的一种语言。 检索语言的作用是标引文献内容、数据和其他信息,把信息的内容特征及其外表特征简明而有效地揭示出来;是连接标引人员和检索人员的思想桥梁,是标引人员和检索人员之间共同遵循的标准语言。2.2.2 检索语言种类 检索语言的种类很多。按描述文献特征的不同,检索语言可分为描述文献外表特征的检索语言和描述文献内容特征的检索语言。 描述文献外表特征的检索语言包括题名(书名、篇名)、著者姓名、号码(专利号、报告号、标准号等)和引文语言(被引用著者姓名和被引用文献的出处)等。 描述文献内容特征的检索语言包括分类语言、主题词语言和代码语言三种。1.体系分类检索语言 体系分类检索语言也叫分类语言,是一种按科学范畴和体系来划分事物的检索语言,按其所属的学科性质进行分类和排列,以阿拉伯数字或以拉丁字母和数字混合作为类目标志符号,以类目的从属关系表达复杂概念及其在系统中的位置,甚至还表示概念与概念之间关系的一种检索语言。 分类语言又分为体系分类语言、组配分类语言和混合分类语言。目前使用最广泛的是体系分类语言。1)体系分类语言 体系分类语言是一种直接体现学科知识分类的等级制概念的标志系统,是通过对概括性文献信息内容特征进行分类的检索语言。2)组配分类检索语言 组配分类检索语言也称为组配分类法,是为了适应现代信息资源标引和检索的需要发展起来的分类法类型。使用时,先分析标引对象的主题,根据主题分析的结果通过相应概念类目的组配表达主题内容,以这些类目的标志组合,表示该项主题在分析体系中的次序。3)混合式分类检索语言 混合式分类检索语言也称为混合式分类法,它是介于上述两种分类法之间,既应用概念划分和概念原理,又应用概念分析和综合的原理而编制的分类法。2.主题检索语言 主题检索语言也称为主题词语言,是经过选择,用于表达文献信息内容的词语作为概念标志,并将概念标志按字顺排列组织起来的一种检索语言。经过选择的词语叫主题词,主题词表是主题词语言的体现,词表中的词语作为文献内容的标志和查找文献的依据。 根据词语的选词原则、组配方式、规范方法,它又可分为标题词检索语言、叙词检索语言、关键词检索语言、单元词检索语言等1)标题词检索语言 标题词检索语言也称为标题词语言,又称为标题法。它是主题检索语言最早的一种类型,也是一种很规范的自然语言,即经过标准化处理的表达文献所论述或涉及的事物概念的词、词组或短句作为标志的一种检索语言。2)叙词检索语言 叙词检索语言又称为叙词语言,是从文献中优选出来,经过严格规范化处理的名词或名词词组,通过组配来标示文献内容或主题的一种标志系统。叙词语言就是以叙词作为文献检索标志和查找依据的一种检索语言。3)关键词检索语言 关键词检索语言也称为关键词语言,是指出现在文献标题、文摘、正文中对表达和揭示文献内容具有实质性意义的词语、关键词作为一种检索语言。关键词用作文献内容的标志和查找目录、索引的依据,不需要规范化,也不需要关键词表作为标引和查找图书资料的工具。4)单元词检索语言 单元词是规范的自然语言,它是指从文献中抽取出来最基本的、不能再分割的单元词语的一种检索语言,又称元词。它从文献内容中抽出,经过规范,能表达一个独立的概念。3.代码检索语言 代码检索语言是对文献所论述事物的某一方面的特征,用某种代码系统加以描述和标引的语言,如化学物质的分子式、化学物质登记号、基因符号等。2.3 检索系统2.3.1 检索系统概念 检索系统就是为了满足各种各样的信息需求而建立的一整套信息的收集、整理、加工、存储和检索的完整系统。它是由一定的检索设施和加工整理好并存储在相应载体上的文献集合及其他必要设备共同构成的。它与检索工具一道,共同服务于信息检索。2.3.2 检索系统的分类 信息检索系统按文献信息的存储和检索设备划分,可分为手工检索系统和计算机检索系统。1.手工检索系统是用手工方式来处理和查找文献的工具系统,是传统的检索系统,其内容千差万别,种类繁多,结构各异,但组成方法基本相同。它主要是利用印刷型、缩微型检索工具。手工检索系统由手工检索设备、检索语言、文献库等构成,以人工方式查找和提供文献信息。 手工检索系统包括6个子系统。(1)文献筛选子系统,即根据一定的标准选择存储的文献。(2)词表子系统,即编制、维护、修订分类表和主题词表。(3)标引子系统,即根据词表,将文献的主题内容经概念分析而转换成检索语言。(4)查询子系统,即把信息用户的需求转换成检索策略。(5)用户与系统之间交互子系统,即通过与信息用户的商谈,收集反馈,具体确定检索目标。(6)匹配子系统,即检索策略同文献索引中有关标引记录相比较,实施检索作业。 手工检索系统具有操作简单,费用低廉,查准率高等优点,但耗时较多,效率较低。2.计算机检索系统 计算机检索系统又称为现代化检索系统,是利用计算机技术、电子技术、网络技术等,存储和检索在计算机或计算机网络内的信息资源的检索系统,存储时,将大量的信息资源按一定的格式输入到系统中,加工处理成可供检索的数据库。 计算机信息检索系统主要由四个部分构成,即硬件部分、软件部分、信息数据库、通信网络。(1)计算检索硬件主要包括:服务器、交换机、存储设备、检索终端、数据输出设备等。(2)计算机检索软件是检索系统的管理系统,其功能是进行信息的存储、处理、检索以及整个系统的运行和管理,检索软件的质量对检索功能和检索速度有重大影响。(3)数据库是在计算机存储设备上按一定方式存储的相互关联的数据集合,是检索系统的信息源,也是用户检索的对象。(4)通信网络是信息传递的设施,起着远距离、高速度、无差错传递信息的作用。通信网络分成资源子网和通信子网两部分,资源子网包含网络中所有的计算机、输入输出设备、各种软件资源和数据资源,负责全网的数据处理业务;通信子网由用作信息交换的结点计算机和通信线路组成的独立数据通信系统,承担全网数据传输、转接、加工和交换等通信处理工作。2.4 检索工具2.4.1 检索工具的概念和特征 检索工具是经过对文献信息一系列的判断、选择、组织、加工等处理后形成供检索用的工具与设备。 文献信息检索工具是以各种原始文献为素材,在广泛收集并进行筛选后,分析和揭示其外形特征和内容特性,给予书目性的描述和来源线索的指引,形成一定数量的文献信息单元,再根据一定的框架和顺序加以排列或形成可供检查的卡片或工具,或以图书的形式出版,或以期刊的形式连续出版,是二次文献。检索工具应具备如下特征。(1)详细而又完整地记录文献线索和所收录文献的各种特征,读者可以根据这些线索查找所需文献。(2)每条描述记录要标明可供检索用的标志,如分类号、主题词、文献序号、代号代码等。(3)提供多种必要的检索手段和检索途径,如分类索引、主题索引、作者索引、代码索引等,便于读者从各种途径方便地进行检索。(4)出版形式多样性,可以是图书、期刊、卡片、缩微品、磁带、磁盘、光盘等,兼备对文献信息的揭示报道、存储累积和检索利用的功能。(5)在体例编排结构上,从实用易检出发,可以结合文字特点和学科特点对所选的款目按分类排组或按主题、叙词、关键词等的字序排组,并利用“参照”关联相关部分。此外,又辅以适宜的辅助工具,以便同主题的排列相辅相成。2.4.2 检索工具种类1.按检索手段划分 检索工具按检索手段,可分为手工检索工具、机械检索工具、缩微文献检索工具与计算机检索工具。1)手工检索工具 手工检索工具又可分为两大类:检索型检索工具和参考型检索工具。 检索型检索工具主要向用户提供经过加工、整理并按一定的方式排列的文献资料的线索、出处等,用户通过这类检索工具所提供的线索,能够方便、快捷地找到自己所需要的信息,如书目、索引、文摘、题录。2)机械检索工具 机械检索工具是指运用一定的机器设备来辅助检索文献信息的检索工具,主要有机器穿孔卡片检索工具和缩微文献检索工具。3)缩微文献检索工具 缩微文献检索工具又称为光电检索工具,它是以文献缩微品作为文献库,用一定的光电设备从中进行文献信息检索。4)计算机检索工具 计算机检索工具是以磁性介质为载体,用计算机来处理和查找文献的一种电子化自动化系统,由计算机、检索软件、文献数据库、检索终端及其他外用设备组成。2.按物质载体形式和种类划分 检索工具按物质载体形式和种类可分为:书本式检索工具、卡片式检索工具、缩微型检索工具和机读式检索工具。1)书本式检索工具 书本式检索工具又可细分为期刊式、单卷式和附录式三种。(1)期刊式检索工具是在一个名称之下,定期连续刊行的一种检索工具,具有期刊的特点,是目前查找科技文献的主要检索工具。其优越性在于收录文献新,报道文献快,且能够比较完整系统地收选一个学科领域的有关文献信息,便于回溯检索和全面了解该学科领域的发展状况;同事也便于装订、保存、借阅、管理。(2)单卷式检索工具大多是以一定的专题为内容而编印、单独出版的。它收集的文献比较集中,往往积累了一段相当长时间的文献,并以特定范围的读者作为对象。对于专题文献检索比较方便,有较高的使用价值。(3)附录式检索工具不独立出版,而是附于有关书刊之后,但具有一定的参考价值。尤其是作为情报信息研究成果的综述、述评所附的参考文献目录,往往是通过全面搜集大量文献进行精选而成,所以具有较高的价值,越来越收到人们的重视。2)卡片式检索工具 卡片式检索工具是文献收藏单位揭示馆藏文献信息的常用检索工具,如传统图书馆使用的卡片目录,它把每条款目写在或印在一张卡片上,然后按一定的方式将卡片一张张排列起来,成为成套的卡片。其优点是可以随时抽排,不断充实、更新,及时灵活地反映现有文献信息。其缺点是占有较大的馆藏空间,体积庞大,成本费用也比较昂贵,制作费时费力等。3)缩微型检索工具 缩微型检索工具是指计算机输出的缩微品,有平片和胶卷两种形式。由计算机将存储在计算机存储器里的书目著录,按照人们指定的格式和排列系统进行输出,一张普通的所谓平片可包含3000多条书目著录,即能代替3000多张卡片。其特点是存储量大,体积小,成本低廉,易于保存。但它不像卡片式检索工具那样可随时增减款目,需由计算机进行全套更新,所需费用较大。4)机读式检索工具 机读式检索工具是将书目著录按照一定的代码和一定的格式记录在特定载体上,专供计算机“阅读”的检索工具。只有借助于计算机,才能对它进行检索。3.按收录的学科范围划分 检索工具按收录的学科范围可分为:综合性检索工具、专业性检索工具和单一性检索工具。(1)综合性检索工具,即收录范围是多学科的,适用于检索不同学科专业文献。(2)专业性检索工具,即收录范围仅限于某一学科或专业,专业性强,适合科技人员检索特定专业的文献信息,内容更集中、系统。(3)单一性检索工具,即收录文献只限于某一特定类型的特定范围,以新技术发明作为检索对象,如专利文献目录索引等。2.5 检索策略2.5.1 检索策略的概念 所谓检索策略,是指检索者为实现检索目标所做的安排和部署,包括课题分析、检索工具的选择、检索方法、检索途径等。2.5.2 检索策略的制定1.分析课题 首先要在分析课题的基础上,弄清楚课题的性质是什么,了解课题的目的、意义,确定检索内容的学科范围、文献类型、检索年限,根据学科范围选择检索工具以及检索范围的限定和检索技术。根据课题要求和特点,选择检索方法,找出检索词,按逻辑关系列出检索式,制定查找程序。2.选择检索工具 根据检索课题的要求,首先必须对各种检索工具所覆盖的学科范围有清楚的了解,按照相应的检索途径查找有关的索引,在根据索引指示的地址查得相应的文献线索,如题名、内容摘要、作者及作者单位、文献出处等。3.检索技术 检索策略制定的好坏与检索方法的选择、检索程序和检索人员的技术有关。检索工具有综合性和专业性的不同,覆盖专业面、收录文献类型、语种、出版文字的不同等,因此应根据课题分析的结果进行选用。拿了题目不了解课题内容,在题目中找出检索词,或由用户提出检索词就进行检索,这样检出来的文献不够全面,容易造成漏检。这种情况的出现于检索人员的经验有关。4.确定检索途径和检索标志 标志是确切表达文献内容及某些外表特征而使用的一种符号或词,是经过规范化处理的,是比较通用和定型的。要注意文献的外部特征,如出版年、文献类型、书名、刊名、著者等,也要注意文献内容特征,如学科属性、分类、主题、结构符号等。5.确定检索策略 选用具体的检索工具后,就要考虑选择哪种检索方法,确定具体的检索途径,选择是从分类途径还是从主体途径检索,所查找的文献要达到什么要求,选用什么检索词等,以便具体进行检索。6.获取原始文献 利用检索工具获得的文献线索中,文献来源(出处)往往是采用缩写的方式,因此还必须把缩写的文献来源转换成全称,一般可通过检索工具本身的附录予以解决。另外还要识别著录时所用的各种缩写等。检索文献最终要获取原文,按照文献来源的全称,查找馆藏目录。2.5.3 文献检索效果的评价 文献检索完成后,要根据一定的评价指标对检索结果进行科学的评价,以找出文献检索中存在的问题和影响检索效果的各种因素,以便提高检索的有效性。常见的评价指标有查全率、查准率、漏检率、误检率、收录范围、响应时间、用户负担和输出形式等。其中最主要的指标是查全率和查准率。 查全率是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反映检索的全面性。查准率是指检索出与主题相关的文献量占所有检出文献总量的百分比,用来反映检索的准确性。2.6 计算机检索2.6.1 计算机检索发展概况 计算机信息检索的发展,是与计算机技术、数字化技术、存储技术、网络通信技术的发展密切相关的。从20世纪50年代计算机开始应用于信息检索,至今大体经历了四个阶段。1.脱机检索阶段(20世纪50年代中期到60年代中期) 自1946年2月世界上第一台电子计算机问世以来,人们一直设想利用计算机查找文献。进入50年代后,在计算机应用领域“穿孔卡片”和“穿孔纸带”数据录入技术及设备相继出现,以它们作为存储文摘、检索词和查询提问式的媒介,使得计算机开始在文献检索领域中得到了应用。 这一阶段主要以脱机检索的方式开展服务,其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,因此,检索效率往往不够理想。2.联机检索阶段(20世纪60年代中期到70年代中期) 由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以铜鼓哦检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。3.光盘数据库检索阶段(20世纪70年代中期到80年代末) 光盘数据库检索阶段真正发展是在20世纪70年代。它是单机信息检索系统的一种,解决了单机检索系统数据存储量少的问题,也是目前比较广泛应用的一种检索系统。4.网络化检索阶段(20世纪90年代初至今) 由于电话网、电传网、公共数据通信网都可以为情报检索传输数据,特别是卫星通信技术的应用,使通信网络更加现代化,也使信息检索系统更加国际化,信息用户可借助国际通信网络直接与检索系统联机,从而实现不受地域限制的国际联机信息检索。这种联机信息系统网络的实现,使人们可以再很短的时间内查遍世界各国的信息资料,使信息资源共享成为可能。2.6.2 计算机信息检索的概念与原理1.计算机信息检索概念 计算机信息检索式指以计算机技术为手段,通过计算机软件技术、网络和数据库及通信系统等现代检索方式进行信息检索的,检索过程是在人机的协同下完成的。2.计算机信息检索原理 就是指人们在计算机或计算机检索网络的终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。 计算机信息存储就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成机读数据库记录和文献特征标志,这相当于编制手工检索用的文摘、索引等检索工具,即信息的标引、加工和存储过程。 计算机信息检索则是存储的逆过程。用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标志和检索策略,输入到计算机进行查找。2.6.3 计算机检索的类型1.脱机检索 传统意义上的脱机检索式指系统根据用户需求自爱机读磁带上顺序扫描寻找匹配的文献,通常是分批处理用户提问,又称批式检索。2.联机检索 用户根据联机检索终端通过通信线路与系统的主机连接,在中央处理机控制下查询系统的几十个甚至上百个数据库,并能够与系统实时对话,随时调整检索策略。3.视频数据检索 视频数据检索亦称电视信息查询,是数字通信、电视和计算机相结合的产物。4.网络信息检索 通过网络接口软件,用户可在任一终端查询各地上网的信息资源。网络检索也是一种广义的联机检索。2.6.4 计算机检索的特点(1)检索途径多(2)新颖性(3)高效性(4)灵活性(5)广泛性第3章 工具书举例3.1 字、词典3.1.1 字、词典概述字典是汇集单字,注明其字形、读音、意义和用法。 词典主要解释词语的概念、意义和用法。 字(词)典按所收内容分类 1 语文性字(词)典 (1)综合性字(词)典:对字的音、形、义和词汇的意义、用法全面加以解释。举例:新华字典、汉语大字典、现代汉语词典、Oxford of English Language等。(2)专门性字(词)典:只收某一类的字、词,或只解释字或词形、音、义的某个方面。举例:成语词典、汉语虚词词典、简明同义词典、中国民间方言词典。2 知识性词典 (1)百科词典:汇集各学科重要的术语和概念加以解释,提供最基本的知识。(2)专科词典:收录一个学科或专门领域的术语、概念、专名加以解释,系统地反映专业知识的概要。专科词典所提供的知识往往比百科词典更为详尽。举例:哲学大辞典、中国艺术家辞典、中国古今地名大辞典等。按语种分类1 单语词典:只有一种语种的词典2 多语词典:两种或两种以上语种间的对译词典。举例:英汉大词典、汉英科技大辞典等。3.1.2 字、词典的举例汉语字典、词典举例 说文解字:东汉许慎撰,中华书局1963年、1984年据清陈昌治改刻本缩印出版,这是我国第一部正规字典.说文解字分为540个部首,汇集9353个当时通用汉字,另有重文1163个字。每字首先说解字义,然后分析文字形体构造,最后注音。它是我国系统分析字形从而考究文字本义的重要著作,至今仍是研究古文字学和古汉语重要的工具书。 新华字典:(商务印书馆1993年7月第8版),本字典自1953年出版第1版以来,经过多次修订,内容日趋丰富和完善,是我国目前最通用的一部小型普通字典。本字典所收单字包括异体、繁体字在内共计11100个,复音词、词组3500个,附录8种,综合插图9幅,分部首检字和四角号码检字两种本子出版。 汉语大字典:徐中舒主编,于省吾、王力、吕叔湘等17位国内语言文学专家任学术顾问,四川辞书出版社、湖北辞书出版社19861990年出版。全书共8卷,1993年出版合订缩印本。收单字54678个,是我国历史上收字多、解释最全面的大型历史性详解汉语字典。由于收字多,注释详,再加上用汉语拼音字母标注今音,因而它是我国查检生僻字和古代文献用字的理想字典。 辞海(1999年版):辞海编辑委员会编,上海辞书出版社1999年出版。该辞海收词12万条,近2000万字,辞海已成为一部兼收单字、一般词语和百科条目的著名大型综合性辞典。 汉语大词典:汉语大词典编纂处编,罗竹风主编,上海辞书出版社1986年出版第1卷,自第2卷起,改由汉语大词典出版社出版。全书正文12卷,另有附录? 索引1卷,至1994年全部出齐。1997年出版3卷缩印本。同年,汉语大词典出版社和香港商务印书馆又联合推出了汉语大词典光盘版。汉语大词典在内容上,突出的特点是注重“语文性”和“历史性”。对古今一般汉语语词,系统清理,全面收录。而对没有进入一般语词范围的专科词汇不收录。对词语的解释,义项完备,释义确切,层次清楚,着重从词语的历史演变过程加以全面阐述。对大量在意义上、形式上具有内在联系的词目,还作了关联处理,全面系统地展现了语词在发展过程中的演化与变异。汉语大辞典共收录古今汉语语词37万条,是当今世界上收录汉语语词数量最多的汉语语文词典。英语词典举例 牛津英语词典(Oxford English Dictionary,简称OED):原名为New English Dictionary On Historical Principles。初版125分册,装订成10卷。1993年重印为12卷,外加补编一卷,共13卷,改称现名。它收录了12世纪中期以来见于文献记载的几乎全部英语词语,包括只出现一次的罕见词、现代书面和口语中的普通词汇、主要专业词汇、大量的方言、俚语和稳定的科技用语,通过定义和例证追溯英语发展的历史。OED在美国英语的收录上略显不足,可以作为其补充的有美国和加拿大按历史原则编纂的词典,如美国英语历史原则词典(Dictionary of American English On Historical Principles)和历史原则美语词典(Dictionary of? Americanisms On Historical Principles)等。 蓝登书屋足本词典(The Random House Unabridged Dictionary ):是蓝登书屋英语词典(The Random House Dictionary of the English Language)第2版(1984年)的增订版。共收词32万条,包括人名、地名、事件和作品名称。 著名的中小型词典: 世界图书词典(World Book Dictionary) ,它是英美很受欢迎的两卷本词典; 牛津现代英语高级学生词典(Oxford Advanced Learners Dictionary) ; 郎曼当代英语词典(Longman Dictionary of Contemporary English)。3.2 百科全书3.2.1 百科全书概述百科全书被称为参考性工具书之王。百科全书是概述人类一切门类或某一门类知识的完备工具书,是知识的总汇。它是对人类已有知识进行汇集、浓缩并使其条理化的产物。百科全书一般按条目(词条)字顺编排,另附有相应的索引,可供迅速查检。百科全书既可用于查寻事实性信息,如学科理论、流派、分支、术语、人物、事件、机构、地名等,也可用来查寻某些数据,还可用来查找各领域基本的文献书目。3.2.2 百科全书举要中文百科全书举要 中国大百科全书:它是我国第一部具有权威性、世界性的综合大百科全书。全书内容包括哲学、社会科学、文学艺术、文化教育、自然科学、工程技术等66个学科和知识门类。共74卷,共收77859个条目,约12568万字,总插图49765幅,其中彩图15103幅。中国大百科全书采用了分类与字顺相结合的编排方法,即全书按学科分类分卷(一学科或数学科辑成一卷或数卷),同一卷别内的条目按条头的汉语拼音字母顺序并辅以汉字笔画、起笔笔形顺序排列。 简明中华百科全书:中国大百科全书出版社,1994年出版。它是我国一部有代表性的小型百科全书。该书共3卷,收录8000多个条目,概述文章约15万字,插图1700幅,全书共约500万字,分正文、附录和索引三大部。本书的内容以全面、系统、简明地介绍中国古今文化为主。 简明不列颠百科全书:中国大百科全书出版社,美国不列颠百科全书公司合作编译,中国大百科全书出版社19851986年出版。它是我国编译出版的国外百科全书中最有代表性的一种,是中型综合性百科全书。除中国部分外,主要根据第15版不列颠百科全书的百科简编部分编译而成。全书10卷,19卷是正文及附录,第10卷为索引,共收条目71000余条,附图片约5000幅。其内容包括社会科学、自然科学、工程技术、文学艺术等各学科的概述,各类专名、术语、事件的介绍,侧重西方文化、科技成就和当代知识。 专科性百科全书有:中国医学百科全书、中国农业百科全书、世界经济百科全书、中国企业管理百科全书、中国劳动人事百科全书、中国军事百科全书、中国水利百科全书、中国电力百科全书、中国冶金百科全书、中国商业百科全书、国际经济贸易百科全书、中国青年百科全书、中国证券百科全书、关贸总协定百科全书、城市问题百科全书、行为科学百科全书、中国保险百科全书、中国公共关系百科全书、中国教育百科全书、中国税务百科全书等等。 此外地方性百科全书也从20世纪90年代初开始出现,如北京百科全书、黑龙江百科全书等等。英文百科全书举要 新不列颠百科全书(The New Encyclopedia Britannica)简称EB15,是原不列颠百科全书的第15版。它是世界上最著名的百科全书。它将全部知识按条目字顺编排,全书由四个部分,32卷组成。第一部分为Micropedia ; Ready reference and index(简编百科:便捷参考和索引),由简明的短小条目组成,共约9万条目,按条目字顺排列,既是独立的简明百科全书,又是后一部分的“索引”。第二部分为Macropedia ; Knowledge in depth(详编百科:知识深义),这是该百科全书的主体,由长篇大条目组成,按字顺排列。对主要学科、人物、事件等都详细介绍,条目后附有相关参考文献。第三部分为Propedia ; Outline of knowledge and Guide to the Britannia(类目百科:知识纲要和不列颠学科指南),它相当于前两部分的分类索引,在有关类目下列举前两部分的相应条目。第四部分为Index(索引),按主题、人名字顺混排,指向各部分的相应条目。另外,还有作为年度补篇出版的Britannica World Data Annual(不列颠世界资料年鉴)。我国已有中文的简明不列颠百科全书可供利用。 美国百科全书(The Encyclopedia American)简称EA,它是美国第一部大型综合性百科全书。在英语百科全书中,其权威性仅次于EB,于18291833年问世,至今已有160多年历史。 科利尔百科全书(Colliers Encyclopedia)简称EC,该书为20世纪中叶才问世的一部大型综合性百科全书,属成人通俗百科全书,以非专业人员、青年学生等广大普通读者为对象,选材广泛,尤为注重广大读者感兴趣的实用性材料。 综合性的英文百科全书:钱伯斯百科全书(Chamber,s Encyclopedia)、美国学术百科全书(Academic American Encyclopedia)、世界图书百科全书(World Book Encyclopedia)。单双卷本百科全书有:哥伦比亚百科全书(The Columbia Encyclopedia)、蓝登书屋百科全书(The Random House Encyclopedia)、剑桥百科全书(The Cambridge Encyclopedia)。 专业性、地方性百科全书有:国际社会科学百科全书(International Encyclopedia of the Social Sciences)、麦格劳希尔科技百科全书(McGraw-Hill Encyclopedia of Science and Technology)、范诺斯特兰德科学百科全书(Van Nostrand,s Scientific Encyclopedia)、国际教育百科全书(The International Encyclopedia of Education)、梅里亚姆韦氏文学百科全书(Merriam Web

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论