浙江农林大学《信息资源组织与管理》期末复习.doc_第1页
浙江农林大学《信息资源组织与管理》期末复习.doc_第2页
浙江农林大学《信息资源组织与管理》期末复习.doc_第3页
浙江农林大学《信息资源组织与管理》期末复习.doc_第4页
浙江农林大学《信息资源组织与管理》期末复习.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息的概念1)信息是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理来表现各种相互联系的客观事物在运动变化中所具有特征内容的总称。2)广义的信息是物质、能量存在和运动状态的表征。 狭义的信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息。信息的分类(了解)1)以信息的性质为依据:语法信息、语义信息、语用信息2)以认识主体为依据:客观信息和主观信息3)以信息的逻辑意义为依据:真实信息、虚假信息、不定信息4)以信息的载体性质为依据:电子信息、光学信息、生物信息5)以信息的应用部门为依据:工业信息、农业信息、军事信息、政治信息、科技信息、文化信息、经济信息等6)以信息源的性质为依据:语声信息、图象信息、文字信息、数据信息、计算信息等7)以信息的生成领域为依据:宇宙信息、自然信息、社会信息、思维信息信息的特征1)普遍性2)寄载性3)可传递性4)可识别性5)可共享性6)时效性信息资源的三大要素是:信息、信息生产者、信息技术信息资源的可塑性:指信息创造的价值的大小不仅取决于信息本身,更取决于信息的利用效果及利用方式。 文献信息资源:是以语言、文字、数据、图象、声频、视频等方式记录在特定载体上的信息资源。图书、连续出版物、专利、标准、政府出版物等都属于文献信息资源的范畴。文献信息资源的特点:是经过加工、整理,较为固定、系统、准确、可靠,数据量大,便于保存和利用,是信息资源传播的主要方式,但是文献信息资源也存在信息相对滞后,部分信息尚待证实的情况。网络信息资源:也称虚拟信息资源,是指以数字形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的,并通过计算机网络通讯方式进行传递的信息。网络信息资源正在逐步取代文献信息资源成为信息资源最主要的传播方式。知识的概念、属性:概念:知识是人类通过思维重新组合的系统化的信息集合。 属性:1)信息性 信息是产生知识的原料,知识的产生离不开信息。 2)系统性 3)意识性 知识的分类:1)亚里士多德:理论知识或科学知识;实践的智慧、实践的知识或明智、审慎;技艺、技巧或生产的知识、制作的知识2)世界经合组织:事实知识(know-what)、原理知识(know-why)、技能知识(know-how)、人力知识(know-who)3)显性知识和隐性知识4)知识经济中三大类重要知识:科技知识、管理知识、行为科学知识5)私人知识和社会知识6)形态知识、内容知识和效用知识7)已知知识和未知知识情报: 概念:情报是指运用一定的形式,传递给用户,并产生效益的知识或消息。 三个基本属性:知识性、传递性、效益性。情报的类型(分类):1)按来源:实物情报、口传情报和文献情报2)按加工层次:零次情报、一次情报、二次情报和三次情报3)按应用领域:军事情报、科技情报、经济情报和政治情报4)按使用目的:战略性情报和战术性情报5)按保密程度:绝密情报、机密情报和一般情报文献: 概念:用文字、图形、符号或声频等技术手段记录知识信息的物质载体,或称固化在物质载体上的知识信息。文献是指记录 知识、信息的 一切载体。构成文献的基本要素1)信息或知识内容 2)信息符号 3)载体材料 4)记录方式文献: 概念:文献是指记录 知识、信息的 一切载体。 构成文献的基本要素:1)信息或知识内容 2)信息符号 3)载体材料 4)记录方式文献类型: 1)按载体形式划分 印刷型:以纸质材料为载体、以印刷为记录手段的文献形式。 缩微型:一般指以感光材料为载体、利用摄影等光学技术使印刷型文献缩小若干倍的文献形式。如缩微胶片、缩微胶卷等。 视听型:指以电磁材料为载体,借助特殊的机械装置,将声音和图像记录下来的一种动态型文献,如唱片、录音带、幻灯片、电影片、录像片等。 电子型:指以磁性材料载体,通过编码和程序设计,由计算机输入和输出的文献信息,包括磁带、磁盘、光盘等。 2)按加工层次划分: 零次文献:指记录在非正规物理载体上,未经出版发行的或未进入社会交流的最原始的文献。如私人笔记、手稿、考察记录等。 一次文献:指以作者本人的生产与科研工作成果为依据而创作的原始文献。如专著、期刊论文、学位论文等。 二次文献:也称检索性文献,指对一次性文献进行精选、提炼、浓缩和加工,标引出文献的主题,编制成具有多种检索途径的检索工具,如文摘、索引、题录等。二次文献具有浓缩性、汇集性、有序性等特点,它是查找一次文献的工具。 三次文献:也称参考性文献,是指利用二次文献的线索,系统地检索出一批相关文献,并对其内容进行综合、分析、研究和评述而编写出来的文献。如述评、动态综述、进展报告、年鉴等。 3)按文献公开的程度划分 白色文献,又称公开文献,指公开发表、正式出版,可以订购、借阅或网上查询浏览的文献。如图书,期刊,报纸等。 黑色文献,又称难得文献,指绝密、机密或保密的重要文献,一般是涉及国家安全的有关战略战术、武器装备或核心科技的关键秘密等重要情报的文献。除非通过间谍等非常手段,一般难以获取。如未解密的政府文件、内部档案、个人日记、私人信件等。 灰色文献,又称内部文献,指非公开发表、非正式出版的、非保密的内部文献,可以通过特定的渠道借阅或获取。如不公开不刊登的会议文献,非公开出版的政府文献,学位论文,非公开发行的科技报告、技术档案、工作文件,内部刊物等。4)按文献的出版形式划分:图书(book):根据国际文献标准草案ISO/DIS5217/的定义:凡篇幅达48页以上并构成一个书目单元的文献称为图书。 我国国家标准定义为:以印刷方式单本刊行的出版物。 图书包括单卷书、丛书、专著、参考书等。 一类是阅读类图书,包括教科书、专著、科普读物; 另一类是参考类图(参考工具书),指专门为查找资料而编写的工具书,包括百科全书、字词典、手册等。 据美国情报专家对美国各大学的科学家和英国电气工程师进行调查,发现他们阅读的文献中,图书分别占19%和14%。 图书没有统一的开本;不连续出版;内容比较成熟,系统、完整、全面,但相对比较陈旧;出版时间长,不能反映最新的信息;正式出版的图书都有一个唯一的ISBN号例如:ISBN7-5624-1273-1 (其中是地域号,主要是指国家,地区和语言区,7指中国,0和1指英语区,2是法语区,3是德语区,4是日语区,5是俄语区,88是意大利语区,9971是新加坡等;是出版社代码,5624代表重庆大学出版社;是该出版社出版图书种类的流水号;是计算机校验位)图书的文献类型代码为:M 【重要!】图书著录格式:著者.书名M. 出版地:出版社名称.出版时间 Etten V W. Fundamentals of optical fiber communicationM. London: Prentice-Hall ,1991.吴桂金. Internet网络信息资源的分析与利用M. 哈尔滨:东北林业大学出版社,2005,7.期刊(journal or magazine) 指有固定名称和统一的出版形式,按一定规律定期或不定期连续出版的文献。通常与报纸一起统称为连续性出版物。 期刊是科技人员的主要情报源,具有报道速度快、出版周期短、内容新颖、数量大、品种多等特点,能及时反映新成果、学科动向,且发行量大,影响面广。 是交流学术思想最基本的文献形式 。但缺点是知识不系统,信息凌乱,保存时间短。根据情报专家调查,科研人员利用的各类文献中,科技期刊占65%以上。期刊的标识有刊名、刊期、页码、国际标准连续出版物号(ISSN)等。国内的期刊还有统一刊号。国际标准连续出版物刊号ISSN (International Series Standard Number)由8位数字分两段组成,如1000-0135,前7位是期刊代号,末位是校验号。 【重要!】统一刊号:由CN + 地区号+ 国内标准连续出版物编号+中图法分类号组成。内部刊物:有准印证号。 例:浙江林学院学报 中国标准刊号ISSN1000-5692、CN 33-1085/S期刊可分为学术性期刊、通讯性期刊、消息性期刊、资料性期刊和检索性期刊等,其中学术性期刊和技术性期刊对科研生产的参考价值较大。按出版的频率,常见的有周刊(weekly)、月刊(monthly)、双月刊(bi monthly )、季刊(quarterly)、年刊(annual)。期刊刊名常冠以Acta(学报) journal(杂志)、 annales(纪事)、 bulletin (通报)、transactions (汇刊)、proceedings(会刊)、 review(评 论)、 progress/advances in (进展)、 communication 、letters (通讯)、 news 等,其中 bulletin(通报)、acta(学报)、transaction(汇刊)等通常都是大学或学术团体出版的,具有较高学术水平。期刊的文献类型代码为:J 【重要!】期刊著录格式:作者(多作者用逗号分开,超过3个者用“等或et al”). 文章题目J.刊物名称,年份,卷数(期数):页码 如: Porter MF, Zhang J. An algorithm for suffix stripping J. Program, 1980, 14(3):130137 朱冬林,任光明,聂得新,等.水库水位变化下对水库滑坡稳定性影响的预测J.水文地质工程地质,2002,29(3):6-9报纸(Paper,Newspaper):出版周期很短的定期连续出版物特点:连续出版物;有ISSN号和国内统一连续出版物号 ;内容报道及时,普及面广,但缺点是知识不系统,信息凌乱,保存时间短报纸的文献类别代码:N 【重要!】著录格式:析出责任者. 析出题名N.报纸名,年-月-日(版次). 秦贞俊. 芳族聚酰胺纤维与汽车安全空气袋N. 纺织科普,2004-07-05(02).专利文献(patent document)广义的专利文献是指专利出版局出版的与专利有关的各种文献,如专利公报、分类表、索引和说明书等;狭义的专利文献仅指专利说明书。专利说明书具有内容广泛、系统详尽、格式规范、出版迅速等特点。涉及领域广,技术含量高,内容详尽、可靠,缺点是时效性与专利权有效时间有关专利号:国别代码+流水号组成。如US、CN、DE等,如US473168,CN1016502A;一般还有Patent一词,后面为专利号,如US Patent 4,576,486专利文献的类别代码:P 【重要!】专利文献著录格式:专利申请者. 专利题名:专利国别(或地区),专利号P.出版日期.TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001P. 2002-04-25. 刘加林. 多功能一次性压舌板:中国,92214985.2P. 1993-04-14.*注* 922149.实用新型专利(看第三位,前两位为年份)标准文献(standard literature):指由标准及其它具有标准性质的类似文件组成的一种特定形式的文献体系。主要是对工农业产品和工程建设的质量、规格及其检验方法等方面所做出的技术规定,是从事生产、建设和管理的一种共同规范或依据。特征:规章化,体裁独特,文字简练,编写格式、分类有专门的规定;具有明确的适用范围,充分的可靠性和针对性;某些标准文献具有法律约束性;新陈代谢频繁,一般过若干时间就要进行修订, 新的标准不断地替代旧的标准,具有时效性。标准文献的情报价值在于通过标准可以了解各国经济、技术政策、生产水平,以预测分析发展动向,借鉴国外先进技术。按标准文献的内容可分为:基础标准、产品及零件标准、原材料及毛坯标准、工艺及装备标准、方法标准五类。(分类)按适用范围可以分为:国际标准、国家标准、地区标准、企业标准四类。标准文献的文献类别代码:S 【重要!】标准号:国别(组织)代码+顺序号+年代著录格式:标准颁布国家或组织. 标准名称S. 标准号.例:中华人民共和国国家标准. 织物透湿量测试方法S. GB/T 12704 - 91. 会议文献(conference document):指在各种会议上发表的文献,包括会议录中收集的论文或报告。会议文献学术水平高,内容新颖,反映最新成就和发展趋势,但内容不如期刊成熟。有表示会议的专门用词,主要名称有conference(会议)、congress(大会)、 contention(大会)、 meeting(小型会议)、symposium(专题讨论会)、seminar(学术研讨会)、workshop(专题学术讨论会)、colloquium(学术讨论会)、transaction(汇报)等。有表示会议录的一些词,如:proceedings of、 Collections of等。会议文献的主要标识有会议地点、会议时间、会议主办单位以及会议录的出版单位、出版地及出版时间等。会议文献的文献类型识别标识:C 【重要!】著录格式:析出责任者. 析出题名C /编著者. 文集名. 出版地:出版者,出版年:起止页码. ZHANG Wen-li, WANG Lin-ze, XIE Jiang-hua, et al. Hopf bifurcation of impact damper C/ Proceedings of the 3rd International Conference on Nonlinear Mechanics. Shanghai: Shanghai University Press, 1998: 437-440.有些国际会议定期召开,其会议文献也定期出版,从而形成了连续性出版物,这些出版名称也有Proceeding等字样,但应作为期刊Proceedings of the American Power Conference, Proceeding of the IEEE等。科技报告(science & technical report):指科研工作成果的正式报告或研究过程中每阶段进展的实际记录。特点:连续出版、有机构名称、统一编号、自成一册(似刊不似书);内容专深具体,数据完整(似书不似刊);属于保密或控制发行文献,大多数报告都是非正式出版的,获取比较困难中国科技信息研究所是我国科技报告的收藏单位各份报告自成一册,有专门的报告号,如AD-A268583世界上较著名的四大科技报告PB(Publishing Board):国商务部出版局报告,侧重工农业生产、生物医药和环境保护)AD(ASTIA Document)报告:美国国防科技情报文献中心出版,侧重军事技术与工程)NASA(National aeronnautics and Space Adminstration)报告:美国国家航空航天局出版,侧重宇航与空间技术领域)DOE(Department of Engergy)报告:美国能源部出版,侧重原子能研究及应用)科技报告的文献类型标识:R 【重要!】著录格式:著者.题名R.报告题名,编号,出版地:出版者,出版年:起止页码. Gough P S. Theoretical modeling of the interior ballistics of the electrothermal gunR. AD-A268583,1993. AD-A268583即为报告号,AD-A表示公开发行的AD报告,268583为其编号。通过报告号一般可以初步判断报告由什么部门收藏,以便到相应的部分去获取原文。学位论文(dissertation):指高等学校、科研机构的毕业生、研究生为了获得各级学位所撰写的论文。独创、新颖、前沿,研究专深学位论文的标识主要有:作者、导师、题名、授予学位、学位授予机构、时间等学位论文的文献类型标识:D 【重要!】著录格式:责任者. 题名D. 学位授予地址:学位授予单位,年份.王亚军. 整装催化剂及催化转化器若干研究D.北京:北京理工大学,2000.CALMS R B. Infrared spectroscopic studies on solid oxygen D. Berkeley: University of California, 1965.产品样本(company & product data):【貌似不要求】技术档案(technical file):【貌似不要求】政府出版物(government publication):【貌似不要求】信息检索:一、概念广义:是指将信息按照一定的方式组织和存储起来,并根据信息用户的需要查找出特定信息的技术和过程,所以,其全称是信息存储与检索(Information Storage and Retrieval)。 信息存储:是按照既定的标准和方针,从信息源中选择合适的信息,并对这些信息的内容进行概念分析,用系统规定的检索语言进行标引,形成信息的特征标识,进行整理与排序,构成可供检索的数据库等。信息存储主要包括信息的采集、著录、标引和整序等4个步骤。 信息检索:信息检索作为信息存储的逆过程,其实质是将描述特定用户所需要信息的提问特征与信息存储的检索标识进行异同的比较,从中找出与提问一致或基本一致的信息。主要包括以下几个 步骤:识别用户、接收提问、提问校验、转化提问式、检索、结果输出。狭义:仅指该过程的后半部分,即根据信息用户的检索需求,利用已有的检索工具或数据库,从中找出特定信息的过程,相当于人们所说的信息查询(Information Search)信息检索的类型1.按检索手段可以分为手工检索和计算机检索两种。 手工检索:即用人工来处理和查找所需信息的检索方式,一般是利用各种印刷型检索工具。 计算机检索:是利用计算机和一定的通信设备为手段,通过光盘、联机和网络等现代检索方式进行的信息检索。分:联机检索、光盘检索、 网络检索2.按检索的目的和对象可以分成: 文献检索(document retrieval) :指以文献为检索对象的信息检索,检索的目的通常是为读者提供文献的线索或原文。 数据检索(data retrieval) :是以数值或图表为检索对象,检索的结果是确定性的数据,如统计数据、人口数据、气象数据、并提供一定的运算推导。事实检索(fact retrieval) :是以原始文献中抽取的事物的情况的为检索对象,检索结果是事物发生的时间、地点和情况等具体答案,也是一种确定性的检索。信息检索的原理 检索提问标识与存储在检索工具中的标引标识进行比较,两者一致或信息标引标识中包含提问标识即是命中的信息。标引,即文献信息的整序加工。 存储过程:标引员广泛收集信息,形成检索标识,把这些标识按一定方法组织成各种检索系统。 检索过程:检索人员分析课题,用检索提问标识,从检索系统中查获所需的信息。检索语言1.检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。它是信息标引人员和信息检索人员沟通的桥梁。对于信息标引人员来说,它是表达文献主题内容,形成文献标识并借以组织文献的依据;对于检索人员来说,它是表达检索课题要求,并同检索系统中已经存储的文献标识进行比较从而获得所需文献的依据。其主要作用就是对文献的外部特征和内容进行多层次描述,提供多种检索途径,以便用户从不同角度检索查找。2.常用检索语言有分类检索语言、主题检索语言分类检索语言: 按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。使用这种检索语建立的信息检索系统可以反映知识的从属、派生、交叉、并列等关系,帮助用户系统地掌握和利用一个学科或专业范围的知识和信息。我国常用的分类法有:中国图书馆分类法(简称中图法)、中国图书资料分类法(简称资料法)国外常用的分类法: 国际十进分类法(Universal Decimal Classification, 简称UDC) 、 杜威十进分类法(Dewey Decimal Classification, 简称DDC) 、 美国国会图书馆图书分类法(Library of Congress System, 简称LC)中国图书馆分类法的体系结构中图法将知识门类分成5大部类,22个基本大类(分别用除L、M、W、Y外的其他英文字母表示),在这一基础上再按照从总到分,从一般到具体逐级展开而构成的一个纲目分明的体系。图书分类时主要根据图书的内容进行分类标引标记符号(分类号) 采用拉丁字母与阿拉伯数字相结合的混合号码制。大类采用字母表示,其它各级类目用数字表示。类号的变化体现了学科之间的关系。每增加一位字母和数字,通常代表增加一级分类。如: F 经济 一级类目 F0 经济学 二级类目 F1 世界各国经济概况、经济史、经济地理 F2 经济计划与管理 F20 国民经济管理 三级类目 F21 经济计划 F210 国民经济计划原理 四级类目 F211 国民经济计划体系 F212 各种专门计划图书排架先根据分类号排列,分类号相同再依书次号排。例如: TP TP1 TP31/1240 TP31/1350 TP31-62/1350 TP311/2520 TP311.13/1350 TP311.13/1360 TP311.13/D.M.C. TP311.13/G.H. TP311.13:S7/0120 TP311.13-62/0120主题检索语言:由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,按字母顺序排列标识,通过参照系统提示主题概念之间的关系,也称主题法。主题语言分: 标题词语言、单元词语言、关键词语言、叙词语言四种*标题词语言:标题词语言是主题检索语言中最早出现的一种语言,是指经过规范化处理、能表达信息主题概念的语词(包括单词、词组和短语)。规范化处理主要包括同义规范、词义规范、词类规范。*单元词语言:它是以单元词作为信息内容标识和检索的主题语言。单元词又称元词,是指从文献中抽取出来的,能表达文献主题内容,不能再分解的概念单元的规范化。*关键词语言:是指以关键词作为信息单元主题标识和检索的主题语言。关键词是反映文献主题概念,具有实际检索意义,从文献中直接抽取,未经规范化处理,用以标引和检索文献信息的语词。关键词又称自由词,属自然语言范畴。*叙词语言:是指以叙词作为信息单元主题标识和检索的主题语言。叙词又称描述词或叙述词,是指从信息内容中抽出的,以概念为基础,经过优化和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需求的名词或术语。*注* 标题词语言规范 单元词语言规范 关键词语言不规范! 叙词语言规范信息检索工具 信息检索工具是用来存储信息和提供查找信息线索的工具,它实际上是对众多分散的无组织的信息进行筛选、积累、组织、加工和整理,并按一定的科学体系组织编排,使其成为有序化、系统化的信息集合,从而方便人们检索和利用。按不同的标准,检索工具可以划分成不同的类型。按照存储内容划分有:目录型、题录型、文摘型和全文型检索工具;按载体可以划分为:印刷型、缩微型和电子型(联机型、光盘型、网络型)检索工具。信息检索工具的质量评价:1、收录齐全;2、文摘质量;3、索引完备;4、报导时滞;5、使用方便。信息检索方法 1、工具法:利用文摘、题录或索引等各种检索工具来查找文献的方法,这是文献检索最常用的方法,故又称常用法。 工具法可分为:顺查法、倒查法、抽查法 2、追溯法:利用已知文献所附的参考文献入手,逐一追查原文,再从这些原文后所附的参考文献逐一查找下去,从而获得一批相关文献信息的查找方法。有向前追溯法和向后追溯法两种。 3、综合法:是检索工具法与追溯法交替使用的一种方法,又称循环法,交替法。先利用检索工具查得一批有参考价值的相关文献,然后利用这些文献所附参考文献或原文中涉及的重要线索进行追溯查找,由此获得更多的相关文献。如此循环交替地使用上述两种查找方法,直到满足要求为止。 4、浏览法:即直接从一次文献如报纸杂志中通过浏览的方法从中获取所需信息的方法。 它适用于直接浏览新到的报纸杂志文献,有时是一种获得最新信息的方法。信息检索的途径 信息检索途径是进入检索的入口,检索途径是与信息特征和检索标识相关的。归纳起来,有两种途径:一是反映信息内容特征(分类号、主题词)的途径; 二是反映信息外部特征(著者、文献题名、信息代码)的途径。 1、分类途径:是按照学科分类体系查 找信息的途径。以分类检索语言为依托,使用分类目录进行查找。 当研究课题较大,需要全面了解某一学科及其相关知识的时候,或难于判定研究课题所属主题范围的时候,经常通过分类途径查找信息。 缺点:新兴科学、边缘科学在分类上是难以 处理;将概念转换成检索标识易发生差错。 分类途径是查找国内外文献的一个主要途径。 2、主题途径:是以代表信息主题内容的实质性的词汇作为检索标识进行检索的一种途径。 主题途径查找信息的关键是确定主题词。 课题的主题词确定方法-分析课题,提取概念。 最主要的事物名称应作为首先考虑的检索概念,将概念整理归纳,分成若干个组面。如“计算机辅助设计在光学中的应用”可分成“光学”、计算机辅助设计两组,每组用同义词、缩写词、复数形式等予以扩充。*主题检索与分类检索的比较相同点:分类检索与主题检索既然都是按学科内容进行检索不同点:首先,由于分类采用的检索语言是符号语言,即分类号,因此它不受文献所使用语言的限制。而主题检索所用的主题词是一个自然语言,因此,它往往受文献所使用的语言的限制。比如,我们一般不能用英语主题来检索俄文图书或文献。也不能用汉语主题来检索英文文献。其次,若从检索结果不同来看,分类检索更适于族性检索。好比找人一样,找到某一个人时就能找到他一家人及亲戚朋友。分类检索不仅能检索你所需要的某个类目的文献,而且还能把与此类有关的学科文献都能找出来。如通过TB877(以下所举分类号的例子均以中图法为准)这个类号可找到“全息摄影”这个学科的文献,同时你会发现它的上下左右全是与全息摄影有关的其它摄影的文献。我们前面讲过分类是系统的主题,下面这个表即能表示类目之间上下左右的关系。信息检索的效果的评价: 检索效果评价是根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价、以进一步完善检索工作的过程。 常用的评价指标主要有:查全率(recall factor)、查准率(也称适中率,Pertinency factor) 【最主要的两个】、漏检率(omission factor) 、 误检率( 也叫检索噪音, noise factor)以及新颖率、检索速度等,其中主要的指标是查全率和查准率信息检索系统 概念:按某种方式建立起来的供读者查找信息的一种有层次的体系,是表征有序信息特征的集合体。分为两大类型:印刷型检索系统和计算机检索系统。 印刷型检索系统 1、文献型检索工具 (1)目录:以报道文献出版或收藏信息为主要功能的工具。如全国总书目。 (2)题录:是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成,供人们查找篇目出版的工具。如全国报刊索引 (3)文摘:以精练的语言把文献信息的重要内容、观点、数据等摘录下来,并按一定的著录规则与排列方式编排起来,供读者检索使用的一种检索工具。 2、非文献型检索工具:主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。 计算机检索系统的类型 1.文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数据库,即数据库记录的对象为文献信息时。包括目录型数据库、题录型、文摘型和全文型数据库。(1)目录型数据库:是对信息外表特征予以揭示和报道,以整个出版单位或收藏单位为基本著录单元,如“本”、“种”、“件”等。著录内容包括书(刊)名、作者、出版年月、出版地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机读目录数据库OPAC)、联合目录、出版发行目录等。(2)题录、文摘型数据库 题录型:是将单篇文献的“篇”、“章”等为著录单元,如一篇论文、一份报告、一件专利等。如全国报刊索引。 文摘型:在题录的基础上每个著录单元再加上文摘。如美国工程索引、科学文摘等。(3)全文数据库 指存储文献全文或其中主要部分内容的源数据库。存储内容主要有各种图书、期刊论文、法律条文及案例、新闻报道等。它将二次文献的检索同原文献的获取融为一体。2.非文献型数据库:指一种能够直接提供具体的术语、事实和数值等信息的数据库。包括术语型数据库、事实型数据库和数值型数据库。 (1)术语型数据库:指专门存储并揭示各类名语、术语、词语的检索工具。大多是辞书、词典、百科全书等数字化版本。 (2)事实型数据库:指存储简单而独立存在的非文献信息,如机构、人物、产品、地理位置、事件等实体信息。如:各种人物数据库、机构名录数据库、产品或商品数据库等。 (3)数值型数据库:一种以自然数值形式表示、计算机可读的数据集合。信息检索技术布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“和(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。在文献检索系统中,All words 和 Any words表示各词之间的逻辑关系分别为_AND_和_OR_逻辑算符举例查找关于“动物保护”的文献: “动物”和“保护” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番茄)*(种植+栽培+培育)词组检索:通常在所检索词上加“”对所检索词视为词组处理例如:“动物保护”,表示动物保护是个词组,检索结果动物和保护不能分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。截词检索又称部分一致检索,是在检索词的适当位置进行截断,然后使用截词符代替,利用截断的词的一部分进行检索,检索词与文献部分一致性。截词检索是预防漏检,提高查全率尤其适用于英语,常用于处理词语的单复数,不同拼写方式,相同词根的相近意义词,以及动词的不同形式等。截词的类型:按照截词的位置,分为后截词 (前方一致),前截词(后方一致),中截词(中间一致和中间不一)。截词符:不同的检索系统所使用的截词符不同,常用的有“*”、“?”【重要】“*”、“?”的比较“*”,无限截词,代表多个字符如regard*, 代表regard, regarding, regardless, 等 absorb*“?”有限截词,代表0个或1个字符,如“wom?n”,则包含“woman,women”; 可以用“n?”来代表多个字符前截词、后截词、中间截词的比较前截词 将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。如:*computer 将检索出 computer、 minicomputer 、microcomputer等单词的文献。后截词 将截词符放在词根的后面,前方一致。如:grow* ,系统将检索出含有grow、growth、growing等词的所有记录中间截词 是将截词符号置于检索词的中间,而词的前后方一致。通常用于英、美不同拼写形式的词(英语单词)进行检索。如:colo?r 可检出的词为colour(英音)、color(美音)。 位置检索技术 利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。(W) (WITH)算符:表示两个检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论