文检1(生态城规).ppt_第1页
文检1(生态城规).ppt_第2页
文检1(生态城规).ppt_第3页
文检1(生态城规).ppt_第4页
文检1(生态城规).ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献检索,-给你一把打开知识宝库的钥匙,第一章 信息检索基础知识,1.1 信息源的类型与识别 指人们为满足信息需求而借以获得信息的来源。即信息产生的“源头” 。根据信息的载体和表达方式的不同,可以将信息源分为文献信息源和非文献信息源。 1.1.1 文献信息源 指用文字、图形、代码、符号、声音、视频等记录手段,将系统化的信息内容存储在各类载体上而形成的一类信息资源。 文献信息源必须具备文献的四大要素:知识(信息)、载体、记录方式与手段。 文献信息资源的数量大,所记载的信息固定、明确、成熟,是主要的信息传播体。在载体不被损坏的情况下,这类信息资源可以跨越时空反复多次为人类所利用。,1.1.2 非文献信息源 1、交往信息源 又称口头信息,可记录转化为文献。包含: (1)会议信息 (2)业务信息 2、电视、广播信息源 指通过广播、电视等媒介进行交流和传播的各种信息。 优点:传播性、即时性、范围广、共享性 缺点:内容缺乏深度、不便积累、选择性差 3、实物信息源 一切物质实体所蕴涵的丰富人息均可视为实物信息,它给人们提供了充分认识事物的物质条件。其特点是直观、真实、可信度高、实用价值大,但需要观察、分析、研究后才能探究其内含的信息。 特征:真实、外部特征性、隐藏性,1.2 文献信息源的类型与识别 1、按文献信息的物质载体 (1)印刷型:以纸质材料为载体、以印刷为记录手段存在的文献形式。 特点:方便阅读,便于流传;但占据空间大,不宜保管,难以实现自动化管理。 (2)缩微型:一般指以感光材料为载体、利用摄影等光学技术使印刷型文献缩小若干倍,固化到感光材料或其他载体上的一种文献类型。如缩微胶片、缩微胶卷等。一张全息胶片可存储20万页文献。 特点:体积小、存储容量大、便于保存和转移、成本低等优点。常用于珍贵文献的存储和收藏。缺点是必须借助专门机器才能阅读。,(3)视听型(声像型):是一种直接通过声音、图像传递知识的文献类型。它以感光材料和磁性材料为载体,借助特定的设备,采用声、光、磁、电等技术将信息表现为声音、图像、影视、动画等形式。如唱片、录音带、幻灯片、电影片、录像片等。特点是直观、形象。 (4)电子型:指一切以数字形式生产和发行的信息资源。包括各种数据库以及网上传递的各种网络信息资源。这类信息资源中的信息如文字、图片、声音、图像等都是以数字代码方式存储在磁带、磁盘和光盘等介质上。 特点:集文本、图片、声音、超链接等各种形式于一体,传播速度和更新速度快,时效性强,信息量大,同时具备完善的检索功能,不受时间、地域限制,可以随时随地存取。,2、按文献信息的出版形式分 根据出版频率、场合、讲述的内容以及文献本身的撰写格式与时效性等,文献信息可分为图书、期刊、专利文献、技术标准、会议文献、科技报告、学位论文、产品资料、技术档案、政府出版物等形式。 (1)图书(Book、monography) 是对是对已有科研成果与知识系统全面的概括和论述形成的一种出版物。 图书是传播知识、教育和培养人才的主要文献类型,一般可分两类: 一类是阅读类图书,包括教科书、专著、科普读物; 另一类是参考类图书(参考工具书),指专门为查找资料而编写的工具书,包括百科全书、字词典、手册等。 内容特点: 内容系统、全面、成熟可靠;出版周长,内容新颖性差。,外表特征: 图书没有统一开本,不连续出版,正式出版的图都有一个ISBN号,即国际标准书号(International Standard Book Number)。其定长为10个数字,分四节,分别表示地域号、出版社号、该出版社出版图书的流水号及计算机校验位 。由ISBN号可知该书的语种区、出版社、流水号等出版信息。 例如:ISBN7-308-04594-3/TP.99 7-代表中国,308是出版社代号,04593指该出版社的第4593种书,3是计算机校验号,TP指分类号。,著录特征: Indexing concepts and methods. H. Borko, H.Bernier, New York:Academic Press,1978 Domenichini G. Index of Entomophagous InsectsM. Hym:Eulophidae Palearctic Tetrastichinae,1975.9:5-100 网络信息资源的分析与利用.吴桂金.哈尔滨:东北林业大学出版社,2005,7 1牛春山. 陕西杨树M.西安:陕西科学技术出版社,1980.8:2-95.,(2)连续性出版物(periodical) 期刊(Journal)指有固定名称和统一的出版形式,按一定规律定期或不定期连续出版的文献载体,与报纸属于称连续性出版物。 内容特征: 同图书相比,具有内容新颖、出版周期短、报道速度快,信息量大、种类多等特点,能及时反映新成果、学科动向,且发行量大,影响面广。是交流学术思想常用的文献信息源,对某一问题要深入了解时,较普遍的办法是查阅期刊论文据数,期刊情报约占整个信息源的60%70%。 期刊按内容性质可分学术性、综述与述评性期刊、检索性期刊和科普性、动态性、通报性期刊,其中学术性期刊和技术性期刊对科研生产的参考价值较大。,外表特征: 统一的刊名,有连续的年、卷、期及页码; 有国际标准连续出版物刊号ISSN (International Series Standard Number), ISSN由8位数字分两段组成,如1000-0135,前7位是期刊代号,末位是校验号。 每一种期刊在注册登记时,就得到一个永久专属的 ISSN,一个 ISSN 只对应一个刊名;而一个刊名也只有一个 ISSN。 所以当该刊名变更时,就得另申请一个 ISSN。如果期刊停刊,那么被删除的 ISSN 也不会被其它期刊再使用。 通常表示期刊的单词有:journal(学报、杂志)、 annales(纪事)、 bulletin (通报)、transactions (汇刊)、proceedings(会刊)、 review(评 论)、 progress/advances in (进展)、 communication 、letters (通讯)、 news 国内公开:由CN + 地区号+ 国内标准连续出版物编号+中图法分类号组成,如CN11-2257/G3,11为北京。内部刊物:有准印证号。 例:浙江林学院学报 中国标准刊号ISSN1000-5692、CN 33-1085/S,外文期刊著录格式: An automated CAD system for progressive working of irregular shaped metal products and lead frame for semiconductors. J.C.Choi;C.Kim.Int. J. Adv.Manuf.Technol. 2000,16(9): 624-634 期刊论文的文献类型识别标识为J ,期刊论文在参考文献中的著录格式为: 4何新华,陈力耕,胡西琴. 杨梅属植物共生结瘤固氮研究进展J. 果树学报,2002, 19(5):351-355. 报纸 著录格式: The Once-simple Folk Tale Analyzed by Academe .Michael N. New York Times. 5 March 1984,15 报纸文献的文献类型标识为N 6杜建华. 中国计算机厂商的发展与出路N. 计算机世界, 1999-1-11(6).,(3)专利文献(Patent Document) 专利文献主要指专利申请人向专利局提出申请保护某项发明时提交的一份详细技术说明书。专利说明书主要涉及发明创造的技术内容和权利要求。专利文献具有涉及领域广、内容详尽、具体、可信度高,具有很大的实用价值。 专利说明书的识别特征:专利号由国别代码+流水号组成。如US、GB|、CN、DE等,如US473168,CN1016502A,专利说明书的著录: A blanket for an extended nip press with an isotropic woven base layers.Beloit Technologies Inc.,P. McCarten and E.Slagowski,1993,EP 0541538,19 May. Priority application:United States, 560403,31 July 1991. In English 这是一份1993年5月19日公布的欧洲专利文献,专利号为EP0541538。 专利文献的文献类型识别标识为P 7姜锡洲。一种温热外敷药制备方案P. 中国专利:881056073,1998-12-2.,(4)标准文献 标准主要指为工程建设或工业产品的质量、规格、检验方法等所作的技术规范。 经过公认权威当局批准的标准化工作成果,可以采用文件形式或规定基本单位(物理常数)这两种形式固定下来、以文件形式出现的标准化工作成果,就是标准文献。标准文献是从事经济建设、工业生产和科学研究的共同技术依据。 标准一般过若干时间就要进行修订, 新的标准不断地替代旧的标准。因此,查阅时应以最新标准为准。 著录特征:标准颁布国家或组织+标准名称+标准号+颁布时间 。 如:GB3354-1995 标准文献的文献识别标识为S 8GB3838-2002,中华人民共和国国家标准地表水环境质量标准S.,(5)会议文献(Conference Paper) 是指学术会议文献,指在国际和国内重要的学术或专业性会议上发表的论文及讨论记录等材料。 会议文献的专业性、学术性很强,信息量大,内容新颖,它往往反映出科学技术的发展趋势,代表了一门学科或专业领域最新的研究成果,反映着世界上科学技术发展的水平和趋势。会议文献对了解国内外科技水平、发展趋有较大参考价值,也是科技工作者重要的信息来源之一。 但其内容与期刊相比可能不太成熟。,会议论文的识别特征: (1)有表示会议的专门用词,主要名称有conference(大会)、meeting(小型会议)、symposium(讨论会)、proceeding(会议录)、paper(单篇论文)、transaction(汇报)等。 (2)有表示会议录的一些词,如:proceedings of、 Collections of等。 (3)有会议如开的地点、时间以及会议录的出版地、出版单位及年份等。 会议文献的文献类型识别标识为C 。,会议文献著录格式: 由会议论文名称、作者、会议名称、会址、会期、主办单位、会议录的出版单位等组成。 Performance of DBMS implementation of production systems. Maynard A. Proceedings of the 2nd Internationa IEEE Conference on Tools for Artificial Intelligence .Herndon,London UK, 1990,(London,Uk:Macmillan Press),p393-9 2辛希孟. 信息技术与信息服务国际研讨会论文集:A集C. 北京:中国社会科学出版社,1994. 注意:有些国际会议定期召开,其会议文献也定期出版,从而形成了连续性出版物,这些出版名称也有Proceeding等字样,但应作为期刊。Proceedings of the American Power Conference, Proceeding of the IEEE等。,(6)科技报告(Technical Report) 报道(记录)关于某项科研成果或进展,一项技术研制试验和评价结果。往往反映的是新兴科学和尖端科学的研究成果,能代表一个国家的研究水平。 特点: 内容专深、详尽、可靠,参考价值较大,它反映的科研成果和技术革新成果比期刊论文快, 因科技报告涉及尖端技术或国防技术等需要保密的问题,分绝密、秘密、内部限制发行和公开发行几个等级。大多数报告都是非正式出版的,获取比较困难。 我国每年发表科技报告5万余篇,中国科技信息研究所是我国科技报告的收藏单位。,著录特征: 报告名称、报告号、研究机构、完成时间等。一般有报告编写单位代码,如AD,PB,NASA,DOE等,但尤为重要的是,这种信息类型还有paper,technical report等字样。 技术报告在参考文献中的标准著录形式为: Bumes J.S. Application of approximation theory in antenna design, signal processing and filtering. Final report. AD-A244,725, Promethe-Sus Inc.,1991 AD-A244,725即为报告号,AD-A表示公开发行的AD报告,244-725为其编号。通过报告号一般可以初步判断报告由什么部门收藏,以便到相应的部分去获取原文。 科技报告的文献类型标识为R。,(7)学位论文 是高校研究生、毕业生为获得学位进行科学研究而写出的学术性论文。按学位不同可分为学士论文、硕士论文和博士论文。 硕士和博士论文具有一定的学术性、独创性、系统性和完整性, 具有重要的参考价值。但质量参差不齐。 学位论文一般不公开发表, 多数收藏在授予学位的大学图书馆或研究机构的文献信息中心。,著录特征: 一般有学位名称、授予学位的单位、导师姓名等。如:PhD Thesis(博士);MS Dissertation(硕士)。 题名.作者. 学位论文类型.保存地点:保存单位,年份 Maintaining Retrieval Effectiveness in Distributed. C.L. Viles. PhD thesis, Dept. Electrical Engineering, University of Virginia, June 1996 学位论文的文献类型标识为D 朱磊. 基于ORDB的WebGIS系统的研究和实现D. 北京:北京大学,1998.,(8)产品样本 一般是指产品样本说明书,是厂商或贸易机构为宣传和推销其产品而印发的免费赠给消费者的资料。如产品目录、产品样本、产品说明书、产品总览、产品手册等。如今,许多厂商已经开始利用互联网发布产品信息,网上可以找到不少产品资料。 著录特征:一般会有公司名称和表示产品样本的词。如users guide, catalog, guide book等。 Dougarra J.J,et al, LINPACK userss guide(SIAM, Philadelphia,PA,1979) (9)技术档案 技术档案是在生产或科研活动中形成的,有具体工程和研究对象的技术文件的总称, 包括任务书、协议书、技术经济指标、研究计划、方案、试验设计实验记录调查材料、总结报告等所有应入档的资料。技术档案有一定的保密性, 一般在内部控制使用。,(10)政府出版物 指各国政府部门及其专设机构所发表出版的文件,可分为行政性文件(国会记录、政论法令、政策、统计等)和科技文献两大类。 行政性文件:政府报告、会议记录、法令、条约、规章制度等; 科技性文件:科研报告、科普资料、科技政策、技术法规等。如我国政府发表的科学技术白皮书。 政府出版物具有正式性、权威性特点,对于了解各国政治、经济和研究各国科学技术发展状况具有独特的参考价值。 根据其性质可分:公开资料、内部资料、机密资料 这些文献源中最重要的是期刊、会议论文和专利。,3、按文献的加工程度分 (1)零次文献 又称灰色信息 。指末经公开发表或未交流于社会的原始信息。如科学家的网络会议的语音交流、私人笔记、文章草稿、情书、书信文稿、未发表的演讲稿、口头传播交流的信息以及各种内部档案等。 (2)一次文献 以作者本人的科研、生产和工作成果为依据而创作的原始文献。如阅读性图书、期刊论文、科技报告、专利文献、会议文献、学位论文、技术档案等都是一次文献。 特点:创造性、原始性、分散性(数量大、分散无序,难以全面获取)。,(3)二次文献 是指文献工作者对分散的无组织的一次文献进行搜集、提炼、浓缩、加工、整理,并按一定的科学方法组织编排、编辑出版的文献,是为了更有效地管理和利用一次文献而编辑的工具性文献。如各种目录、题录、文摘及机读型书目数据库、网上检索引擎等都属于二次文献。 (4)三次文献 是指对有关的一次文献和二次文献进行广泛深入的分析、研究、对比、综合、评述、概括而撰写的文献,如综述、述评、年度进展报告、百科全书、手册、年鉴、辞典等。其特点是文字精炼、叙述简明扼要,具有系统性、综合性、知识性和工具性等特点。 三次文献是高度浓缩的文献信息。,4、按文献信息公开程度 (1)白色文献 指一切正式出版并在社会上公开流通和传递的文献,包括各类图书、期刊、报纸、缩微胶卷、光盘、数据库等。其蕴涵的信息人人都可以使用。 (2)灰色文献 指非公开发行、流通和传递的文献,从正常途径难以获取的内部文献或限制流通的文献。如社会上公开传播的内部刊物、内部教材和会议资源等。 (3)黑色文献 一是指未破译或未被辨识的文献,如考古发现的古文;二是指处于保密状态或不愿公开其内容的文献,如未解密的政府文件、内部档案、私人日记、信函等。,1.2 计算机信息检索,1.2.1 信息检索的含义(Information Retrieval ) 信息检索是从任何信息集合中获取所需信息的过程及其所采取的一系列方法和策略。 广义概念是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息的存储与检索(Information Storage and Retrieval ) 。 狭义概念仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。有目的地针对文献信息的有序化集合所开展的查找活动及过程。,1.2.2 信息检索的类型 1、按信息组织方式与获取方式分 (1)手工检索 即是用人工来处理和查找所需信息的检索方式。 (2)计算机检索 是利用计算机和一定的通信设备为手段,通过光盘、联机和网络等现代检索方式进行的信息检索。 计算机检索按使用的设备和采用的通信手段分: 联机检索 光盘检索 网络检索,2、按检索对象内容分 (1)文献检索(document retrieval) : 是以文献信息为检索对象的信息检索。它为用户提供的是与用户的信息需求相关的文献信息,即相关文献的线索或原文。 文献检索根据检索内容不同分:书目检索和全文检索。 (2)数据检索(data retrieval) : 是以数值、图表形式表示的数据作为检索对象的信息检索,检索的结果是有关某一事物的具体答案。如:浙江省2006年胶合板产量。 (3)事实检索(fact retrieval) :以事实或文献中抽取的事项作为检索对象的信息检索。如某一事物发生的时间、地点、过程及人物等。,1.2.3 计算机检索系统的类型 1、文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数据库,即数据库记录的对象为文献信息时。包括目录型数据库、题录型、文摘型和全文型数据库。 (1)目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或收藏单位为基本著录单元,如“本”、“种”、“件”等。著录内容包括书(刊)名、作者、出版年月、出版地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机读目录数据库)、联合目录、出版发行目录等。,(2)题录、文摘型数据库 题录型:是将单篇文献的“篇”、“章”等为著录单元,如一篇论文、一份报告、一件专利等。如全国报刊索引。 文摘型:在题录的基础上每个著录单元再加上文摘,从而文献的内容生特征。如美国工程索引、科学文摘等。 此类数据库信息一般不自足,用户从中获取信息源信息后还需进一步去查找原文。 (3)全文数据库 指存储文献全文或其中主要部分内容的源数据库。存储内容主要有各种图书、期刊论文、法律条文及案例、新闻报道等。它将二次文献的检索同原文献的获取融为一体。,2、非文献型数据库 指一种能够直接提供具体的术语、事实和数值等信息的数据库。包括术语型数据库、事实型数据库和数值型数据库。 (1)术语型数据库 指专门存储并揭示各类名语、术语、词语的检索工具。大多是辞书、词典、百科全书等数字化版本。 (2)事实型数据库 指存储简单而独立存在的非文献信息,如机构、人物、产品、地理位置、事件等实体信息。 如:各种人物数据库、机构名录数据库、产品或商品数据库等。 (3)数值型数据库 一种以自然数值形式表示、计算机可读的数据集合。,1.3 计算机信息检索技术 1.3.1 布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。布尔逻辑算符是布尔逻辑检索中表达概念之间关系的一类运算符。基本的布尔逻辑算符有三种: 布尔逻辑组配是现行计算机检索的基本技术,主要通过“和(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。,1、逻辑“与”(AND,*) 逻辑“与”是具有概念交叉和限定关系的一种组配。其含义是检索出的记录必须同时含有所有的检索词。用“AND”或“* ”表示。 如A and B 或 A * B表示命中记录中必须同时含有检索项A和B。,如:鹅掌揪*黑斑病 红树林*生态系统 城市*景观*设计 居住区*规划 逻辑“与”起到缩小检索主题范围的作用,用逻辑“与”组构的检索词越多,检索范围越小,专指性越强,有助于提高查准率。 注:在运用时,应把出现频率低的检索词放在“与”左边,节省计算机处理时间,使否定的答案尽早出现,中断检索。,2、逻辑“或”(OR,+) 它用于两个或两个以上概念之间的并列关系运算,表示概念的相加,其含义是检出的结果中只需满足检索项中的任何一个或同时满足即可。 用“or”或“+”连接检索概念。 A or B 或 A + B 表示检索结果中单独含有检索项A或检索项B,或者同时含有A、B的均为命中记录。 可用其组配表达相同概念的检索词,如同义词、近义词、相关词等,以提高查全率。如“enterprise or company”。微藻 :algae+algal+microalgal LIU Hong-Jiang or Liu Hong Jiang or Hong-Jiang Liu or Liu, H.-J. or Liu, H.J. 果蔬:水果 or 蔬菜 or 果蔬,3、逻辑“非” (NOT,) 逻辑“非”是具有概念删除关系的一种组配,可从原检索范围中剔除一部分不需要的内容,即检出的记录中只能含有NOT算符前的检索词,不能同是含有其后的检索词。 A not B 或 A - B 表示含有检索A而不含检索项B的记录均为命中记录。例如,查找“国外林权制度”方面的文献可用“(林权制度+林权分制)NOT 中国” 例 查“玉米但不是甜玉米”方面的文献。 检索式=玉米甜玉米 查找“不包含花生油的食用油”可用“食用油NOT花生油” 逻辑“非” 缩小了检索范围,提高了检索的专指度。,4、优先算符 运算优先级顺序为NOT、AND、OR,可以用括号改变它们的运算顺序。 如:有A、B、C、D四个检索词(其中A和B,C和D分别为同义概念,两大概念之间是相交的关系)检索提问可以分步进行: 第一步:A OR B (结果为S1) 第二步:C OR D (结果为S2) 第三步:S1 AND S2 在实际检索中,通过使用优先处理算符“()”,三组检索提问也可以归并为一组,即一步完成: 输入:(A OR B) AND (C OR D) 例:对“微藻生长因子”这一课题来说,检索策略可编为: (algae or algal or microalgal) and growth and factor? 检索有关“退化生态环境的恢复”文献 退化*生态环境*(恢复+重建),1.3.2 截词检索 计算机检索时利用检索词的词干或不完整词形进行查找的过程称为截词检索。它通过在检索词的词干上加一个截词符号,以表示对该词的各种词性的完整词进行检索。 截词检索能起到扩大检索范围,提高查全率的作用。 一般用“?”和“ * ”表示截词符。要注意在不同的系统中,使用的符号及其含义有所不同。截词的方式有多种。,(1)按截断的字符数量可分为有限截词和无限截词两种。 有限截词 将N个截词符“?”放在检索词的词干中或词尾可能变化的位置上,若在词尾,在N个“?”后空一格再加一个“?”,N个“?”表示截词的位数为0N个字符,最后一个“?”表示停止符。例如,“stud? ?”表示在词尾上有03个可变字符,则检出有study studies studied 等词的记录。又如“wom?n”表示在词干中有1个可变字符,则检出有 woman 、women等词的记录。,无限截词 检索词干后加1个“?”或“*”,表示该词词尾允许变化的字符数不受任何限制。例如“comput?(或comput*)”,则可检出有computer(s)、computing、computerization等词。 (2)按截词的位置可以分为前截词、后截词、中间截词或称为前方一致、后方一致、中间一致和中间不一: 前截词 将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。 后截词 将截词符放在词根的后面,前方一致。如:manag*,sk 可检索出含有managing、management、manager等词的所有记录。金属” metal* : metal 、metals、metaled、metalist等。,使用前方一致的截词方法时需注意:避免检索词的词干截得过短,否则可能会检出大量不相关的文献。 中间截词 它是将截词符号置于检索词的中间,而词的前后方一致。通常用于英、美不同拼写形式的词(英语单词)进行检索。如:colo?r 可检出的词为colour(英音)、color(美音)。,截词检索在中文数据库中截的是词意, 例:西北? 分别检出了:西北农林科技大学学报、西北园艺、西北纺织学院学报等。 利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。,1.3.3 位置检索技术 位置算符适用两个检索词以指定间隔或者指定的顺序出现的场合,位置算符是调整计算策略的一种重要手段。 它能避免布尔逻辑算符不考虑检索词位置关系而引起的检索误差。因为布尔逻辑检索仅反映了参加运算的检索词在命中记录出现与否,而不考虑其位置关系。用词间位置算符来限定和组配检索词,可弥补布尔逻辑算符只是定性规定检索词的范围,而没有限定检索词位置关系,易造成误检的不足。 在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。,位置检索可要求检索词以用户所规定的相对位置出现。常用的位置算符有以下8种: (W) (WITH)算符 表示两个检索词紧挨着,词序不能颠倒, 中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。 例如:X(W)ray表示包含 x ray 和 x-ray 的文献记录均被命中,IBM(W)PC表示包含IBM PC和IBM-PC的文献记录均被命中。 (Wn) A(Wn)B :表示 AB两词靠近,次序为A先B后,中间最多可加n个词,词序不能颠倒。 例1:检索题目含有“杂交玉米”的外文期刊信息,“杂交玉米”英文是“hybrid corn”。要求“杂交”和“玉米”两词间隔最多2个词,前后次序固定,这样可能检索出“杂交甜玉米”,而不检索出“玉米的杂交”技术。 如果在EBSCO选择TITLE字段,应该输入:hybrid W2 corn. 在Elseviver数据库中则为hybrid W/2 corn,例2: X(W)ray表示包含 x ray 和 x-ray 的文献记录均被命中,IBM(W)PC表示包含IBM PC和IBM-PC的文献记录均被命中。 environment(w)protection则检索出environment protection, environment- protection的记录。 例3: water(w1) pollution可检索出water pollution、water resource pollution等,但不能检出pollution of water。, N(Near)算符 A(N)B 表示AB两词靠近,中间不允许插入任何词,但次序可颠倒。 如:building (N) construction可检索出buildingcoustruction, construction building,construction-building的记录。 A Nn B表示两个检索词中间最多可插入n个词, 它们之间的顺序可颠倒。 如:Cotton (N2) processing 则表示包含cotton processing, processing of cotton,processing of Chinese cotton等的文献记录都会被命中。 water (n1)control可以检索出water pollution control和control of water pollution。 A pre B,1.3.4 限制检索技术 限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。检索方式主要有限定字段检索和限定范围检索两种。,1、限定字段检索(检域限制) 字段限制也称检域限制,限定字段检索即是指定检索词在记录中某一具体的字段中出现,检索时,计算机只在限定字段内进行匹配运算,以提高检索效率。 数据库字段可分为表达文献内容特征的基本字段和表达文献外表特征的辅助字段两种。 基本字段有: title(Ti)、Abstract(AB)、关键词(KW) 主题词(subject)等。 辅助字段有: 作者Author(AU)、 作者单位(Affiliatin)、期刊名称Journal(JNSO)、出版年份Publication Year(PY)、出版国Country(CO)、文献类型Document Type(DT)、语种 Language(LA)等。,基本字段指表达文献内容特征的字段,如题名、文摘、叙词等。辅助字段指表达文献外表特征的字段,如著者、刊名、出版年、语种、文献类型等。 字段符用前缀方式分别表示为AU=,JN=,PY=、LA=,DT=,检索时将检索词放在前缀字段符之后,如AU=Evans,A., LA=Chinese 检索字段符用后缀方式表达。将检索词放在字段代码之前,之间用字段限定符号:in 或/。 如:garments/AB。 TI :限在题目中查 AB: 限在文摘中查 AUTHOR: SITE: 例:查“玉米方面的英文”文献,在CABI数据库中 检索式=(maize or zea-mays or corn)in de and(English in la),2、限定范围检索 限定范围检索是通过限制信息的检索范围,以达到优化检索的方法。通过使用限定符来限定检索范围。不同的检索系统略有不同,常通过使用的有: “ :或- ”指包含范围,如出版年=1996:2005、邮政区号ZIP=0210002199 “ 、 = 、=” 如: PY=1995 即限定出版年份为1995及以后的文献。 LA=Chinese 即限定原文语种为中文。 文献类型限定:review report、 thesis 、dissertation 、meeting paper。,1 .4 信息检索的过程与步骤 检索策略指在分析课题内容的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑关系和查找步骤等。 1.4.1 分析检索课题 了解检索目的,明确课题的主题或主要内容,课题涉及的学科范围,所需信息的数量、出版物类型、年代范围、语种,课题对查新、查准和查全的指标要求,有关著者、机构等。,1.4.2 选择数据库 1、若需要某一课题系统、详尽的信息,如撰写博硕士论、申报研究课题、专利鉴定等,该类检索要求文献全面、系统,这时就应尽可能选用一些收录年份较长的综合性和专业数据库。 2、有关最新信息 可以采用更新及时联机数据库、网络数据库外,还可能用搜索引擎来查找。 3、了解某一方面的信息,以解决一些具体问题。如一般论文写作、人物资料及其它相关参考资料等,此类检索针对性强,不需要查找大量资料,可选择一般的数据库和网络搜索引擎。,若要了解某学科、理论、课题等最新进展和动态,则要检索最近的文献信息,强调“新”字; 若要解决研究中某具体问题,找出技术方案,则要求检索有针对性、能解决实际问题的文献信息,强调“准”字; 若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调“全”字。,4、其它要考虑的因素 考虑权威性数据库; 数据库的学科专业范围是否与课题的学科相吻合; 需要的是题录、文摘信息还是全文信息,还是事实、图形、数据等; 数据库收录的文献类型、年限、更新周期,所需文献信息在国别和语种是否符合检索需求等。,1.4.3 确定检索词 1、分析出课题涉及的主要概念,将检索概念转化为检索词。检索词一般指反映课题概念的名词或名词性词组 (1)先从字面上将检索课题切分,再去除无检索意义的词语; 如:适用于渔船的小型海水淡化设备的研发。可切分:渔船/小型/海水淡化设备/研发。去除重复与无意义的检索词后为“小型/海水淡化设备”或“渔船/海水淡化设备”。用切分法提取检索概念,先直接采用复合概念。如海水淡化设备; (2)将复合概念拆分为简单概念,再转化为检索词。如“海水淡化*设备”或“海水*淡化*设备”;,2、检索词选取时应注意的几个问题 尽可能地考虑其同义词、近义词、相关的词等,以保证查全率。具体有以下几种情况: 同物异名:西红柿又称蕃茄, VC”、“维生素C”、“抗坏血酸; 全称与简称、同一名词的单数、复数、动名词、过去分词等用截词解决。 :计算机辅助设计简称为CAD( Computer Aided Design); 学名与俗名、植物和动物名的英文、拉丁名等;如:计算机与电脑、自行车与脚踏车,电力系统与电网; 意译名与音译名:发动机与引擎,电动机与马达,激光器与镭射;,相近词:设备与装置,低碳经济、绿色经济、循环经济,土地评价(land evalution )与土地评价(land assessment) 蒸发与蒸腾,固氮菌与根瘤菌,土地评价(land evalution )与土地评价(land assessment), 蒸发与蒸腾,气候与气温,biological prevention 与 biological treatemnt ; 异地名:信息与资讯,投资基金与单位信托; 一词多译:电网可译:power network electric network 同一名词的单数、复数、动名词、过去分词等用截词解决。,考虑上位概念与下位概念词 如是属种、整体与部分关系,则必须列出其所属的概念。如水果榨汁,不仅选fruit,还要选各种水果; 但如是某种水果保鲜,则还应包括水果保鲜。 飞机在农业上的应用:飞机*(农业+播种+施肥+喷雾+喷粉杀虫+降雨) 找不到课题对应的主题词时,可采用最近一级的上位词标引。 固体废物质量评价与土壤质量评价 菜园土壤与农业土壤 种子干燥与种子贮藏 固氮菌肥料与微生物肥料,一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频词。如“分析”、“研究”、“应用”、“建立”、“方法”、“发展”、“设计”等。必须用时,应与能表达主要检索特征的词一起组配,或增加一些限制条件。,3、排除无关概念

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论