版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科技信息检索第一章第1页,课件共146页,创作于2023年2月开设本课程的意义一、高校培养人才的职能要求二、信息时代对人才的客观需要:有利于学生专业知识的学习和知识面的拓宽,能够捕捉信息,立足于社会。三、学生本身的现实需要:1、课程设计2、毕业设计第2页,课件共146页,创作于2023年2月教学方法和结课成绩讲授、实习与自学相结合作业、考试相结合总学时:32h课时分配:课堂讲授12学时实习16学时复习2学时考试2学时第3页,课件共146页,创作于2023年2月课程介绍第1章科技信息检索概述第2章中文科技信息检索工具第3章计算机信息检索第4章网络科技信息资源检索第5章国外科技信息检索工具第6章专利文献检索第4页,课件共146页,创作于2023年2月第一章信息检索概述基本概念科技信息的类型信息检索的语言信息检索原理与技术科技信息检索的作用、策略与方法信息检索效果评价科技信息的应用复习思考题第5页,课件共146页,创作于2023年2月信息(information)信息是自然界和人类社会各种事物运动变化及其存在状态的本质属性和客观反映。信息无时无处不在,信息永远存在。简而言之,信息就是事物发出的信息,是事物运动的状态与方式的反映。特点:传递性、加工性、存储性、时效性。第6页,课件共146页,创作于2023年2月知识(knowledge)
知识是人们在改造世界的实践中所获得的认识和经验的总和,是对客观世界物质形态和运动规律的认识。知识来源于信息,是信息的一部分。简而言之,知识是理性化、优化和系统化了的信息。特点:传递性、加工性、存储性、时效性。第7页,课件共146页,创作于2023年2月情报(intelligence)情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,并产生效用的知识或信息。三种基本要素:知识、传递和效益。知识是情报的实体,传递是情报的表现形式,效益是情报的结果。特点:传递性、加工性、存储性、实用性。第8页,课件共146页,创作于2023年2月文献(Document)文献是指用文字、图像、符号、声频、视频等技术手段记录在一切载体材料上的人类知识。知识、载体和记录是构成文献的三个要素。特点:传递性、加工性、存储性、时效性、借鉴性。第9页,课件共146页,创作于2023年2月范畴关系信息是事物本质属性的反映;知识来源于信息,是理性化、优化、系统化了的信息;情报是解决特定问题所需要的特定的知识;文献是信息、知识、情报的载体。第10页,课件共146页,创作于2023年2月理解:信息包含知识,知识是信息的一部分,情报包含信息和知识的特征,是活化的知识,能为人们所利用。逻辑关系:信息>知识>情报,而信息、知识、情报是文献的实质性内容。第11页,课件共146页,创作于2023年2月范畴关系信息知识情报文献内容第12页,课件共146页,创作于2023年2月科技信息检索的概念应用现代信息检索理论并借助各种检索工具和技术,从浩如烟海的科技信息源中获取所需信息的过程。第13页,课件共146页,创作于2023年2月信息检索的几种类型
1.按检索对象划分(1)文献检索(2)数据检索(3)事实检索2.按检索手段划分(1)手工文献检索(2)计算机文献检索
(3)网络文献信息检索3.按检索方式划分(1)分散性检索(2)系统性检索第14页,课件共146页,创作于2023年2月文献检索
(DocumentRetrieval)指从各种载体的文献群中查找出与特定的检索课题匹配或相关的文献线索或文献全文的过程。查找某一课题、某一著者、某一地域、某一机构、某一事物的有关文献。检索工具:书目、索引、文摘等。检索结果:题录、文摘或全文及出处等文献资料。第15页,课件共146页,创作于2023年2月数据检索
(DataRetrieval)将观察或实验得到的数据经过筛选、分析、整理和鉴定,以一定的顺序存贮在某种载体上,然后采用适当的方法或手段从中找出符合用户所需的数据的过程。检索结果:数据。例如某种金属的熔点,某种材料的电阻。另外,有关计算公式、数据图表、化学分子式等都属于数据检索范畴。
第16页,课件共146页,创作于2023年2月事实检索
(Factretrieval)将基本事实预先纪录于某种载体,当需要这种信息时再提取出来的过程。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点、过程等。检索工具:字典、辞典、百科全书、年鉴手册、类书、政书、名录等参考工具书。检索结果:事实结论。第17页,课件共146页,创作于2023年2月小结信息检索的对象主要是文献,因此,在三种信息检索类型中,文献检索是最主要、最基本的形式,是信息检索中最重要的部分。第18页,课件共146页,创作于2023年2月1.2科技信息的类型按载体形式划分按加工层次划分按出版形式划分第19页,课件共146页,创作于2023年2月1.按载体形式划分印刷型:纸张;手写、印刷;阅读方便、占用体积大,不便于管理和长期保存。缩微型:感光材料;缩微照相;阅读不便、占用体积小,存储密度大,便于保存和传递,须专用设备。机读型:磁性材料;激光、编码、程序设计;存储密度极高、存取速度快,须计算机。声像型:感光材料、磁性介质;感光、电磁转换;形象,直观性强。网络型:网络平台;链接;检索方便。第20页,课件共146页,创作于2023年2月2.按加工层次划分一次文献:是作者以生产与科研工作成果为依据,而创作、撰写形成的文献。
特点:新颖性,创造性,系统性,参考价值高。
如:期刊论文、科技报告、会议论文、专著、专利文献、报纸等。
第21页,课件共146页,创作于2023年2月二次文献:是指对一次文献信息进行加工、提炼、浓缩,而形成的工具性文献。
它反映一次文献的外部特征(题名、作者、文献物理特征)和内容特征,将分散、无序的文献信息有序化、系统化,是文献检索的工具,也称检索工具。通过二次文献可以很方便的找到一次文献,或了解一次文献的内容。如:目录、题录、文摘、索引、各种书目数据库等。特点:浓缩性,汇集性,有序性。
第22页,课件共146页,创作于2023年2月三次文献:是指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩、评述等深加工,而形成的文献。
如:综述、述评、词典、百科全书、年鉴、指南数据库等。
特点:源于一次高于一次,再创性,参考价值高。第23页,课件共146页,创作于2023年2月
零次文献:是未经出版发行的或未进入社会交流的最原始的文献。
特点:内容新颖,具有原始性,不成熟,分散,难于检索。第24页,课件共146页,创作于2023年2月各级文献产生状况生产者生产工艺产品形态一次文献科研人员科研实验科研论文、报告二次文献文献工作人员加工整理文摘、目录三次文献专家学者浓缩重组手册年鉴第25页,课件共146页,创作于2023年2月3.按出版形式划分图书(Book)期刊(Periodical、Journal、Serial)科技报告(Sci-TechReport)会议文献(ConferenceLiterature)专利文献(PatentLiterature)标准文献(StandardLiterature)学位论文(Thesis,Dissertation)政府出版物(GovernmentPublication)产品资料(ProductLiterature)科技档案(TechnicalRecords)报纸(Newspaper)第26页,课件共146页,创作于2023年2月图书
(Book)定义:指对某一领域的知识进行系统阐述或对已有研究成果、技术、经验等进行归纳、概括的出版物。特点:内容比较系统、全面、成熟、可靠,但传统印刷业图书的出版周期较长,传递信息速度慢,电子图书的出版发行可弥补这一缺陷。分类:阅读性图书和工具书。识别依据:书名、著者、出版地、出版社、出版时间、总页数、国际标准书号(ISBN)等。第27页,课件共146页,创作于2023年2月国际标准书号(ISBN):ISBN-国际标准图书编号(InternationalStandardBookNumber)。2007年以前:10位数,分四段:地区或语种号+出版商代号+书名号+校验号。
如:7-5064-2595-5
;7-地区或语种号,中国大陆;5064-出版商代号,国防工业出版社;2595-书名号,流水号;5-校验码,可辨真伪。第28页,课件共146页,创作于2023年2月从2007年1月1日后:升级为13位数字。分为5部分:即在10位数前加上3位ENA(欧洲商品编号EuropeanArticleNumbering)图书产品代码“978”,这样书号标识与物品标识就完整结合在一起了。上面的ISBN
编号显示为:
ISBN
978-7-5064-2595-7
第29页,课件共146页,创作于2023年2月这样,EAN产品代码成为了ISBN的一部分,13位数的ISBN系统就与国际供应链上的EAN-UCC系统完全吻合了,出版物从此不再作为另类产品,有独立的渠道发售,而是作为产品的一个分支存在,在贸易上的运做更容易进行,同时也可以预防任何可能的混淆、重复和错误的问题。
我国于1991年加入国际物品编码协会(EAN),1993年开始在出版物上使用条码,预计新标准的实施将不会给出版业的各个环节带来障碍。第30页,课件共146页,创作于2023年2月期刊
(Periodical、Journal、Serial)定义:指有固定名称、版式和连续的编号,定期或不定期长期出版的连续性出版物。特点:内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强.分类:按学科范围:综合性期刊和专业性期刊;按内容和性质:学术性期刊、快报性期刊、检索性期刊、科普性期刊等。识别依据:期刊名称,期刊出版的年、卷、期,国际标准刊号(ISSN)等。第31页,课件共146页,创作于2023年2月附:ISSN-国际标准期刊编号(InternationalStandardSerialNumber):8位数,分两段:期刊代号+效验号,如1000-0135.1000-013是期刊代号;5是校验号。第32页,课件共146页,创作于2023年2月我国正式出版期刊的刊号:地区号+报刊登记号+《中图法》分类号地区号依《中华人民共和国行政区划编码表GB2260-82》取前两位。如北京为11、天津12、上海31、辽宁21、吉林22。
如CN11-2257/G311—北京2257—报刊登记号G3—中图法分类号第33页,课件共146页,创作于2023年2月科技报告
(Sci-TechReport)定义:也称技术报告、研究报告,是科学研究工作和开发调查工作成果的记录或正式报告,这是一种典型的机关团体出版物。特点:内容新颖、详细、专业性强、出版及时、传递信息快,每份报告自成一册,有专门的编号,发行范围控制严格,不易获取原文。
第34页,课件共146页,创作于2023年2月识别依据:报告名称、报告号、研究机构、完成时间等。分类:按时间:初期报告、进展报告、中间报告、终结报告;按流通范围:绝密报告、机密报告、秘密报告、非密限制发行报告、公开报告、解密报告等。报告号--报告单位缩写代码+流水号+年代号第35页,课件共146页,创作于2023年2月
PB(PublicationBoard)--美国国家技术信息服务处出版。内容涉及广泛,包括自然科学和工程技术所有学科领域,主要侧重民用工程,如土木建筑、城市规划、环境保护、生物医学等方面。PB报告的编号为“PB+年代+顺序号”。美国政府四大报告第36页,课件共146页,创作于2023年2月AD(AccessionDocument)--美国国防技术信息中心出版。主要报道美国国防部所属的军事机构与合同单位完成的研究成果,主要来源于陆海空三军的科研部门、企业、高等院校、国际组织及国外研究机构。AD报告的内容涉及与国防有关的各个领域,如空间技术、海洋技术、核科学、自然科学、医学、通信、农业、商业、环境等38类。
第37页,课件共146页,创作于2023年2月NASA(NationalAeronauticsandSpaceAdministration)--美国国家航空宇航局。
内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象学、天体物理、通信技术、激光、材料等方面。
第38页,课件共146页,创作于2023年2月DOE(DepartmentOfEnergy)----美国能源部。主要报道能源部所属的研究中心、实验室以及合同户的研究成果,也有国外能源机构的文献。内容包括能源保护、矿物燃料、化学化工、风能、核能、太阳能与地热、环境与安全、地球科学等。DOE报告没有统一的编号,它的报告号是由研究机构名称代号+顺序号组成。第39页,课件共146页,创作于2023年2月会议文献
(ConferenceLiterature)定义:指在各种学术会议上交流的学术论文。特点:内容新颖、专业性和针对性强,传递信息迅速,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向。分类:按出版时间:会前文献和会后文献。
会前文献主要有会议论文预印本和会议论文摘要。
会后文献是会后经整理出版的文献,如会议录(Proceedings)、会议论文集(Symposium)、会议论文汇编(Transactions)、会议丛刊、丛书等。第40页,课件共146页,创作于2023年2月按会议的范围:国际性会议、全国性会议、地区性会议等。
识别依据:会议名称、会址、会期、主办单位、会议录的出版单位等。第41页,课件共146页,创作于2023年2月专利文献
(PatentLiterature)定义:实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。包括:专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件。专利的含义:两个方面:一是专利权在法律规定有效期内,对其发明享有专有的权利。二是取得专利权发明的本身。第42页,课件共146页,创作于2023年2月分类:按专利权种类分:发明专利(InventionPatent)、实用新型专利(UtilityModelPatent)和外观设计专利(DesignPatent)。
按法律状态分:申请说明书、公开说明书、审定说明书、公告说明书。
第43页,课件共146页,创作于2023年2月特点:(1)内容新颖、出版迅速。(2)涉及技术领域广泛、实用性强。(3)具有法律效力。(4)技术上具有单一性和保守性。(5)重复量大。第44页,课件共146页,创作于2023年2月标准文献
(StandardLiterature)定义:经过公认的权威机构批准的以特定的文件形式出现的标准化工作成果。是组织现代化生产、进行科学管理的具有法律约束力的重要文献。包括标准名称、内容、使用范围、颁布时间、颁布机构等。特点:描述详细、完整、内容可靠、实用,有法律约束力,其时效性强,适用范围明确,是从事生产、设计、管理、产品检验、商品流通、科学研究的共同依据,也是执行技术政策所必需的工具。第45页,课件共146页,创作于2023年2月分类:按内容分:基础标准、产品标准、方法标准、安全卫生标准等;按成熟程度分:法定标准、推荐标准、试行标准;按使用范围分:国际标准、区域标准、国家标准、行业标准、企业标准等。
第46页,课件共146页,创作于2023年2月国家标准分为强制性的国标(GB)和推荐性的国标(GB/T);国家标准:GB/T20621-2006化学法复合二氧化氯发生器GB/T20628.1-2006电气用纤维素纸第1部分:定义和一般要求。
第47页,课件共146页,创作于2023年2月行业标准代码以主管部门名称的汉语拼音声母表示,如JT表示交通行业标准;例:行业标准:HG/T2268-2009钢制机械搅拌容器技术条件DL/T435-2004电站煤粉锅炉炉膛防爆规程QC/T796-2008汽车燃料消耗量标识第48页,课件共146页,创作于2023年2月企业标准编号:Q/省、市简称+企业名代码+年份企业标准:Q/XXX0001~0100-2008Q代表企业标准,XX为企业代号,0001~0100为标准编号,从1到100顺序编写,2008为年代号
第49页,课件共146页,创作于2023年2月国际标准化组织(InternationalOrganizationforStandardization)简称ISO,是一个全球性的非政府组织,是国际标准化领域中一个十分重要的组织。主要功能是为人们制订国际标准达成一致意见提供一种机制。ISO质量体系标准包括ISO9000、10000及14000三种系列。ISO9000标准明确了质量管理和质量保证体系,适用于生产型及服务型企业。ISO10000标准为从事和审核质量管理和质量保证体系提供了指导方针。ISO14000标准明确了环境质量管理体系。第50页,课件共146页,创作于2023年2月识别的依据:标准级别、标准名称、标准号、审批机构、颁布时间、实施时间等。标准号=国别(组织)代码+顺序号+年代。附:中国标准文献中心:中国标准化综合研究所标准馆。国际标准化机构中最重要、影响最大的两个组织:国际标准化组织:ISO国际电工委员会:IEC第51页,课件共146页,创作于2023年2月学位论文
(Thesis,Dissertation)定义:指高等学校或研究机构的学生为取得某种学位,在导师的指导下撰写并提交的学术论文,它是伴随着学位制度的实施而产生的。识别依据:学位名称、导师姓名、学位授予机构等。
国家法定学位论文收藏单位--中国科技信息研究所。第52页,课件共146页,创作于2023年2月政府出版物
(GovernmentPublication)定义:指各国政府部门及其所属机构出版的文献,又称官方出版物。包括:行政性文献(立法、司法文献):政府法令、方针政策、规章制度、决议、指示、统计资料等,主要涉及政治、法律、经济等方面;科技文献:政府部门的研究报告、标准、专利文献、科技政策文件、公开后的科技档案等。第53页,课件共146页,创作于2023年2月作用:政府出版物对了解各国的方针政策、经济状况及科技水平,有较高的参考价值,一般不公开出售。美国政府出版局:GPO是世界上最大的出版机构。英国皇家出版局:HMSO第54页,课件共146页,创作于2023年2月产品资料
(ProductLiterature)定义:厂商为推销产品而印发的介绍产品情况的文献,包括产品样本、产品说明书、产品目录、产品介绍等。内容:产品的规格、性能、特点、构造、用途、使用方法等的介绍和说明。特点:反映的技术比较成熟,数据较为可靠,内容具体、通俗易懂,常附较多的外观照片和结构简图,形象、直观。作用:技术人员设计、制造新产品的有价值的参考资料,也是计划、开发、采购、销售、外贸等专业人员了解各厂商出厂产品现状、掌握产品市场情况及发展动向的重要信息源。第55页,课件共146页,创作于2023年2月科技档案
(TechnicalRecords)定义:指在自然科学研究、生产技术、基本建设等活动中所形成的应当归档保存的科技文件。包括:课题任务书、计划、大纲、合同、施工图纸,试验记录、研究总结、工艺规程、工程设计图纸、施工记录、交接验收文件等。特点:内容真实、详尽、具体、准确可靠,保密性强,保存期长久,是科研和生产建设工作的重要依据,具有很大参考价值,它通常保存在各类档案部门。第56页,课件共146页,创作于2023年2月报纸
(Newspaper)定义:以新闻、消息报道为主要内容的连续出版物。特点:品种多,数量大,报道速度快,时效性强的特点。分类:按出版周期:日报、周报、旬报等;按内容特点:综合性、文摘性及专业性报纸等。作用:报纸是科技工作者了解新成果、研究趋势和有关科技政策的一种重要文献。
此外,还有新闻稿、工作札记等。第57页,课件共146页,创作于2023年2月1.3信息检索语言检索语言表述文献外表特征表述文献内容特征题名、刊名责任者姓名专利号、档案号等分类号主题语言分类语言叙词关键词第58页,课件共146页,创作于2023年2月
检索语言又称标引语言、索引语言等,是信息检索系统存储和检索信息时共同使用的一种共同语言。即在文献存储时,文献的内容特征(分类、主题)和外表特征(书名、著者)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵循的语言就是检索语言。信息检索语言实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础。检索的匹配就是通过检索语言的匹配来实现的,使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。第59页,课件共146页,创作于2023年2月一、体系分类语言体系分类语言是按照一定的观点,以学科分类为基础,用逻辑分类的原理,结合信息的内容特征,运用概念划分的方法,按知识门类从总到分,从上到下,层层划分,逐级展开组成分类表,并以分类表来标引、存储信息和检索信息。
目前,国际上通用的体系分类表有《国际十进分类法》(简称UDC),国内通用的体系分类表有《中国图书馆图书分类法》(简称《中图法》)。第60页,课件共146页,创作于2023年2月《中国图书馆图书分类法》《中图法》是我国当代具有代表性的图书分类法,是一部大型的综合性的图书分类法。它是根据文献各级类目之间的逻辑关系(如从属关系、并列关系、相关关系、交叉关系等)编排而成的一个逐级展开的排列表。
《中图法》由五大基本部类和22个基本大类、简表、详表、通用复分表组成。第61页,课件共146页,创作于2023年2月基本部类中图法5个基本部类马克思主义、列宁主义、毛泽东思想哲学综合性图书社会科学自然科学第62页,课件共146页,创作于2023年2月中图法二十二个大类A马克思主义、列宁主义、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学Z综合性图书第63页,课件共146页,创作于2023年2月F、经济(二级类目)F0政治经济学F1世界各国经济概况、经济史、经济地理F2经济计划与管理F3农业经济F4工业经济F5交通运输F6邮电经济F7贸易经济F8财政经济第64页,课件共146页,创作于2023年2月二、主题语言
关键词语言是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。所谓关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。也可看成是一种自然语言。例:“科技文献信息检索”中的关键词很多,它包括:“科技”、“科技文献”、“文献”、“文献信息”、“信息”、“信息检索”、“文献检索”和“检索”第65页,课件共146页,创作于2023年2月规范化主题词(叙词、标题词)语言叙词是主题语言的高级形式。是以较正规和正式的科学名称为基础组织而成一种主题法检索标识系统。由在概念上不可再分的基本概念单元词汇组成,检索时可以利用这些单元词进行组配,以表达一个复杂的概念。叙词表作为检索过程必不可少的辅助工具,由检索工具出版单位编制,专书专用。是由二次文献编撰单位出版的限制使用的主题词体系。如:课题:太阳能热水器研究汉语主题词表中正式主题是太阳能利用、太阳能加热等代替。第66页,课件共146页,创作于2023年2月标题词与叙词一样是以较正规和正式的科学名称为基础的一种主题法检索标识,但存在主、副标题词固定搭配,即属于先组式检索语言。如:
MOTORS-control-manufacture第67页,课件共146页,创作于2023年2月选择规范主题词过程中应注意:1一般为事物的名称或过程2具有实质意义的词3适度专指性。避免泛指性词4通用性有时不能只从字面上选词。需要时进行必要的替换、补充。如“运用计算机程序建立气候模式”应选计算机摸拟和气候模拟。第68页,课件共146页,创作于2023年2月1.4信息检索原理与技术信息检索工具信息检索原理信息检索技术第69页,课件共146页,创作于2023年2月信息检索工具从整个文献信息检索过程来看,无论是存贮还是检索,都离不开检索工具。检索工具是报道、存贮和查找文献线索的工具。一般来说,检索工具由文献信息库和逻辑语义工具两大部分组成。文献信息库是检索工具的主体,在计算机、光盘检索中,也称为数据库。完整的文献库由说明、目录、正文、索引和附录五部分组成。逻辑语义工具即检索语言、规则等,是沟通文献标引人员与检索人员双方思想的媒介。它独立于具体的检索工具之外,作为软件为若干检索工具所通用。第70页,课件共146页,创作于2023年2月手检工具:手检工具的类型很多,按其不同的特征可划分出不同的类型。按出版形式分:卡片式,书本式(期刊,单卷,附录式);按收录范围分:综合性检索工具,专业性检索工具;按著录方式分:题录,文摘,索引。第71页,课件共146页,创作于2023年2月题录:是描述文献信息外部特征(题名、著者、出处、文种、年卷期、页次等)的文献条目,并按一定的方式编排起来的集合体。题录著录的对象可以是整体文献(比如一本书),也可以是单篇文献(比如一篇文章)题录性检索工具:《全国新书目》、《全国外文期刊联合目录》、《中国社会科学文献题录》、《国外社会科学论文索引》及美国的《化学题录》等。第72页,课件共146页,创作于2023年2月文摘:文摘是除题录部分外还对文献内容作实质性描述的文献条目。有时也称摘要、提要或简介。文摘只对文献的内容作简洁、准确的摘录,是原始文献浓缩后的产物。它既包含文献的外部特征,又包含文献的内容特征,且编写中不得加入编写人员任何主观性见解和解释说明,它必须忠于原文、基于原文。第73页,课件共146页,创作于2023年2月索引就是将文献信息中某些具有检索意义的文献特征标识(如人名、地名、序号、主题词、分类号、分子式等),按一定的顺序加以排列,并注明其所在文献信息中的位置(如文摘号、页码、版次等),以便检索相应文献信息的检索工具。索引在这三种检索中应用最广。不仅有单独出版的索引刊物,如《人民日报索引》、《资本论索引》等,还在许多文摘题录性检索刊物之后附有各种辅助索引,如主题索引、著者索引、专利索引等等。,尤其是辅助索引的应用很普遍,现已成为检索工具不可分割的一部分。第74页,课件共146页,创作于2023年2月机检工具是指检索者必须借助各种设备才能使用的检索工具。这类工具大多以缩微型和机读型的形式出现。机检工具的类型:按容纳信息的载体来分:磁带、缩微制品和光盘等按数据库类型划分:书目数据库、目录数据库、数值性数据库、全文数据库、多媒体数据库。第75页,课件共146页,创作于2023年2月信息检索原理指通过一定的方法和手段使其存贮与检索两个过程所采用的特征标识达到一致,以便有效地获得和利用文献。存贮是检索的基础,检索是存贮的目的。也就是将特定的信息需求与检索体系中的信息线索进行有无、异同及大小的比较与匹配,选取两者相符或部分相符的信息予以输出。无论手工检索还是计算机检索其基本原理都是一样的。第76页,课件共146页,创作于2023年2月文献存贮过程存贮,主要是对文献进行标引,形成文献的外表特征标识和内容特征标识,为文献信息检索提供有章可循的途径的过程。外表特征指标题、编著者、来源、卷期、页码、出版年月、文种等项目;内容特征指文献的学科分类、主题内容等。第77页,课件共146页,创作于2023年2月文献存贮前首先要对文献内容进行主题分析,把握文献所论述的中心内容,形成主题概念,然后选用特定的文献检索语言表达主题概念,将主题概念转换成对文献的特征的标识,最后将这种标识按其内容和出处按一定规则及次序进行编排,产生了各种类型的索引(文献检索系统)。一是为纳入检索工具或系统的每一种期刊或每一篇文献标引检索标识;二是将有关文献的特征标识著录下来,形成一条条文献线索;三是将它们系统地排列到检索工具或系统中去供读者查找。第78页,课件共146页,创作于2023年2月文献检索过程文献检索过程是根据读者需求,确定检索概念及其范围,然后选择一定的检索语言,并将此检索概念转换成检索特征标识,按此到检索系统中查找文献线索,最后对其进行逐篇筛选,以确定需要阅读的文献。即提供一定的检索手段,按照一定的检索方法,根据读者需要,迅速全面地查出文献线索。由于不重视检索,我国科研课题重复国外的约占40%。第79页,课件共146页,创作于2023年2月信息检索技术布尔逻辑检索截词检索位置检索限制检索加权检索第80页,课件共146页,创作于2023年2月信息检索技术-布尔逻辑布尔逻辑检索(BooleanLogical)是用布尔逻辑运算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非,分述如下:第81页,课件共146页,创作于2023年2月第82页,课件共146页,创作于2023年2月信息检索技术-布尔逻辑逻辑“与”:运算符为And或*。检索词A和检索词B用“与”组配,检索式为:AAndB或者A*B它表示检出同时含有A、B两个检索词的记录。逻辑与检索能增强检索的专指性,使检索范围缩小。
此算符适于连接有限定关系或交叉关系的词。第83页,课件共146页,创作于2023年2月信息检索技术-布尔逻辑逻辑“或”:运算符为Or或+。检索词A和检索词B用“或”组配,检索式为:AOrB或者A+B它表示检出所有含有A词或者B词的记录。逻辑或检索扩大了检索范围。此算符适于连接有同义关系或相关关系的词。第84页,课件共146页,创作于2023年2月信息检索技术-布尔逻辑逻辑“非”:运算符为Not或-。检索词A和检索词B用“非”组配,检索式为:ANotB或者A-B它表示检出含有A词,但同时不含B词的记录。
逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。第85页,课件共146页,创作于2023年2月信息检索技术-截词检索截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。对于外文来讲,检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。第86页,课件共146页,创作于2023年2月信息检索技术-截词检索按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度分为有限截断和无限截断。1)右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。第87页,课件共146页,创作于2023年2月信息检索技术-截词检索2)左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。第88页,课件共146页,创作于2023年2月信息检索技术-截词检索(3)中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。第89页,课件共146页,创作于2023年2月信息检索技术-截词检索(4)复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。第90页,课件共146页,创作于2023年2月信息检索技术-截词检索5)有限截断:是指允许截去有限个字符。例如comput????可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。第91页,课件共146页,创作于2023年2月信息检索技术-截词检索(6)无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。第92页,课件共146页,创作于2023年2月信息检索技术-位置检索位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符AdjacentOperators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。第93页,课件共146页,创作于2023年2月信息检索技术-位置检索机检系统中常用的位置算符(按限制强度递增顺序排列)如下:(1)(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如happiness(f)sadnessandcrying(2)(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如machine(s)plant第94页,课件共146页,创作于2023年2月信息检索技术-位置检索(3)(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。第95页,课件共146页,创作于2023年2月信息检索技术-位置检索例如:information(n)retrieval可以检出informationretrieval和retrievalinformation,又如econom???(2n)recovery可以检出economicrecovery、recoveryoftheeconomy、recoveryfromeconomictroubles第96页,课件共146页,创作于2023年2月信息检索技术-位置检索(4)(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如input(w)output可检出inputoutput而wear(1w)materials可检出wearmaterials、wearofmaterials第97页,课件共146页,创作于2023年2月信息检索技术-位置检索采用位置算符检索时,通常最严谨的算符放在最左面,例如:european(w)economic(w)community(f)patio,又如redwood(3n)deck?(s)(swimming(w)pool?)注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明,上述为DIALOG系统的位置算符。第98页,课件共146页,创作于2023年2月信息检索技术-限制检索限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。(1)字段检索:是把检索词限定在某个(些)字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。第99页,课件共146页,创作于2023年2月信息检索技术-限制检索例如:查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中,检索式可写为:microcomputer??/de,ti,abORpersonalcomputer/ti,ab又如查找wangwei写的文章,可以输入检索式:au=wangwei第100页,课件共146页,创作于2023年2月信息检索技术-限制检索(2)使用限制符:用表示语种、文献类型、出版国家、出版年代等的字段标识符来限制检索范围。例如要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊,则检索式为:(microcomputer??/de,ti,abORpersonalcomputer/ti,ab)ANDPY=1999AND(LA=ENORFR)ANDDT=Serial第101页,课件共146页,创作于2023年2月信息检索技术-限制检索(3)使用范围符号:如:Lessthan、Greaterthan、Fromto等,如查找1989~1999年的文献,可表示为:PY=1989:1999或者PY=1989toPY=1999又如查找2000年以来的计算机方面的文献,可表示为computer??AndGreaterthan1999查找在指定的文摘号范围内有关地震方面的文献,可表示为earthquake?/635000-800000第102页,课件共146页,创作于2023年2月信息检索技术-限制检索(4)使用限制指令:限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限制)、全限制指令(Limitall,它是在输入检索式之前向系统发出的,它把检索的全过程限制在某些指定的字段内)。第103页,课件共146页,创作于2023年2月信息检索技术-限制检索例如:LimitS5/328000-560000表示把先前生成的第5个检索集合限定在指定的文摘号内。又如:Limitall/de,ti表示将后续检索限定在叙词和题名字段。上述几种限制检索方法既可独立使用,也可以混合使用。第104页,课件共146页,创作于2023年2月信息检索技术-加权检索加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。检索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输出。阈值可视命中记录的多寡灵活地进行调整,阈值越高,命中记录越少。第105页,课件共146页,创作于2023年2月1.5科技信息检索的地位、
作用与策略科技信息检索地位科技信息检索作用科技信息检索策略科技信息检索方法科技信息检索途径第106页,课件共146页,创作于2023年2月科技信息检索的地位信息检索是传递信息的一条重要渠道,是联系信息生产者和信息用户的一个主要中间人,是人类为了合理地分发信息、充分利用信息和提高劳动效率而采取的一种重要交流方式。文献检索的出现和不断发展,使科学交流从非正式的、无组织的状态逐渐变为正式的、有组织的状态。它使原来的信息流程大大简单化了,通道的容量也扩充了,科学交流也显得更加便利和完善了。科学交流方式的这种演变是社会发展进步的一种表现。第107页,课件共146页,创作于2023年2月科技信息检索的作用⑴促进信息资源的开发和利用⑵协助管理者做出正确的决策⑶便于继承和借鉴前人成果,避免重复研究走弯路⑷节省查找文献的时间⑸促进专业学习第108页,课件共146页,创作于2023年2月科技信息检索的策略检索策略(InformationRetrievalStrategy)是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。具体包括:1.确定查找范围:根据第一步对检索的时间、地域、语种以及文献类型等的分析,确定一个合理的检索范围。第109页,课件共146页,创作于2023年2月2.选择检索手段:一般来说利用光盘检索系统,结合检索相应的网络数据库能满足多数检索要求;没有机检条件时则选用手工检索。如果光盘检索能满足要求,则不必选用其它检索手段。
3.选择检索系统:选择合适的检索系统主要是选择检索工具/数据库,要根据检索课题的内容范围和要求来决定。要了解检索工具/数据库的学科专业范围及各种性能参数,其内容主要包括:第110页,课件共146页,创作于2023年2月(1)检索工具的类型是否满足检索需要。(2)检索工具的学科专业范围是否与检索课题的学科专业相吻合。(3)检索工具收录的文献类型、文献存贮年限、更新周期是否符合检索需求。(4)检索工具描述文献的质量。原文的表达程度、标引深度、专指度如何等,是否按标准化著录。(5)检索工具提供的检索入口是否与检索课题的已知线索相对应。(6)检索费用。对于联机检索,费用包括机时费、联机(脱机)打印费、通讯费、字符费等。而且即使是同一种数据库在不同的检索系统中,检索费用、文档结构,可检字段、检索功能等都不完全相同第111页,课件共146页,创作于2023年2月4.确定检索途径和检索词:检索途径主要根据分析课题时确定的已知条件,以及所选定的检索工具能够提供的检索途径来决定。常用的检索途径有著者、分类、主题、文献题名、文献号、代码(如分子式、产品型号)、引文等,还有文献类型、出版时间、语种等。每种途径都必须根据已知的特定信息进行查找。第112页,课件共146页,创作于2023年2月检索词也称检索点,与检索途径相对应,是检索途径的具体化。确定检索词就是将检索课题中包含的各个要素及检索要求转换成检索工具/数据库中允许使用的检索标识。即用所选定的检索工具/数据库的词表(如主题词表、分类表)把检索提问的主题概念表达出来,形成主题词或分类号等,也可以是关键词(视检索系统而定)、人物姓名、地名、文献名等。第113页,课件共146页,创作于2023年2月5.构造检索式:检索式是机检中用来表达检索提问的一种逻辑运算式,又称检索表达式或检索提问式。它由检索词和检索系统允许使用的各种运算符组合而成,是检索策略的具体体现。
构造检索式就是把已经确定的检索词和分析检索课题时确定的检索要求用检索系统所支持的各种运算符联接起来,形成检索式。第114页,课件共146页,创作于2023年2月科技信息检索的方法系统性检索方法追溯法常用法(工具法):顺查法、倒查法和抽查法。循环法(综合法)第115页,课件共146页,创作于2023年2月1)追溯法从已有的文献后所列的参考文献着手,逐一追查原文,再从这些原文后所附的参考文献逐一检索,获得一批相关文献的方法。第116页,课件共146页,创作于2023年2月2)常用法又称工具法,就是利用文摘或题录等各种文献检索工具查找文献的方法。常用法根据时间范围又分为顺查法、倒查法和抽查法。3)循环法也称综合法,这是上述追溯法和常用法的结合。具体地说,采用这种方法查找文献时,既要利用一般检索工具书刊,又要利用文献后附的参考文献进行追溯,分期分段地交替使用,直到获得满意的相关文献为止。第117页,课件共146页,创作于2023年2月顺查法以所查课题起始年代为起点由远而近地按时间顺序的查找方法。查找前要确定该课题研究的历史背景,从研究开始的年代查起,一年年或一卷卷地通过检索工具查找。这种方法比较费时,且问题发生的起始时间不容易一下子确定,但查得的文献比较齐全。第118页,课件共146页,创作于2023年2月倒查法这是一种由近而远逆时间顺序的查找方法。从近期往远期查找,一般将注意力放在查找近期文献上。因为近期文献不仅反映了现在的研究水平,而且一般都引用、论证和概述了早期的文献资料。因此,查找时不必一年一年地查找完,只要查到基本掌握所需文献就行了。与顺查法相比,倒查法比较省时省力,但有可能漏查一些有用的文献。第119页,课件共146页,创作于2023年2月抽查法根据课题研究的特点,抓住该课题研究发展迅速,出版文献较多的年代,抽取一段时间(几年或十几年)或一段时间内的几个点,再进行顺时查找的检索方法。使用抽查法,检索时间较少,查得文献较多,但也有漏检文献的可能,并要求检索者对课题研究的历史情况有较多的了解和掌握。第120页,课件共146页,创作于2023年2月科技信息检索的方法实际课题的检索选用哪一种方法,要根据具体情况而定。一是根据课题研究的需要,二是视所能利用的检索工具和检索手段。在检索工具书刊比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下即可利用追溯法获得相关性较强的文献;获悉研究课题出版文献较多的年代即可利用抽查法。总之,只有视条件的可能和课题的需要选用相应的检索方法,才能迅速地获得相关的文献,完成课题检索的任务。第121页,课件共146页,创作于2023年2月科技信息检索的途径(1)分类途径(2)主题途径(3)著者途径(4)序号途径第122页,课件共146页,创作于2023年2月1.6信息检索效果评价评价的目的、范围评价标准影响检索效果的因素第123页,课件共146页,创作于2023年2月评价的目的、范围目的是为了准确地掌握系统的各种性能和水平,找出影响检索效果的各种因素,以便有的放矢,改进系统的性能,提高系统的服务质量,保持并加强系统在市场上的竞争力。检索效果包括技术效果和社会经济效果两个方面。第124页,课件共146页,创作于2023年2月技术效果主要是指系统的性能和服务质量,系统在满足用户的信息需要时所达到的程度。
社会经济效果是指系统如何经济有效地满足用户需要,使用户或系统本身获得一定的社会和经济效益。技术效果评价又称为性能评价.社会经济效果评价则属于效益评价,而且要与费用成本联系起来,比较复杂。第125页,课件共146页,创作于2023年2月评价标准
判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。质量标准主要通过查全率与查准率进行评价。查全率和查准率是判定检索效果的主要标准。查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率=[检出相关文献量/文献库内相关文献总量]×100%第126页,课件共146页,创作于2023年2月查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率=[检出相关文献量/检出文献总量]×100%查准率和查全率结合起来,描述了系统的检索成功率。两者相互制约,一般查全率为60%-70%,查准率为40%-50%。第127页,课件共146页,创作于2023年2月影响检索效果的因素
查全率与查准率是评价检索效果的两项重要指标。查全率和查准率与文献的存储与信息检索两个方面是直接相关的,也就是说,与系统的收录范围、索引语言、标引工作和检索工作等有着非常密切的关系。第128页,课件共146页,创作于2023年2月影响查全率的因素影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等。第129页,课件共146页,创作于2023年2月影响查全率的因素从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。第130页,课件共146页,创作于2023年2月提高查全率的方法1、检索词的转换。常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。
2、使用截词符。3、使用上位词,即指代范围更广的词。4、改变布尔运算符,即将连接两个或多个检索词的AND改为OR,即可提高检出数量。
第131页,课件共146页,创作于2023
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甲流患者的护理
- 电炉炼钢工创新方法测试考核试卷含答案
- 半导体器件和集成电路电镀工安全素养模拟考核试卷含答案
- 铸件清理工安全生产知识水平考核试卷含答案
- 乐器维修工安全生产能力模拟考核试卷含答案
- 26年肛管癌靶向随访质控手册
- 26年生育力评估指南
- 2026 减脂期樱桃课件
- 2026年宠物医护助理中级工模拟试题及实操解析
- 医学26年:内分泌规培生带教要点 查房课件
- 碎石生产线设备维护与保养方案
- 水库护坡除草方案(3篇)
- 矿水厂合作合同协议书模板
- 光伏组件拆解回收以及二次利用项目可行性研究报告写作模板-拿地申报
- DGJ08-113-2017 建筑节能工程施工质量验收规程
- 2025年贵州省中考英语试题(附答案和音频)
- DB42T 1892-2022 非煤矿山钻探施工安全技术规程
- 【物化生 江苏卷】2025年江苏省高考招生统一考试高考真题物理+化学+生物试卷(真题+答案)
- 满族装饰艺术主题餐饮空间设计研究
- 扬州印象城市介绍旅游宣传
- 2024年国家民委直属事业单位招聘笔试真题
评论
0/150
提交评论