信息检索课件总结.doc_第1页
信息检索课件总结.doc_第2页
信息检索课件总结.doc_第3页
信息检索课件总结.doc_第4页
信息检索课件总结.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索1、信息及其特点、价值 信息被交流的知识 知识(Knowledge)为:基于推理并经过证实的认识。 知识是人们在改造世界的实践中所获得的认识和经验的总和。 人类不仅要通过信息感知世界, 认识和改造世界,而且要通过所获得的信息组成知识。知识是信息的一部分。 客观事物 感知认识 知识信息与文献工作术语中定义(GB4894-2009) 信息是物质存在的方式、形态或运动状态的表征,也是事物的一种普遍属性。一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。(国家标准GB4894-85 情报与文献工作词汇基本术语)美国哈佛大学的研究小组给出了著名的资源三角形。他们指出:没有物质,什么都不存在;没有能量,什么都不会发生;没有信息,任何事物都没有意义。作为资源:物质为人们提供了各种各样的材料;能量提供各种各样的动力;信息提供各种各样的知识。1.1 信息的主要特点(1)客观性 控制论创始人维纳认为:信息是主、客观世界进行交换的内容的名称。(无论人们对各种信息是否敏感,但它们却客观存在。)(2)效用性 信息论创始人香农认为:信息能够消除不确定性的东西,它能增强系统的有序性,减少破坏和混乱的噪声。(只有消除不确定性,才能提高决策和行动的效益。)(3)多样性 韦氏大词典 (美国)注释信息为:信息是通信的事实,是在观察中得到的数据、新闻和认识。(说明信息的表现形式可以是数据、消息、新闻等等,具有多样性。) 信息的属性:普遍性 传递性、共享性、时效性信息资源 在人类社会及自然界的发展、运动中,不断产生着各种各样的信息,各个学科、各种领域、各类事件以及各种形式的信息层出不穷,我们把任何可标识的对象(媒介和记录信息的组合,以物质或数字形式表达的知识成果等)总称为信息资源。信息资源 它也存在两种不同的情形:一种是本体论信息资源,这是一类潜在、巨大、未经加工的原始信息资源或称做生信息资源;另一种是认识论信息资源,这是经过主体感知和加工的信息资源或称做熟信息资源。网络上或数据库中的信息资源一般都是熟信息资源。当然,信息资源的生熟也具有相对性。息信息消费是一种直接或间接以信息产品和信消费是一种直接或间接以信息产品和信息服务为消费对象的经济活动。 信息需求 信息占有 信息处理 信息再生 信息检索 信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。 1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。Dialog系统是目前世界上最大的国际联机情报检索系统,覆盖各行业的900多个数据库,其数据类型主要有4种,即文献型、数值型、名录字典型、全文型,涉及40多个语种。Dialog收录的信息涉及的专业范围广泛,按涉及学科的领域被分为20类。 2.信息素质 人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平(美国图书馆协会-1989) 使用潜在信息(1)、信息(2)和相关资源的意识和能力 (GB/T 4894-2009) 信息素质是人的综合素质的重要的组成部分。3.信息素质的三大要素信息素质的三大要素信息意识 指人对于各种信息的自觉的心理反映(包括对于信息的科学的、正确的认识及对自身信息需求的意识)。信息能力 是指所具备的关于信息技术应用的知识与能力(包括信息查询获取、组织加工、综合分析以及对信息的有效利用、评估、传播等方面的知识与能力。信息过载让我们丧失了做决定的能力。信息道德 是指整个信息活动中的道德规范(包括信息的生产者、加工者、传播者以及使用者都必须自觉遵守和维护的信息道德规范)。3. 信息检索与利用的主要功用 (1)开阔视野,正确决策 通过全面、准确地信息检索,能够及时、系统地了解前人的工作经验与成果,掌握事物最新动态及发展趋势。适时作出正确决策,使所开展的工作取得最快、最有效的进展。3. 信息检索与利用的主要功用 (2) 提高功效,事半功倍 高效进行的信息检索活动,能节省人们对有用信息进行搜集利用的时间及精力,提高工作效益,做到事半功倍。同时还能培养人们的自学能力、科学研究及鉴赏能力。3. 信息检索与利用的主要功用(3) 学习借鉴, 推动创新广泛深入地开展信息检 创新是一个民族进步的灵魂索活动,不仅有利于及 是国家兴旺发达的不竭动力时把握各种信息,促进 江泽民科技发明和发现不断涌现,同时对人们开展终身学习不断提升综合素质、创作出更多、更优秀的成果及文献也具有强大的支持和推动作用。3. 信息检索与利用的主要功用(4) 规避风险,维护权益 及时有效地开展信息检索,不仅可以避免重复劳动、少走弯路、免去低水平复制所带来的损失,使各种科研、经营、生产等活动实现投入少、收效高,还可使人们规避风险,利用知识产权保护法等法律规范,维护自身或单位(国家)的正当权益。3. 信息检索与利用的主要功用 (5)科学评价,把握全局 随着信息资源的不断膨胀、信息技术的飞速发展,信息检索活动已经成为科研活动的重要组成部分。特别是在科学评价、权效鉴定、及时把握全局等方面的作为日益突出。具体可以表现在以下五个方面 科研课题(活动)立项信息检索 也叫科技查新,是国家及各级科研部门为避免科研课题重复立项和客观正确地判别科研成果水准及新颖性、创新性、科学性而设立的一项工作。下面列举的分别是国家科技部、教育部授权的两个查新工作机构: 科技成果鉴定信息检索 是对已经完成并准备申报成果(奖励)的研究项目进行系统而全面的信息检索。旨在通过客观、正确地判别科研成果的新颖性、创造性。 证明所鉴定的成果的级别,国际(领先、先进)国内(领先、先进)。 经营、产品、决策信息检索经营及产品信息:是客户资料、资源情报、招投标文件、营销计划、经营决策和策略等等;产品信息:是关于产品从设计、制造工艺、性能价格、销售及市场的一系列信息。 (如产品图片 产品类型 产品名称 产品规格决策信息:是指决策者在做出某项决策前能够对其起到参考、帮助、指导的各种信息 。 对上述信息的检索和利用,关系企业生存发展,也能有效地对企业作出评价、定位。 各种应聘及谈判信息检索 应聘信息指关于招聘者自身特点及对应聘者的要求、取向等方面的信息。诸如招聘单位名称、性质、规模、主要业务、资产情况、招聘职位、招聘要求等方面的信息谈判信息主要包括技术引进谈判、商品贸易谈判以及政治、军事谈判等活动中关于“敌”我双方的各种信息。活动前能尽可能多地掌握对方的相关信息及把握自身的特点,则能胜券在握、如愿以偿。 学术水平评价信息检索 指具有某种权威性的单位(机构)为了客观地考察、评价或奖励在学术研究方面做出贡献的个人或组织,借助国际公认的著名检索系统(如SCI、EI、CPCI等),对一定时限内某地区、某组织及有关个人所撰写的研究论文等进行全面检索,从一定的层面上反映和评判有关地区、组织及个人的学术水平的检索活动。 4. 文献的概念:中华人民共和国国家标准文献著录总则:(GB3792.1-83) 文献是记录有知识的一切载体。 属性:知识性 记录性 物质性 文献的内容 构成文献的手段 文献的形态爱因斯坦-全部科学不过是日常思想的精髓而已。信息 知识 文献三者的关系 信息是生产知识的原料,知识是被人类系统化后的信息,文献是存储传递 知识信息的载体。情报的三个基本属性是:知识性、传递性和效用性。第二章1. 文献信息资源的构成文献信息资源的构成可以从不同的角度或层面予以描述和划分,比如从记录文献的物质载体、文献信息的表现形态(文献类型)、文献信息被加工的详略程度等等。 (1) 按文献信息的物质载体划分 印刷型文献 缩微型文献 声像型文献 机读型文献(2) 按文献信息的物质载体划分 印刷型文献 是指以纸张为存贮介质,以手写、印刷(包括铅印、油印、胶印、木版印刷)为记录手段的文献形式,也是一种最为常见的文献类型。 (2) 按文献信息的物质载体划分 缩微型文献 是指以感光材料为载体(银盐片、重氮片、微泡片),以缩微照相技术为记录手段而产生的一种文献形式。对这类载体的文献查阅,需要借助于专门的仪器设备。 (2)按文献信息的物质载体划分 声像型文献 指以磁性材料、光学材料为记录载体,利用专门的机械电子装置记录与显示/播放声音和图像的文献,又称声像资料、视听资料、音像制品,如我们常见的磁带、录像带等。(2) 按文献信息的物质载体划分 机读型文献 是通过一定的技术将文字、图像以及声音等转换成二进制数字代码,记录在磁性介质或光记录介质载体上,采用计算机进行阅读、浏览的文献载体。3)按文献信息的表现形式划分有11类 图书 是一种最为传统和常见的文献表现式,它具有内容系统、全面、成熟、可靠等特点,但传递信息的新颖性、快捷性不如期刊、会议等文献类型。图书可分为阅读型(教科书、专著)和工具型(词典、百科全书、手册) 图书标识格式(文后参考文献):刘国钧,王连成.图书馆史研究.北京:高等教育出版社,1979:1-518. Gill, R. Mastering English Literature M. London: Macmillan, 1985: 1-145. ISBN3)按文献信息的表现形式划分有11类 连续出版物(报、刊) 指定期或不定期、具有连续出版编号(卷、期、年、月、日)的出版物。具有品种繁多、信息量大、出版周期短、报道速度快、提供内容新、能及时反映当前科技发展趋势等特点。3)按文献信息的表现形式划分有11类 学位论文 指高等学校学士、硕士或博士毕业生为申请学位而提交的毕业论文。学位论文一般偏重理论,所探讨的问题比较专深。特别是硕、博士学位论文,在某些方面往往提出了具有独到的见解和观点,对研究工作有较大的参考价值。 英国习惯称之为Thesis,美国称之为Dissertation根据我国教育制度的规定,学位论文主要有:学士学位论文、硕士学位论文、博士学位论文3)按文献信息的表现形式划分有11类 会议资料 指在学术会议上宣读或交流的书面论文。其形式可以是单行本式的会议预印本、也可以是正规出版的会议论文集。会议文献的特点是:文献论题集中,内容新颖、丰富、专门、深入、学术性强,能反映出一个国家、一个地区或国际当前某一科学技术领域的最新成就、最高水平和发展趋势。 图书:以会议名称作为书名,以文集名做书名,将会议名称作为副书名。按会议届次编号,定期或不定期出版。连续性会议文献(Conference Serial) :定期或不定期地出版的丛书、丛刊等。期刊:以期刊形式发表。作为期刊的副刊或专刊出版,发表在有关学会、协会主办的学术刊物中。科技报告:编入科技报告。 视听资料:在开会期间进行录音、录象,会后以视听资料的形式发表。(2)按文献信息的表现形式划分有11类 专利文献是指专门记录和反映发明创造技术信息及内容的一种文献类型。包括专利(申请)说明书以及与专利有关的法律文件及诉讼资料、用以报道专利信息的专利公报、专利信息检索工具(书)及检索系统等等。 专利的特点:新颖性 创造性 实用性专利的三方面含义:专利权 专利技术 专利文献专利的申请:发明专利的申请 审批程序:受理 初审 公布 实审(新颖性 创造性 实用性) 授权 实用 批程序: 受理 初审 授权(3)按文献信息的表现形式划分有11类 标准资料 指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献。它是从事生产、设计、管理、产品检验、商品流通、科学研究的共同依据,在一定条件下具有某种法律效力,有一定的约束力。 标准的特点 :每个国家对于标准的制订和审批程序都有专门的规定,并有固定的代号,标准格式整齐划一。在一定条件下具有某种法律效力,有一定的约束力。时效性强,随着经济发展和科学技术水平的提高,标准不断地进行修订、补充、替代或废止。一个标准一般只解决一个问题。不同种类和级别的标准在不同范围内贯彻执行。安全性(3)按文献信息的表现形式划分有11类 科技报告 是关于某项科研成果的正式报告,或者是对研究过程中阶段进展情况的实际记录。特点是每份报告自成一册;篇幅长短不一,编有由机构代号和连续序号组成的报告号。 科技报告内容新颖、专深,其流通范围有一定的限制,仅有小部分可公开或半公开。世界上较著名的科技报告系列有美国政府的四大报告(PB报告、AD报告、 NASA报告、DOE报告),英国航空委员会(ARC)报告、英国原子能局(UKAEA)报告,法国原子能委员会(CEA)报告、联邦德国航空研究所(DVR)报告,日本的原子能研究所报告、东京大学原子核研究所报告、三菱技术通报,苏联的科学技术总结和中国的科学技术研究成果报告等。(3)按文献信息的表现形式划分有11类 产品资料 是制造厂商为了宣传推销其产品而编制的以介绍产品性能为主的资料。如产品目录、产品样本(集)、产品说明书、产品总览、产品数据手册等。其内容大致为已定型产品的性能与用途、结构原理、使用方法、操作规程和产品规格等。 这类文献的特点是:技术成熟可靠,图文并茂,形象直观,内容全面具体,出版迅速,发行范围广泛,装帧美观,设计新颖,重宣传推广,轻信息,新陈代谢快,商业性强。它对于科技人员进行产品选型和设计企业引进国外产品和设备具有参考价值。(3)按文献信息的表现形式划分有11类 科技档案 是科学技术研究和生产建设部门在研究、生产、建设活动中形成的一整套技术文件,包括任务书、协议书、技术经济指标、审批文件、研究计划、方案、原始记录、分析报告、设计图纸等等。 特点:反映本单位科学技术研究、生产建设活动的真实历史记录,内容真实、详细、具体、准确可靠;数量庞大,是科技储备的最完善、最可靠的形式;保密性较强,一般都有密级限制,主要为内部使用,借阅手续严格。3)按文献信息的表现形式划分有11类 政府出版物 是各国政府部门及其设立的专门机构发表、出版的各种文件。内容大致可分为行政性文件(如法令、统计等)和科技文献。其中科技文献占整个政府出版物的30一40左右,包括政府所属各部门的工作研究报告、科普资料和技术政策等文献资料。政府出版物全面系统地反映了一个国家(地区、部门等)在政治、经济、军事、文化、教育等方面的思想方针、政策及措施等, 政府出版物对于了解、掌握上述情况,做出相应的决策、采取适当的行为都具有指导性意义和重大的参考价值。(3)按文献信息的表现形式划分有11类 网络文本 指那些来自于互联网上的、不属于上述任何一类型文献(即非为上述各类文本的数字化形态)、但又具有它们中的一些相应作用的网上文献 。 特点:形式多样、图文并茂;内容广泛,质量不一;获取方便,摘录容易;更新度很高,可信度不定;作者身份难辩,信息来源欠明。因此,虽然发展势头很快,但把它作为主要的文献信息资源还有待时日。(4)按文献信息的加工程度划分 零次文献是指未以公开形式进入社会流通使用的实验记录、会议记录、内部档案、论文草稿、设计草稿等。 特点:原始性 分散性 非检索性(4)按文献信息的加工程度划分 一次文献 是指作者以本人生产与科研工作成果为依 据,创作、撰写而形成的文献。如期刊论文、科技报告、会议论文、专利说明书及各种专著等等。 特点:在于内容新颖、翔实、具体;一般说它是文献信息检索的终极目标4)按文献信息的加工程度划分 二次文献 是指对一次文献信息进行加工、提炼、浓缩,而形成的工具性文献。它主要包括各种书目、题录和文摘(数据库)。二次文献是人们对一次文献进行有效的管理、控制和利用的工具,它提供了一次文献的概略及线索。 (4)按文献信息的加工程度划分 三次文献 是根据特定的要求指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩后形成的文献。如参考工具书、指南数据库等。三次文献提供各种事实与数据。一次 二次 三次文献关系从零次文献、一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序的加工过程。零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具文献检索检索-retrieval “ 查找 ”信息检索的类型:根据检索对象的不同,可以分为数值检索 事实检索 文献检索文献检索:以文献为检索对象。凡是查找某一课题 某一著者 某一地域 某一机构 某一事物的有关文献的出处和收藏单位等。文献检索 广义上讲包括文献信息的存储和检索两个过程。狭义是指有目的地开展对于经过有序化后的文献信息的集合体所开展的查找活动及过程。1. 文献信息存储有序化及其方法 有序化的意义 对文献信息进行有序化的意义在于解决文献数量剧增、文献信息的产生、分布和流动的无序性与人们利用文献的有序性、特定性之间矛盾,使人们能方便地、有效地、及时地查找并利用所需的特定信息及其相关资源。2. 文献信息有序化及其方法根据文献的外部特征组织文献(一)按文献的名称或文献创作者的名称(如书名、刊名、作者、出版者名称等)的字顺或音序组织检索排列文献。2. 文献信息有序化及其方法根据文献的外部特征来组织文献(二)依文献特定代码(如专利号、标准号、ISSN、ISBN、化学分子式等)的顺序组织检索文献。2. 文献信息有序化及其方法 根据文献的内在特征(分类、主题)来组织文献 以文献内容的学科属性为依据,分门别类 组织检索文献。例如中国图书馆图书分类法 国际专利分类法美国国会图书馆图书分类法T工业技术TB一般工业技术TD矿业工程TE石油、天然气工业TF冶金工业TG金属学与金属工艺TH机械、仪表工业TJ武器工业TK能源与动力工程TL原子能技术TM电工技术TN无线电电子学、电信技术TP自动化技术、计算机技术TQ化学工业TS轻工业、手工业TU建筑科学TV水利工程 TP1自动化基础理论 TP2自动化技术及设备 TP3计算技术 TP30 TP31 TP32 TP33 TP34.TP6TP7TP8根据文献的内在特征组织文献 按照代表文献主题概念的词(词组)的音序、字顺等组织检索文献。主题词:代表文献主题内容的实质性的词或词组。 信息的著录加工1、著录目的 目的是把一篇文献变成一条著录,压缩后必须能体现文献的外表特征和内容特征。外部特征指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名、人名、各种符号标识(专利号,标准号,文献号等)、机构名等。内容特征指表征文献实质意义的特征,如主题词(叙词,单元词、关键词)、分类号、化学符号等。2、著录内容 外表特征:篇名,作者,工作单位,号码,文种 出处:发表在什么刊物,刊号,卷,期,页数 内容特征:摘要3、著录格式检索语言分类语言主题语言名称语言代码语言键词与叙词性质比较分类语言对信息内容的学科进行分类中国图书馆分类法美国国会图书馆分类法国际专利分类法ipc标准分类法作用在于对文章按其内容进行归类、以便于文献的统计、期刊评价、确定文献的检索范围,提高检索结果的适用性等。具体如下:A-理论与应用研究学术论文(包括综述报告)B-实用性技术成果报告(科技)、 理论学习与社会实践总结(社科)C-业务指导与技术管理性文章 (包括领导讲话、特约评论等)D-一般动态性信息(通讯、报道、会议活动、专访等)E-文件、资料(包括历史资料、统计资料、机构、人物、书刊、知识介绍等)说明:1)不属于上述各类的文章以及文摘、零讯、补白、广告、启事等不加文献标识码。2)中文文章的文献标识码以 文献标识码:或文献标识码作为标志,如:文献标识码:A3)英文文章的文献标识码以Document code:作为标志P631.33TG502.37 类名都是仪器P631.33上位类号P631 是地球物理勘探,TG502.37 上位类号TG502 是金属切削加工和机床,P631.33 指地球物理勘探仪器TG502.37 指金属切削加工机床仪器作者 机构途径英文版著者索引中人名规则(1)翻译规则分为音译和意译。中国著者姓名和团体机构名称的音译,一般用汉语拼音。【实例】原西南师范大学在欧洲专利数据库就有三种写法:Southwest China Normal University / Southwest Normal University/ Xinan Teachers, University(2)拼写形式【例题】在英文数据库检索作者“金长青”的论文,作者名除了“Jin, ChangQing” 还有其他拼写形式:Jin, Chang-Qing Jin, CQ Jin, C.Q Jin, C.Q. Jin, C.-Q威妥玛(wade 英国人 1870年)以拉丁字母拼写拼读汉字拼音的方法。如李 Lee 台湾、香港地区比较常用此方法。. 文献检索系统及其功能 文献检索系统 是指按某种方式、方法建立起来的供文献信息用户查检文献信息及原始文献的一种有层次的体系,是表征有序的信息特征的集合体。(包括各种手工检索工具和各类计算机检索系统) 4. 文献检索系统及其功能 常见的计算机文献检索系统(按收录内容) (一) 书目型 又称为书目数据库或者文摘数据库。它主要用于反映文献的原始信息。如文献篇名、作者、出处等。包含目录、索引、文摘。OPAC 全国新书目 各类索引 文摘4. 文献检索系统及其功能 常见的计算机文献检索系统 (二) 事实型内容来源于百科全书、名录、词典、年鉴等参考工具书 (三) 数值型 内容以统计数据、科学技术常数为主四) 全文型 全文检索系统是一种不仅能为用户提供文献的题录、摘要等信息,而且还能揭示文献全貌的文献检索系统。4. 文献检索系统及其功能 文献检索系统的功能 (一)报道文献信息(二)存储文献信息(三)检索文献信息5. 常用文献检索途径及方法 常用检索途径 (1)文献名称(包括作者/出版者等名称等)(2)文献主题 (3)学科分类(4)文献代码4. 常用文献检索途径及方法 常用检索方法 (1) 工具法 利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),进行系统而全面的文献检索的方法。(2) 追溯法 利用已经掌握的文献中所列举的参考文献,根据其所提供的线索追踪、溯源及查找更多相关文献的方法。文章参考文献更多文章文章作者文章作者文章作者团体更多作者文章链接网站更多链接期刊论文图书图书期刊论文利用引文索引检索工具SCI科学引文索引文献之间引证与被引证关系 例:文献A 引用了B 文献来源文献 文献A的引文文献 A 的作者:引用作者 来源索引文献 B 的作者:被引作者 引文索引3) 循环法采用追溯法与工具法交替进行的方式进行相关的文献信息检索的方法。第三章1. 文献信息数据库文献是记录知识的载体。数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合 。当数据库记录的对象为文献信息时,就称为文献信息数据库文献信息数据库的结构一个数据库通常由一个主文档(Master File)和若干个索引文档或称倒排文档(Inverted File)组成。文档是具有某种特征的全部记录的集合。记录是构成文档的基本单元,由各种反映文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文档中的一条记录。字段是记录的基本组成元素。一条记录的常见字段通常包含题名字段、著者字段、主题词字段、文献出处字段(如刊名等)多种字段。文献数据库的类型按数据库文献记载的详细度可分为书目型数据库(二次文献数据库):仅提供文献检索,读者根据其提供的线索查找文献原文。可以分为:题录型 文摘型EI SCI 中国科学引文索引全文数据库:不仅提供文献的基本信息及线索,同时还提供原始文献本身的数据库。主要包括全文数据库、术语数据库、图像数据库等等。如: CNKI 万方 Elsevier IEL混合型数据库:数据中的数据,一部分只是提供参考数据库中的信息(文献的基本情况及线索);另一部分则可以提供全文数据库中的信息(原始文献本身)。如: EBSCO (ASPBSP)按文献数据库收录信息的学科范围可分为 (1) 专业性文献信息数据库 (CA)(2) 综合性文献信息数据库 (中国期刊网)文献信息数据库的评价标准收录内容范围系统准确。揭示文献详略完备详细。更新速度快慢及时快速。检索字段多寡途径丰富。检索功能强弱高效完善。用户使用方便易学易用。维护服务质量及时到位。计算机信息检索指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。发展过程计算机信息检索指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。主题分析明确检索需求及检索目标(1)检索信息的学科范围(2)检索信息的类型(3)检索的目的选择检索系统(数据库等)(1)根据检索目的确定所需数据库的类型(2)根据信息需求的内容、专业范围选择数据库(3)根据记录来源选择数据库(4)根据熟悉程度选择数据库主题概念分析(注:是课题检索的重点和难点)检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)?结果形式(全文、文摘、题录、数值、事实等)检索年限(如2000年以来的文献)语种(中文、外文;英文、日文)检索结果数量(100?50?)布尔逻辑检索技术布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义:AND (*) OR (+) NOT (-)AND (*)接不相容的主题概念(或不同字段)检索结果同时出现连接的词限定, 缩小范围, 提高准确率。OR (+)?连接同义词 ,同族词, 相关词检索结果至少含有其中一词或同时有扩大,检索范围, 提高查全。NOT (-)缩小检索范围,起到减少文献输出量。优先处理算符“( )” 逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有A、B、C、D四个检索词(其中A和B,C和D分别为同义概念), 检索提问式为:(A OR B)AND (C OR D) 即,同一组检索提问既含有OR算符,又含有AND算符,此时须使用优先处理算符“( )”,将OR算符前后的词放入括号中,计算机将优先运算括号内的算符。位置检索可要求检索词以用户所规定的相对位置出现。比如:以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。 输入:COMMUNICATION SATELLITE系统认为 :COMMUNICATION AND SATELLITE结果: communication satellite ,satellite communication , communication devices for satellite ;communication links without satellite常用的位置算符及含义: (W)算符(WITH) 表示两个检索词紧挨着,词序不能颠倒, 中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。 例:COMMUNICATION(W)SATELLITE (n W)算符(n WORD)表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。 (N)算符 (NEAR) 表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。(n N)算符(n NEAR) 表示两个检索词中间可以插入n个词,且词序可以颠倒。 (S)算符(SUBFIELD) 表示两个检索词必须出现在同一个子句子中,但两词的词序和插入的词数不限。句子位置算符 (F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。字段位置算符 (C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。 (L)算符(LINK)表示两个检索词之间存在从属关系或限制关系,如果其中一个为一级主题词,另一个就为二级主题词。截词检索是为扩大检索范围与增加检索结果而采用的一种检索技术。常件的截词符号及含义:“*”可代表多个字符“#”代表单个的字符一个“?”或者“n?”代表0个到9个额外的字符 。加权检索是在检索提问式中,根据每个提问词在检索要求中的重要程度,分别给予一定的加权数值加以区别,我们称这个数值为权数。同时再给出检索命中的阈值。当检索结果达到所设定的阈值时,系统将显示为命中记录。采用加权检索的目的在于提高检索结果的准确程度限制检索技术:具体形式主要有:(1)字段限制检索(2)使用符号限制3)进行范围限制(4)采用限制指令字段限制检索:基本字段限制字段限制(TI,AB,DE,ID)基本字段限制的用法是在需要指定字段(题目、叙词、识别词和文摘)的检索词后加上后缀运算符“/”和段码。例如,检索策略“OPTICAL/TI AND FIBER/TI”的含义是指定在题目字段中查找含有 “optical” 和“fiber”两词的所有记录。字段段码可以多个连用,段码之间加“,”即可。例如,检索策略“FIB?/TI,DE”的含义是指定在题目和叙词字段中查找以 “fib”为词干的所有记录。辅助字段限制辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert, S.”的含义是在作者字段中查找含有“Robert, S.”的所有记录。下面是其他常用的辅助字段限制及其实例:指定著者单位字段 CS=SHANGHAI UNIVERSITY指定刊物名称字段 JN=APPLIED MATHEMATICS 指定语言字段 LA=ENGLISH 指定文献类型字段 DT=JOURNAL索表达式输入检索系统后,输出的检 索结果有时不一定能满足课题的要求:检出的篇 数过多,而且不相关文献所占比例很大,检出的文献数量太少,有时甚至为零,需要调整检索策略。调整检索策略:对于输出篇数过多的情况a .选用了多义性的检索词;b .截词截得过短;c. 输入的检索词太少;d. 应该使用“与(AND)”的使用了“或(OR)”;e.优先运算符“()”使用错误。对于输出篇数过少的情况a. 检索词拼写错误;b. 遗漏重要的同义词或隐含概念;c. 检索词过于冷僻具体;d. 没有使用截词算符;e. 位置算符和字段算符使用的过多;f. 使用过多的“AND”算符。电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找;查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料;查国内外哪些大学招收电气电子类研究生,可查大学类的机构名录或校方的招生简章资料;查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册;查电子产品的电路图,可用相应的电路图集或手册;查钱学森的主要论著和贡献,可用名人录;等等。例:项目“聚乙烯的合成(synthesis of polyethylene)”v主要概念:聚乙烯、合成(synthesis、polyethylene)v检索式: 聚乙烯 and 合成 Synthesis and polyethylene排除重复无关的概念项目“河豚毒素的液相色谱分析”从项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念主要概念:河豚毒素、液相色谱 检索式:河豚毒素and液相色谱隐性概念的处理:项目“灌溉用的橡塑多孔管”Rubber-Plastic Porous Pipe For Irrigation 橡塑多孔管也称为橡塑渗灌管,其主要原料为橡胶粉(由废旧轮胎制得)和塑料(如粉状聚乙烯)。隐含概念:橡胶、塑料 该产品主要用于农林、园艺等方面的灌溉。v主要概念:橡胶、塑料、多孔管、灌溉v检索式:(橡胶or塑料or橡塑)and多孔管and灌溉项目“唐山综合防灾的研究” 由于唐山是一个城市,因此该项目实际上是“城市综合防灾的研究”。 该项目针对的主要灾害是地震、洪水和火灾,所采用的研究手段是决策支持系统和专家系统。n防灾:地震、洪水、火灾n研究:决策支持系统、专家系统v主要概念:城市、地震、洪水、火灾、决策支持系统、专家系统v检索式:城市and(地震or洪水or火灾)and(决策支持系统or专家系统)概念间逻辑关系的处理: 同义词、近义词是或的关系上位词即扩检,如“教育心理学”下位词即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。一个下位词相对于一个上位词来说,一般是缩检。择检索词时,一般应优先选择主题词作基本检索词,但为了检索的专指性也选用自由词配合检索。如查找“人造金刚石”的文献,很可能用“manmade( 人造) ”、“diamonds( 金刚石) ”作为检索词,但“人造”的实质是“人工合成”,检索词的范围可放宽至:synthetic(W)diamonds 合成金刚石;synthetic(W)gems 合成宝石;synthetic(W)materials 合成材料;synthetic(W)stones 合成石;synthetic(W)crystals 合成晶体;artificial(W)crystals 人造晶体;diamonds 金刚石。检索策略:1+(2+3+4+5+6)*7尽量使用代码:不少文档有自己的各种代码,如世界专利索引(WPI) 文档的国际专利分类号代码IC ,世界工业产品市场与技术概况文档中的产品代码PC 和事项代码EC,化学文摘(CA) 中的化学物质登记号RN 等。如查找“20 年来CA 收录的锡酸钡导电机理”的文献,就应该用化学物质登记号表示,即rn 12009-18-6 。其检索式可为:12009-18-6*electric?(w)conduct? 。而用如下检索式则不能保证文献查全:(barium (w)stannate+BaSn03)*eletrical(w)conductivity检索时为保证查全率,同义词尽量选全。同义词选择应主要考虑以下几点:同一概念的几种表达方式,如化学分析有chemical analysis,analytical chemistry,chemical determination,composition measurement等。同一名词的单、复数、动词、动名词、过去分词形式等,如生产有product,production,producing,produce,productive等,词根相同时,可用截词符解决。要考虑上位概念词与下位概念词,如水果榨汁,不仅要选fruit ,也应选各种水果,如pear( 梨) 、orange( 橙) 、plum( 李子) 、peach( 桃) 、apple( 苹果) 、pineapple( 菠萝) 等,反之,如某一种水果保鲜则应参考水果保鲜。化学物质用其名称也要用其元素符号,如氖,Nitrogen 和N 。植物和动物名,其英文和拉丁名均要选。 注意选用国外惯用的技术术语查阅外文文献时,一些技术概念的英文词若在词表查不到,可先阅读国外的有关文献,再选择正确的检索词表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等;同义词尽量选全:有关激光加工;在航空工业中的应用。第一组面:激光。从词表中可以选取l(1) laser (激光) (2) laser bean (激光束)第二组面:激光加工技术。3-6 从词表中可以选取l(3)laser annealing(激光热处理)(4)laser cutting (激光切削)(5)laser drilling (激光钻孔)(6)laser welding (激光焊接)7-10加工技术v(7)Suface alloying (表面合金化)(8)Surface hardening (表面硬化)(9)Remelting (再溶化)v(10)Radiation hardening (表面硬化)v第三组面:航空工业v(11)aircraft (12)aircraft industry 13)aircraft equipment拟定检索式(1+2)*(7+8+9+10)+(3+4+5+6)*(11+12+13)注意:对于复合词可以用位置算符,截词符。评价检索效果的常用指标有:查全率(Recallratio)用R表示查准率(Precisionratio)用P表示漏检率(Omissionratio)用O表示误检率(Fall-outratio)用F表示高查全率或查准率是人们在检索活动中通常所追求的目标。查全率 查全率是指被检出的相关文献量与系统文档中实有的相关文献量之间的比率。它是衡量信息检索系统收录内容及其用户检索结果的完整程度的指标。可用下式表示: 被检出相关文献量查全率(R)= 100% 系统中相关文献总量 未被检出相关量文献漏检率(O)= 100% 系统中相关文献总量查准率 查准率是指检出的相关文献量与检出文献总量之间的比率。它是衡量信息检索系统收录内容及用户检索结果精确度的尺度。可用下式表示: 检出相关文献量查准率(P)= 100% 检出文献总量 被检出无关文献量误检率(F)= 100% 检出文献总量查全率查准率不准的因素:(1)对检索目标把握不准确(2)对检索系统选择不洽当(3)检索词和逻辑组配不当(4)检索途径和方法选择不当(5)系统功能不熟悉、检索技能不熟练提高查全率的方法:(1) 准确把握检索对象及目的,选择合适的数据库。(2)降低检索词或分类号的专指度。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论