信息检索基础-课件_第1页
信息检索基础-课件_第2页
信息检索基础-课件_第3页
信息检索基础-课件_第4页
信息检索基础-课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章信息检索基础●

解释信息的含义与特征●

论述信息的分类●

介绍信息检索的概念●

阐述信息检索的原理●讨论信息检索系统●梳理信息检索方法本章要点

以知识经济为显著特征的信息社会已经成为社会发展的趋势。人类社会的发展,科技技术的进步都离不开信息资源的开发利用。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。第2章信息检索基础本章要点以知识经济为显2.1.1信息的定义:申农:信息是用来消除随机不确定性的东西。从哲学的角度理解:1)从本体论角度考虑,信息是一种客观存在的现象,是事物的运动状态及其变化方式。2)从认识论层次出发,即信息就是主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。一般性说法:具有新的内容、新知识的消息、情报,以及语言、文字、图形等所揭示的内容。2.1信息概述2.1.1信息的定义:2.1信息概述信息含义的广义和狭义之分(王立清): 广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实。它是人类对客观事物的认识,是实践经验的总结,是认识的结果,是我们检索的对象。信息含义的广义和狭义之分(王立清):第2章文献信息概论

1.时效性(收、发、更新速度)2.可扩散性(传递性、传播媒介、信息网络)3.可扩充性(信息的积极和扩充是无限的)4.可替代性(物质形态的转变)5.可共享性(不因分享而减少,便于共享)

社会进步赋予信息更丰富的内涵,信息的膨胀与人们对其需求的激增,使信息成为当今社会生的一大支柱,成为一种与能源、材料并存的重要资源。2.1.2信息的特点

第2章文献信息概论 2.1.2信息的特点1.1.3信息分类

依据信息的产生,可以分为社会信息和自然信息依据信息的运动状态,可以分为自在信息、自为信息和再生信息第2章文献信息概论1.1.3信息分类依据信息的产生,可以分为社会2.2知识及其分类2.2.1知识的含义是人类社会实践的总结,是人的主观世界对客观世界的概况和如实反映;是人类在改造客观世界实践中所获得的认识和经验的总和,是信息的一部分;是人类科学认识世界、改造世界的力量。狭义理解:是一种有组织的经验、价值观、相关信息和洞察力的结合,是关于事实与思想的陈述。简言之,知识是经过人脑加工处理过的、系统化的信息,是有组织的信息。2.2知识及其分类2.2.1知识的含义2.2.2知识的类型知事(Know-what)关于事实的知识:如文秘速录专业在那些行业就业?知因(Know-why)关于科学原理和自然科学方面的知识。知如(Know-how)关于做事的技巧和能力,如秘诀或窍门。知谁(know-who)关于谁知道什么和谁如何做什么的信息。检索知识(know-where):它是一种如何在知识与信息的海洋中寻觅、获取、利用信息资源的知识。是一种获取知识的方法。2.2.2知识的类型2.2.3文献人类的信息、知识的存在形式基本上有三种:1)存在于人脑的记忆中,属于人们主观精神世界的东西;2)存在于实物中,如古文物、样品、物品等,人们通过研究实物获得某种知识;3)用文字、图形、代码、符号、声频、视频等技术手段记录在一定的载体上,如甲骨上、纸、胶片、光盘、磁盘等载体上,这就是文献。文献记录和反映着社会发展、科学技术的成就及水平,汇集着世世代代的广大人民群众对自然界认识的结晶,记录无数的成功或失败的经验教训,反映着人类的文明程度,是人类进步的重要基础。2.2.3文献2.2.4信息、知识与文献的关系★事物发生发出信息;★信息经人脑加工变为知识

信息只有经过加工,上升为对自然和社会发展客观规律的认识,才构成知识。★知识被记录形成文献;★文献经传递、应用于理论与实践产生新的信息。2.2.4信息、知识与文献的关系2.4信息社会和信息财富2.4.1信息社会的特点:信息总量剧增,多媒体技术和信息高速公路网络被广泛应用,成为信息社会的重要表征,同时,信息渗入到社会生活的各个角落,影响和改变了人们的生活和生存方式。一个国家的信息化程度,代表着其社会生产力的发展水平,也决定着这个国家在下一个世纪中存在与发展的实力和地位,而国家的信息化需要大批具有信息素质的创造性人才。2.4信息社会和信息财富2.4.1信息社会的特点:信息总量剧2.4.2信息财富物质、能量、信息是现代社会发展的三大支柱,缺一不可,而信息资源起着主导作用.人类财富观:古代农业社会—农业财富观、货币财富观。工业社会—股票成为这一时期的财富代言。20世纪50年代以来—信息资源成为财富的象征。2.4.2信息财富物质、能量、信息是现代社会发展的三大支柱2.5信息查询与利用的重要性

数字化时代生存的基本技能:是终身学习的技能,即具有较强的信息发现、吸收、创新能力。在信息时代一个人生存的质量如何取决于其信息化程度与信息素质能力的高低。在信息社会中,个人的信息获取能力,会对个人的事业成功、经济收入、社会地位即个人的生存能力产生直接的影响,信息获取能力的差异有可能形成社会中信息富有和信息贫穷的对立的不平等情形:一部分人因拥有知识及技巧而能在许多方面处于有利地位,另一部分人则有可能陷入不利境地。2.5信息查询与利用的重要性数字化时代生存的基2.6信息检索概述

1.信息检索的概念广义的信息检索:是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”。狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。2.信息检索的本质是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。用户根据检索需求,对一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。2.6信息检索概述 3.信息检索方式(1)根据信息的存储载体和检索技术手段的不同分类手工检索:传统检索方法,是指手工翻检的方式,利用工具书等各种印刷版的检索工具(包括文本式目录、文摘、索引以及各种卡片等)来检索信息的一种手段。适用于纸质印刷的书刊文献。例如:《计算机应用文摘》、《电子科技文摘》等。计算机检索:使用的是检索系统。系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。检索是针对数据库进行的。即利用计算机检索系统从数据库中检索所需文献信息。例如:Dialog、Ei、ISTP、万方数据资源系统等。3.信息检索方式(2)根据检索对象形式的不同分类

文献检索:是一种相关检索,凡以文献(包括文摘、题录或全文)为检索对象的检索,一般它不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。例如:检索北京交大的作者2005年发表的科技文献被SCI、Ei、ISTP收录的情况。数据或事实检索:是一种确定性检索,凡以数据或事实为检索对象的,直接回答用户提出的技术问题,提供用户所需要的确切数据或事实。检索结果一般是确定性的有或无,对或错。例如:查找“行”字的古体写法、读音各有几种?查找某年度诺贝尔物理学奖的得主情况?

┌→文献检索→文献检索工具或系统→间接或直接答案(文献)信息检索→└→数据或事实检索→参考工具书或系统→直接答案(数据、事实)(2)根据检索对象形式的不同分类

2.7科技文献的类型与识别传统的图书馆是专用于典藏书籍的处所,其收藏的主要是纸本文献。随着科技的迅速发展,现代的记录形式和出版方式有了很大变化,“图书”这个概念已经不能囊括当前所有的出版物。今天,人们将数据、期刊、资料等出版物统称为“文献”,图书馆文献资源类型的划分标准纷繁复杂,这里主要介绍三种划分方法。★根据文献的载体形式划分★按文献的结构等级(文献的加工程度)划分★根据文献的编辑出版形式划分2.7科技文献的类型与识别2.7.1按物质载体和记录形式划分

1.印刷型

主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。2.缩微型以感光材料为载体,以光学缩微技术为记录手段。3.声像型以磁性、感光材料为载体,直接记录声音、图像的一种文献。4.机读型利用计算机进行存储和阅读的一种文献形式。5.手写型古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿。2.7.1按物质载体和记录形式划分

1.印刷型2.7.2按出版形式和内容划分1.图书2.期刊3.报纸4.专利5.标准6.学位论文7.科技报告8.会议论文9.政府出版物10.产品样品资料11.技术档案2.7.2按出版形式和内容划分1.图书1.图书

按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本刊行的出版物。包括专著、汇编本、多卷本、丛书等。1.形式特征图书的著录格式反映其形式特征见表1-1【实例】

在参考文献列表里,图书的著录格式是:

[美]R.霍克著.Internet通用搜索引擎检索指南.沈阳:辽宁科学技术出版社.2003.2.ISBN7-5381-3849-8表1-11.图书按照联合国教科文组织的定义,图书是指501.图书2)内容特征优点:

图书的内容全面系统,基础理论性强,论点成熟可靠。缺点:

图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,内容相对陈旧。适用范围:

如果需要对大范围问题获得一般性知识,对陌生问题进行一般了解,对熟悉问题进行历史性的全面系统的回顾,查阅图书一般来说是行之有效的办法。

1.图书2)内容特征1.图书3)图书类型

图书按其用途可分为三种类型:(1)阅读用书(2)参考工具书是供人们释疑解难、翻检查考的出版物。

【实例】参考工具书《中国大百科全书》是我国现阶段最大的一部综合性百科全书,主要用来检索中外百科知识和当代科学发展水平。(3)检索用书是以图书形式刊行的书目、题录、文摘等,是供人们查找一定范围内信息线索的出版物。

【实例】我国历史上最大的一部官修目录《四库全书》基本收入了我国先秦至清代传世的重要古典文献。《四库全书》编纂时,存目和著录的书都在各书卷首写上一篇提要,后将这些提要汇集起来,加以审改,辑成《四库全书总目提要》一书,分经、史、子、集四大类,下分细目,具有检索作用。1.图书3)图书类型2.期刊期刊也称杂志,是“一种以印刷形式或其他形式逐次刊行的,通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物”

1)形式特征有相对固定的名称和版式、有连续出版的时间顺序标识即出版年、月、卷、期号。【实例】

图1-1所示期刊《中国科学论坛》有固定的ISSN号“1883-036X”

,国内统一刊号(CN号)“62-3699”。

图1-12.期刊期刊也称杂志,是“一种以印刷形式或其他形式2.期刊

期刊论文的著录格式【实例】在《EBSCO》数据库的期刊论文著录格式如下:

ChinaInvestment:WhichWayToProfit?By:WangYong;ChenWen.BeijingReview,11/6/2003,Vol.46Issue45,p10,4p,1c;(AN11588866)【实例】在参考文献列表里,期刊论文的著录格式是:刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,200l,17(3):24-26【实例】英文参考文献格式:

FanLJandBMHu.2000.Acomparativestudyonthreemethodsofestimatingdiscriminationoftestsitesforthebestgenotypes.J.Biomathematics(China),15(2):175-179(inChinese).其中“J.”是“Journalof”的缩写。“J.Biomathematics”是生物数学杂志。因此需要检索《JofBiomathematics》获取原文。2.期刊

期刊论文的著录格式【实例】在《EBSCO》数据库的2.期刊2、内容特征(1)内容新颖,能及时反映最新研究成果和动态。(2)信息量大,发行与流通面广,便于获取。(3)按期连续出版,便于研究者长期跟踪研究。2.期刊2、内容特征2.期刊

3)类型期刊按其性质和用途不同,可分为:(1)学术性与技术性期刊主要刊登科学研究和生产方面的学术论文、研究报告、会议论文、实验报告等原始文献。(2)检索性期刊以期刊的形式出版的专供人们用于查找文献线索的一类刊物。(3)其他期刊包括快报性刊物、资料性刊物等。例如:TheKiplingerAgriculturalLetter。2.期刊

3)类型3.报纸

1)定义以刊载新闻和评论为主的出版周期较短的定期连续性出版物。2)特点传递信息快,信息量大,现实感强,传播面广,具有群众性和通俗性,是重要的社会舆论工具和情报源。3)分类按出版发行周期分为:日报、双日报、周报等按内容分为:时事政治类、科技类、商业类、文教类等。3.报纸

1)定义4.专利

专利是专利制度的产物,广义上是指所有与专利有关的资料。狭义上的专利文献仅指专利说明书1)形式特征

【实例】图1-2是一篇中国专利信息的著录格式:2)内容特征内容新颖、技术性强、实用性强并具有法律效力等特点。它是寓技术、法律和经济于一体的带有启发性的一种重要文献信息。图1-24.专利专利是专利制度的产物,广义上是指所有5.标准标准又称为规范1)形式特征标准编号(标准号)是由“标准代号+顺序号+年代号”组成。2)内容特征(1)法律约束力(2)从技术的新颖程度看,当前的标准往往是5年前最新的专利。也有少数专利很快成为标准。

GB7907-87(核桃丰产与坚果品质)└标准名称标准发布年号标准顺序号标准代号5.标准标准又称为规范GB7907-87(核桃丰5.标准3)类型(1)按照使用范围划分

《中华人民共和国标准化法》将我国标准分为国家标准、行业标准、地方标准、企业标准四级。

【实例】

标准号“GB/T15310.3-1994”表示1994年的国家推荐性标准。

(2)按照内容特点划分①方法标准

【实例】GB/T19497-2004农业车辆牵引车上钩型机械连接装置试验方法和要求。②术语标准

【实例】GB/T16786—1997术语工作计算机应用数据类目5.标准3)类型6.学位论文

学位论文是高等院校或研究机构的学生为获取某种学位而撰写的学术论文。按学位的不同分为学士论文、硕士论文和博士论文。形式特征

【实例】图1-3是学位论文数据库收录的湖南大学的一篇硕士论文首页图1-36.学位论文

学位论文是高等院校或研究机构的学生为获取某6.学位论文【实例】参考文献列表中的学位论文著录格式:熊回香.网络信息检索及其发展趋势研究(全文);硕士;华中师范大学;20030501【实例】外文印刷型学位论文文摘的著录格式:①122:②229172t③SynthesisandCharacterizationofmagnesiumaluminumphosphates,andrelatedcompounds.④Shea,Wei-Lu⑤(TexasAandMUniv.,TXUSA)⑥1994.⑦156PP.⑧(Eng)⑨Avail,Univ,MicrofilmsInt.,⑩OrderNo.DA9432768.From⑾Diss.Abstr.Int.B1995,55(7):2726注释说明:①卷号;②文摘号;③论文题目;④著者姓名;⑤著者工作单位和地址;⑥出版年份;⑦论文总页码;⑧原文文种;⑨学位论文出版发行单位;⑩学位论文订购号;⑾刊载学位论文摘要的刊名(本例为国际学位论文DissertationAbstracts的B辑)、年、卷(期)、页码2)内容特征(1)内容比较系统和完整(2)学术性和独创性(3)保密性6.学位论文【实例】参考文献列表中的学位论文著录格式:7.科技报告科技报告是指某项科研成果的立项报告、中试报告、中期阶段性报告、结题报告,或鉴定报告,是关于某项研究的阶段性进展总结报告或研究成果的正式报告。1)形式特征一般不是正式出版物,每件报告单独成册,有机构名称和统一的编号。【实例】《信息网络技术发展综述》北京图形研究所段米毅张炜清(中国公众科技网2001-11-1214:56:55)7.科技报告7.科技报告【实例】美国能源部DOE科技报告的著录格式:①120:②229588s③DOEcomplexburiedwastecharacterizationassesment:BuriedWasteIntegratedDemonstrationProgram.④Kaae,P.S.;Holter,G.M.;Garrett,S.M.K.⑤(Pac.NorthwestLab,Richland,WAUSA).⑥Report⑦1993,⑧PNL-8390;OrderNo.KE93007616,⑨108PP.⑩(Eng)⑾LAvail.NTIS.⑿FromEnergyRes.Abstr.1993,18(4),Abstr.No.7975

注释:①卷号;②文摘号;③论文题目;④著者姓名;⑤著者工作单位和地址;⑥文献类型标志:本例为报告;⑦报告时间;⑧报告编写与订购号码⑨报告总页码;⑩原文种,英文;⑾科技报告收藏单位。全称在化学文摘CA第1期文摘前可查到,收藏单位NTIS全称是美国科技信息服务局(NationalTechnicalInformationService);⑿刊载报告摘要的刊名、年、卷(期)文摘号。2)内容特征内容较为成熟,专深具体第1章绪论7.科技报告【实例】美国能源部DOE科技报告的著录格式:第18.会议文献

会议文献是指在各种学术会议上发表的论文、报告及其他有关资料。1)形式特征(1)图书形式

【实例】著录格式示例:①122:②234009e③Methodsforanalysisofdeamidationandisoaspartateformationinpeptidesandproteins④Aswad,DanaW.;Guzzetta,AndrewW.⑤(DepartmentMolecularBiologyandBiochemistry,Universitycalifornia,Irvine,CAUSA).⑥Deamidation/soasparateForm.Pept.Proteins⑦1995,⑧7-29,⑨(Eng).⑩EditedbyAswad,DanaW.⑾CRC:BocaRaton,Fla.注释说明:①卷号;②文摘号;③论文题目;④著者姓名;⑤著者工作单位和地址;⑥会议录名称;⑦会议时间:如无此项,表示会议录出版时间与会议召开时间年份相同;⑧起止页;⑨原文种;⑩会议录汇编者。一般列主编,最多只列3名;⑾出版社:所在城市、州或国家名。

8.会议文献会议文献是指在各种学术会8.会议文献(2)期刊形式

【实例】下面是发表在期刊JournalofPharmaceuticalBiomedicalAnalysis的会议文献的著录格式示例:

6742PAVLI,V.;KMETEC,V.OptimizationofHPLCmethodforstabilitytestingofbacitracin.In11thInternationalSymposiumonPharmaceuticalBiomedicalAnalysis(PBA2000),Basel,Switzerland,14—18May2000.[EditedbyFrancotte,E.R.;Lindner,W.].JournalofPharmaceuticalBiomedicalAnalysis200124(5/6)977—982[En,12ref.]DepartmentforStabilityTesting,KrkaPharmacerticals,Bbogisiceva8,Novomesto,1000Ljublijana,Slovenia.(3)科技报告形式:部分会议论文被编入科技报告。(4)视听资料形式:在开会期间进行录音、录象,会后以视听资料的形式发表2)内容特征

内容新颖,及时性强;学术水平高,专业性强,可靠性高

.3)类型8.会议文献(2)期刊形式9.政府出版物

政府出版物是指政府部门及其所属机构所颁发出版的文献。

1)内容特征政府出版物对于了解某国的科技、经济等方面的政策和事件有一定参考价值。

2)类型

(1)行政性文件

(2)科技文件9.政府出版物政府出版物是指政府部门及其所属机10.产品样本资料

产品样本资料是指厂商或贸易机构为宣传和推销其产品而印发的免费赠给消费者的资料。

【实例】在Google检索到的“无荧光润滑剂”的产品资料简介产品名称:无荧光润滑剂产品型号:(NF-2)产品简介:NF-2是由多种有机物精制而成。在钻井液中用作低荧光润滑剂使用。具有加量少、效果好、不起泡、不提粘等优点。产品指标项目指标外观白色或淡黄色油状液体水份,%≤5.0密度,g/cm30.9±0.05荧光强度,级,≤6.0润滑系数降低率,%≥60.0

1)内容特征

(1)形象直观(2)数据较为可靠2)类型(1)根据出版形式划分(2)根据其内容划分

10.产品样本资料产品样本资料是指厂商或贸易机构为11.技术档案

技术档案是指在生产或科研活动中形成的有具体工程和研究对象的技术文件的总称。

【实例】福建省科技档案馆的一个档案的简要资料是: 中亚热带常绿阔叶林生态采伐作业系统研究时间:2005年9月8日来源:科技档案馆主要完成单位:福建农林大学主要完成人员:周新年、邱仁辉、杨玉盛、游明兴、潘仁钊省级成果登记号:200100741、主要内容选择皆伐作业的5种集材方式与采伐强度为30%的择伐作业,进行土壤理性质指标变化程度的比较。经主成分分析得出不同采伐、集材方式对林地土壤理化性质的干扰程度,并作出科学排序。┅┅┅┅

2、技术特点(1)前期准备充裕,文献资料翔实,研究基础坚实。(2)研究路线正确可靠。(3)充分利用已建立的长期定位基地,将其研究成果迅速大力推广。

3、在国内外相关领域的作用、影响发表论文56篇,其中一篇被EI收录,26篇被其它国际权威文献收录,被国内外同行引用66次。产生间接经济效益6000万元。11.技术档案技术档案是指在生产或科研活动中形成的有具体1.7.3按文献的结构等级(文献的加工程度)划分按文献中信息量的变化情况来划分,可分成三个结构等级一次文献(primarydocument)定义:是指人们以自己的经验、研究或研制成果为依据而创作形成的文献,即原始文献,公开发表或交流后,称为一次文献。它是检索的对象。特点:信息比较详细、具体而系统,有观点、有事实、有结论。有较高的参考和使用价值,是主要的情报源。包括:期刊论文、科技报告、专利说明书、会议论文等。例如:维普《中文科技期刊数据库》、万方《数字化期刊子系统》IEEE/IEE、ElsevierScience、UMI博硕士论文全文库等。1.7.3按文献的结构等级(文献的加工程度)划分按文献中信二次文献(SecondaryDocument)定义:通过对大量分散、无组织的一次文献进行加工、提炼、压缩和组织,形成系统的、便于查找一次文献的工具。作用:是存储和报道一次文献线索、提供查找的途径索引。科技文献检索课的主要内容:学习二次文献的利用方法。特点:具有汇集性、浓缩性、有序性、系统性等特点。包括:目录、题录、文摘、索引等。例如:工程索引Ei、ISTP中国学术期刊数据库(题录文摘版)二次文献(SecondaryDocument)定义:通过对3.三次文献(TertiaryDocument)定义:在利用二次文献的基础上,对检索到的一次文献进行广泛、深入的分析研究后,选用相关一次文献再次经加工编写出来的成果。如综述、述评、进展等。特点:从新的高度和深度揭示相关一次文献,是一次文献的浓缩。是情报信息重要来源。例如:各种词典、百科全书、年鉴、手册、综述、评论、专题述评等。文献之间的相互关系:

一次文献是文献的基本形式,是检索的主要对象,是二次、三次文献的基础;二次文献是检索一次文献的工具,是文检课学习的主要内容;三次文献是一次文献的浓缩,是对众多文献分析、综合归纳、整理而形成的。总的说来:科技文献经过加工、压缩,从一次文献到三次文献,使科技文献由分散到集中,由无组织到系统化。3.三次文献(TertiaryDocument)定义:在

2.8.1信息检索效果评价 信息检索效果是指信息检索系统检索的有效程度,它衡量了检索结果对用户需求的满足程度,是检索系统性能的直接反映。 据美国学者克莱弗登的研究,评价信息检索效果的指标主要有六个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。2.8信息检索效果 2.8.1信息检索效果评价2.8信息检索

查全率(RecallRatio)查准率(PrecisionRatio) 查全率和查准率是由美国佩里(J.W.Pery)和肯特(AllenKent)于50年代中期提出来的,后经不断改进和完善,至今已成为评价检索效果最常用的两项关键指标。确定查全率和查准率最常用的方法是有名的2×2表。第2章文献信息概论 查全率(RecallRatio)查准率(a:表示被检出的相关文献,即查准的信息;b:表示被检出的不相关文献,即误检的信息;c:表示未检出的相关文献,即漏检的信息;d:表示未检出的不相关文献,即正确拒绝的无关信息。参加检索的全部文献量:a+b+c+d;被检出文献:a+b;未被检出文献:c+d;查全率=[a/(a+c)]*100%指检出的相关文献信息量与检索系统中相关文献信息总量的比率,反映出信息检索系统检出相关文献信息的能力。查准率=[a/(a+b)]*100%指检出的相关文献信息量与检出文献信息总量的比率,反映出信息检索系统的精确度。a:表示被检出的相关文献,即查准的信息;

漏检率(OmissionFactor)和误检率(NoiseFactor) 漏检率指漏检相关文献信息量与检索系统中相关文献信息总量的比率,它与查全率相对应。具体公式如下: 漏检率=[漏检相关文献信息量/检索系统中相关文献信息总量]×100%=(c/a+c)×100%

误检率指误检(检出不相关)文献信息总量与检出文献信息总量的比率,是衡量信息检索系统误检程度的尺度,与查准率相对应。 误检率=[误检文献信息量/检出文献信息总量]×100%=(b/a+b)×100%第2章文献信息概论漏检率(OmissionFactor)和误

响应时间(ResponseTime) 响应时间指在一次检索过程中,用户从开始向信息检索系统提问到系统输出检索结果的全部时间。响应时间的长短也是评价检索系统效果的重要指标,直接反映着信息检索的速度。 此外,还有一些与检索效果相关的指标,如检索系统的收录范围、结果输出形式、易用性、用户负担,以及在网络环境下发展起来的重复链接率、死链接率等。第2章文献信息概论 响应时间(ResponseTime)第22.9.2影响信息检索效果的因素第2章文献信息概论标引的质量检索语言的性能检索途径的数量检索策略的优劣检索人员的素质2.9.2影响信息检索效果的因素第2章文献信息概论标引的ThankY

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论