




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8 信息检索与服务信息检索是获取信息最重要、最有效的手段。其作用在于节约检索者的时间和精力,避免科学研究中的重复劳动,指引读书治学等。信息服务是与信息和信息工作密切相连的一种特定范围的劳动,同其它商品一样提供自己的特殊使用价值为社会带来财富。本章概述了信息检索与服务的基本原理与方法,作为信息过程管理的一个重要组成部分。 8.1 信息检索8.1.1 信息检索基础理论 1、信息检索(Information Retrieval)概述(1)信息检索的含义:狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。广义的检索包括信息的存储和检索两个过程:信息存储(Storage)是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检 索功能的工具或检索系统,供人们检索和利用。检索(Retrieval)是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。(2)信息检索的类型:数据检索(data retrieval)数据检索:以文献中的数据为对象的一种检索。存贮的信息是数据,检索时要搜索数据资料档,并针对提问输出答案。数据检索是从文件、数据库或存储装置中查找和选取所需数据的操作或过程,包括数值形式和非数值形式的数据。按查询问题的要求,分为简单检索(即单一因素的检索)和综合检索(即综合条件检索)。如:查找各种物质的物理化学常数、各种统计数据和工程数据等。(“某一新型载货汽车的载重量是多少?百公里油耗是多少?”)事实检索(Fact Retrieval)事实检索以文献中的事实为对象,检索某一事件发生的时间,地点,或过程;存贮的信息是各种事实,检索时可以对被检索的事实作某种逻辑推理,进行比较和分析,然后再输出有关某一事物的具体答案。如:查找鲁迅生于某年?世界上最长的斜拉桥是哪座?该桥位于什么地方?何时建成?事实检索要求检索系统不仅能够从数据 (事实) 集合中查出原来存入的数据或事实,还能够从已有的基本数据或事实中推导、演绎出新的数据或事实。例如,系统中存储如下事实:李明是A校学生。A 校学生都学外语。如果该系统是事实检索系统,则它应当能回答某用户提出的“李明学外语吗?”这种问题。事实检索是情报检索中最复杂的一种。它要求系统中的数据和事实以自然语言或接近于自然语言的方式存储。不仅要存入各种数据或事实单元,还要存入各单元之间的语义关系、句法关系以及各种有关的背景知识。允许用户用自然语言提问,并能用自然语言作答。更重要的是,系统必须具有一定的逻辑推理能力和自然语言理解功能。目前事实检索通常还是依靠人工来完成。文献检索(Information Retrieval)文献检索:以文献原文为检索对象的一种检索。存贮的信息是文章标题、著录项目和关键词组成的文献单元,检索时,按提问检索词查找文献资料档,输出文献题录和文摘。例如,“设计人行天桥的参考文献有哪些?”文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。2、信息检索原理信息检索系统是通过信息存储和信息检索两个互逆的过程来实现系统的职能。工作原理如下图所示。一个完整的信息检索系统是由存储子系统和检索子系统两部分组成的。(1)存储过程对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程或生成检索工具库。(2)检索过程分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的应用过程。(3)信息存储与检索相互依存由于职业、知识水平、个人素质甚至习惯等因素的差异,信息存储人员(标引者)与信息检索用户(检索者)对同一信息的分析、理解会存在不同。比如计算机在生物化学中的应用一文,标引者可能将其归入“生物化学”类,而检索者则可能在“计算机”类查找该文。这样,标引者与检索者之间发生了标引错位,存储的信息就无法检索到。 怎样才能保证信息存得进又取得出呢?那就是存储与检索所依据的规则必须一致,也就是说,标引者与检索者必须遵守相同的标引规则。这样,无论什么样的标引者,对同一篇文献的标引结果一致,不论是谁来检索,都能查到这篇文献。 信息存储与检索共同遵循的规则称之为信息检索语言(详见8.1.3)。只要标引者和检索者用同一种检索语言来标引要存入的信息特征和要查找的检索提问,使它们变成一致的标识形式,信息的存储过程与检索过程就具备了相符性。相应地,存入的文献也就可以通过信息检索工具(系统)检索出来。如果检索失败了,那么就要分析一下检索提问是否确切地描述了待查课题的主题概念?在利用检索语言标引时是否出了差错,从而导致检索提问标识错误?只有检索提问标识和信息特征标识一致时,相关的文献才能被检索出来。 信息检索正是以信息的存储与检索之间的相符性为基础的。如果两个过程不能相符,那么信息检索就失去了基础。检索不到所需的信息,存储也就失去了意义。3、信息检索方法(1)常用法又称直接法、工具法,是指直接利用检索系统(工具)检索文献信息的方法。这种方法优点在于能够明确判断文献所包涵的信息内容是否符合需要,缺点是难以获得全面的文献,且费时费力。如果检索课题单一,文献相对集中,又熟悉检索书刊,则可用这种检索方法,而对有多个主题、文献离散度较大的课题,就难以获得理想的检索效果。由于此方法不依靠检索工具,因此不是严格意义上的文献信息检索方法。它又分为顺查法、倒查法和抽查法。顺查法经过分析,确定查找文献信息的起始年代,再利用选定的检索工具或检索系统,由远及近地逐年查找,此法的检索效果显著,但费时费力,工作量较大。如:查找信息论的资料可从1948年查起。倒查法利用选定的检索工具或检索系统,由近及远的逐年查找,重点是查找近期的文献信息,此法节省时间,但容易漏检。这种方法多用于检索某一课题的新技术、新方法、新理论、新进展等。抽查法针对某学科处于兴旺发达时期的若干年进行文献信息的查找,此法的检索效果较好、效率也颇高,但使用的前提是必须熟悉该学科的发展过程及其特点。(2)追溯法追溯法是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。(3)循环法 循环法又称分段法或综合法。它是分期、分段交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。4、信息检索途径检索途径依赖于文献信息的特征。文献具有两种特征:即外部特征和内容特征。文献的外部特征主要是指文献载体上标明、易见的项目,有文献题名、责任者、序号、出版者、出版地、出版年等;文献的内容特征有所属学科及所属主题等。因此,根据文献的外部特征和内容特征,将信息的检索途径分为两大类型。(1)内容特征途径分类途径 分类途径是指按文献内容的学科分类体系查找文献信息的途径。一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样编排的结果可将同一学科的文献集中,便于按学科查找文献。分类目录和分类索引是普遍使用的分类检索工具。分类途径缺点是,对于较难分类的新兴学科和边缘学科来说,查找不便,查找时须首先了解反映学科体系的分类表,再将概念变换为分类号,然后按分类号进行检索,由于概念变换为分类号的过程中易出差错,所以也会导致漏检和误检。但是很多检索者希望从其熟悉的分类系统,从学科概念的上下左右关系了解事物的派生、隶属、平行等关系,满足族性检索的需求。分类途径能够较好地满足这一要求。主题途径主题是文献所表达的中心思想、所讨论的基本问题和研究对象。主题途径指根据表达文献主题内容的主题词及其派生出的关键词为标识查找文献信息的途径。主题途径的主要检索工具是主题目录和主题索引,或标题词索引、关键词索引、叙词索引等。主题目录按文献内容主题词组织,以文献所讨论的主题直接检索,可以查到分散于各学科里同一主题的文献。主题索引是工具书辅助索引之一,它可揭示包含该主题的文献信息在文献正文中的位置。主题途径检索文献信息的优点是,用主题词作为标识,表达概念准确、灵活、专指度高,可使同一主题的文献集中,检索效率高。又由于主题词可随科技发展增加或更新,因此便于查找新兴学科的文献信息,在各学科和其分支交叉渗透日益增多的当前,主题途径较好地适应了这一要求。主题途径检索文献信息缺点是,主题索引缺少学科系统的整体性和层次性,因此,难以达到很高的查全率。分类主题途径分类主题途径是分类途径与主题途径的结合,它能够尽量避免两者的不足,取其所长。一般说它比分类体系更具体一些,无明显的学术层次划分,又比主题法概括一些,但保留了主题体系按字顺排序以便准确查检的特点。其它途径主要是指一些辅助检索途径,如按化学分子式排出的 “分子式索引”,可提供一种从分子式角度查找化学化工文献的目的,另外还有化学物质索引、合金索引、地名索引等各种专门索引,以满足查检特定种类文献信息的需求。(2)外部特征途径 著者途径著者途径,即通常所说的责任者途径。著者是指对文献内容负责或作出主要贡献的个人或团体,包括著者名、评者、编者等。著者途径是根据文献著(译、编)者的名称查找文献信息的途径,是外文检索工具较为重要的途径和惯用途径。按著者姓名字顺排列,易于利用,又便于编排,也易于机械加工。通过著者途径进行检索,可以查找特定学者、专家的最新论著,系统地发现和掌握他们的研究方向和研究进展。在使用著者途径检索文献时,需要注意的是检索系统对著者索引的编制规则和不同国家作者姓名的拼写。国外比较注重劳动者途径检索,而我国很少有人去记忆人名,故著者目录少。序号途径利用文献的代码、数字编号进行查找。它的标识是书刊号、专利号、标准号等。例如:ISBN号7(国别)-5001(出版社号)-0016(序号)-7(校验位)ISBN号是由10位数字组成,共分四段:组号:代表出版者的国家、地理区域、语种等,我国的组号为“7”。出版者号:代表组内所属的一个具体出版者(出版社、出版公司等)。由国家或地区的ISBN中心设置和分配,可取1-7位数字。书名号:由出版者给予每种出版物的编号。校验号: ISBN号的最后一位数值,它能够校验出ISBN号是否正确。例如:武汉大学出版社出版的图书馆学导论,其中国标准书号是: ISBN7-307-00211-6/G 53。其中,“7”为我国的组号,“307”为武汉大学出版社的代号,“00211”为书名号,表示该书是出版社出版的第211种书,“6”为校验码,G为分类号。“53”为种次号,即该书为G类的第53种书。例如美国化学文摘的专利索引(Patent Index)、美国政府报告通报和索引(Grovernment Reports Announcements & Index)的合同号资助号索引(Contract/Grant Number Index)和NTIS订购号报告号索引(NTIS Order/Report Number Index)。 名称途径也称题名途径、书名途径。题名是表达、象征、隐喻文献内容及特征的词或短语,是文献的标题或名称,包括书名、刊名、篇名等。文献题名有正题名、副题名和辅助题名。题名检索途径是指根据文献题名查找文献信息的途径。它把文献题名按照字顺排列起来编成索引,其排法简单易行,易于查检。但因书名和篇名较长,不宜作为检索标识,又因不同文字的形体结构和语法结构有自己的特色,字尾变化复杂,所以难以把同样意义的文献集中于一处,实际使用价值已不为人们看好,而逐渐失去重视。5、信息检索步骤信息检索工作是一项实践性和经验性很强的工作。对于不同的待检课题,将采用不同的检索程序,即文献信息检索的具体步骤和方法应因题而定,因人而易。但在实际检索工作中,还是可以依据信息检索的基本原理,归纳出文献信息检索的一般程序和步骤,以使检索工作有条不紊,取得较好的检索效果。通常,信息检索接下列程序进行:(1)分析课题,确定检索范围所谓检索课题是根据查找文献信息或查解科研疑问的需要所拟定的问题。在检索之前,首先须对待检课题进行认真分析,明确检索的目的和具体要求,以便使用户的检索提问符合检索工作的要求,做到检索与提问一致,避免盲目检索。在分析课题的基础上,还要辨明检索课题的类型,是查文献,或是查事实,还是查数据,以及要求查找文献信息的时间范围、学科范围等,以求对检索课题有个总的认识。(2)选择合适的信息检索工具和检索系统当检索课题明确以后,就要选择与课题相符、质量较高、检索手段比较完善的检索工具。主要考虑该领域有哪些适用的工具,其出版时间和所概括的范围能否包括拟检的问题,其质量和权威性如何,是否具备多种检索途径等。一般对检索工具的要求是:收录文献资料的专业广、类型齐全、数量大、报道速度快、文摘详细,并附有各种索引。检索时,既要选择专业性检索工具,也要考虑使用综合性检索工具,以获得满意的查全率。选择检索工具时,可利用有关的指南、检索手册及便览等,以对各种工具书进行比较和选择,从而确定更适合课题要求的检索工具。(3)确定检索途径在利用检索工具查找文献时,主要是通过各种检索途径来查找文献线索。所谓检索途径,就是利用文献信息的某种特征作为检索标识来查询相关信息的途径,又称为检索点或检索入口。一般来说,每种检索工具都为检索者提供多条检索途径,所以要从检索课题的已知条件和要求出发,从文献的外部特征和内容特征入手,选择合适的检索途径进行检索。如果检索课题要求的是泛指性较强的文献信息,则最好选择分类途径;如果要求专指性较强的文献信息,则最好选用主题途径;如果事先已知文献题名、著者、号码等条件,则可以利用题名途径、责任者途径、号码途径进行检索。(4)确定检索标识,构造检索表达式检索标识的确立,应根据检索课题的已知条件和选定的检索途径来决定,如确定主题词或分类号等,选定后,针对不同的标识分别进行检索。如果采用计算机检索,在确定检索词后,要根据检索课题的需要编写检索表达式。我们说,检索表达式是人机交流的人工语言,对检索效率的高低有直接的影响,一般分为简单表达式和复合表达式。(5)检索方法的选定检索方法的选择主要应根据课题的要求和检索工具的现状来决定:如果要求全面检索信息,选择顺查法;如果要求检索新的信息,则用倒查法;如果所需信息在时间上有限制,则用抽查法;如果没有适用的检索工具,则只能采用追溯法。检索方法的选择还受检索者对学科和检索方法的熟悉程度的影响。(6)索取原始信息根据确定的检索途径和检索方法,利用检索语言在检索工具中进行查找,获得检索结果。这一步是检索工作的真正实施,也是检索技能的充分体现。如果发现检索出的文献不符合检索课题的要求,还需要对检索策略进行及时的调整。所调整的方面包括对检索工具、途径、方法与技术的选用调整,以获得最佳的检索效果。大多数情况下,检索工具(系统)只能提供文献信息的线索,用户若要阅读原文,还需要通过馆藏目录、馆际互借、原文传递、直接向作者索取等渠道或方式获取原始文献。小结:信息检索由于受多因素影响,能否顺利检索到所需信息,关键在于检索者的智能(mind),因为这一过程始终贯穿着分析判断、调整筛选的活动,它要求检索者具有丰富的知识、较强的分析判断能力、熟练的检索方法和检索技巧。6、信息检索评价(1)检索系统评价信息源评价。数据库规模、收录范围、信息源质量控制等指标可反映信息源的质量。信息组织管理。主要指信息标引的方法、组织方式及更新周期。系统功能评价。取决于系统所能提供的检索途径、检索方式和检索方法。输出结果评价。主要包括信息检索系统对用户提问的响应时间、命中记录的排序功能和输出显示形式。用户接口。“用户友好”是信息检索系统用户接口的建设宗旨,它决定了用户是否喜欢使用该系统。系统技术支持。系统技术支持主要指系统及其软、硬件平台的通用性、兼容性、先进性、可靠性和稳定性。系统的性能价格比也是评价系统技术经济性能的指标。(2)检索效果评价信息检索效果的评价,目前尚未有统一的标准,常用的标准主要指查全率与查准率。评价检索结果好坏的指标查全率查全率(recall factor)是从量度上考查所需信息的被检出率,以此考查检索工具库满足用户检索需求的完备程度。其计算公式为:查全率=被检出的相关信息数/相关信息总数(检出+遗漏)100 查准率查准率(precision factor)是衡量检索系统拒绝非相关信息的能力。其计算公式为:查准率=被检出的相关信息数/被检出信息总数(相关+不相关)100查全率和查准率的关系查全率和查准率并不容易评价检索效果。例如查准率,被检出的都是相关信息,但信息的相关程度不同;对于查全率更难于统计和比较,因为检索工具库对不同检索者的不同需求,其价值是不同的,要计算出查全率,必须在检出的信息中分出相关信息与非相关信息,还必须计算出检索工具库中未被检出的遗漏的相关信息。由此可见,查全率与查准率只是相对的评价标准,而不是唯一可靠的绝对标准,不能片面追求查全率与查准率。查全率与查准率之间存在着反变关系。当某一系统的查全率与查准率处于最佳比例关系时,继续提高查全率,必然导致查准率的降低,相反,如果过分追求查准率,则导致相关信息被遗漏而降低查全率。测量检索误差的指标漏检率漏检率指系统未检出的相关信息占库中相关信息总数的比例,计算公式为:漏检率=未检出的相关信息数/数据库中相关信息总数100误检率误检率指在检索结果中,不相关信息占检出信息的比例,计算公式为:误检率=被检出的非相关信息数/被检出信息总数(相关+不相关)100基于用户的评价方法覆盖率覆盖率表明在检出的信息中,有多少是用户已经掌握的信息。新颖度新颖度则表明在检出的信息中,有多少是用户原来并不知道的相关信息,新颖度的高低可以左右用户对检索价值的判定。其他错检率错检率是测定检出的非相关信息数占数据库中非相关信息总数的比例。相关率相关率指与提问相关的信息在系统中的分布密度。8.1.2 信息检索工具 1、检索工具的特性 (1)检索工具的概念简单地说就是用来报道、存储和查找信息的工具;详细地说是汇辑各种信息,按特定的方法加以描述和编排,以供查考的文献。(2)检索工具的功能具有存储和检索两方面的基本功能。存储功能,指检索工具把汇集的有关信息,按其特征记录下来,使之成为一条条信息线索,并将它们系列化,这就是所谓的信息存储过程。检索功能,指检索工具提供一定的检索手段,使人们能够按照一定的检索方法,查出所需的信息或线索,这就是信息的检索过程。(3)检索工具的特点编排特殊 便于查检 信息密度大 概括性强 (4)检索工具应具备三个条件详细记录所著录文献线索,读者可根据这些线索查找所需文献。根据检索标识,如分类号、主题词、文献号代码等寻找所需文献。提供检索的必要手段,如分类索引、主题索引等,便于读者检索。2、检索工具的类型 (1)按出版形式划分期刊式检索工具有长期固定的刊名,定期连续出版的一种检索刊物,如美国医学索引、中文科技资料目录等。报道文献以近期为主,能及时反映新发表的科研资料。特点:有连贯性,可长期积累,卷期与卷期之间衔接,无中断及重复。单卷式检索工具以某一学科或专题为检索内容,报道若干年内该学科领域的文献,可一期或不定期出版。特点:专业性强,文献集中,专题文献检索方便,价值也高 ,如“19491979年医学论文累积累引”,按学科分班出版。附录式检索工具不单独出版,附于图书或论文之后,常以参考文献的形式出现,是著者著书和写文章时的参考资料,是经过精选出来的丈献,有较大的实用价值,是查阅文献的方法之一。特点:它是专题索引,同一专题,文献集中,但有局限性,易漏检。卡片式检索工具编制者按自己的需要,把所需内容摘录在文献卡片上,分类整理排列而成。特点:可自由组合排列,也可随时增减,逐步积累,灵活性大,根据学科发展,不断进行更新,但体积大,成本高,不便携带。胶卷式检索工具是以缩微胶卷形式出版的检索工具。优点是缩小了检索工具的体积,出版速度快,但要通过缩微机才能阅读,不及卡片式检索工具方便。磁带式检索工具已是随计算机在图书馆应用而发展起来,通过程序设计,将文献资料的文字和符号转换成机器语言,存储在计算机磁带上。特长:磁带具有容量大、记录速度快、重量轻、体积小、便于保存和传送的特点。(2)按基本作用划分题录型;参考型;综合型;搜索引擎。(3)按检内容与功用划分目录;索引;文摘;辞典;百科全书;年鉴;手册;名录;表谱;图谱;类书;政书。3、检索工具的一般结构 事实上,每一类、每一种具体的检索工具其组织结构不会完全相同,但作为检索工具一般都由4大部分组成,即正文部分、文前部分、索引部分和附录部分。(1)正文部分检索工具记录的不是文献的全文,仅著录文献的外部特征和内容特征,包括文献篇名、著者和文献来源正文部分。是检索工具的主体,也是我们查阅的具体对象。该部分存储了描述原始文献信息特征的条目。条目一般包括原始文献的题名、著者、出处、内容摘要、主题词、分类号、索取号等,每个条目都有一个编号,称为文摘号或顺序号,是检索工具的信息库,用于组织各种索引。(2)文前部分文前部分指检索工具正文之前的各个组成部分。通常有封面、书名页、版权页、目次、序言等基本组成部分,以及范例和使用说明、缩略语表等。(3)索引部分检索工具正文部分多按分类编排,检索时为提高检索效率,可利用各种索引。索引部分是最主要的辅助检索途径,是为了提供多途径检索而编制的别于正文检索方法的索引。辅助索引是检索工具的一部分,必须与正文一起使用。它提供了更多的检索途径,一般包括主题索引、著者索引、序号索引等,以满足读者通过不同途径检索正文。(4)附录部分 附录部分是检索工具的必要补充,附录的作用是不可忽视的。从其性质上看主要有两种:一种是内容与正文有密切联系的,只是为使正文更加紧凑,将其另外作为附录处理的,百科全书的附录大多数属于这种性质。另一种附录是在内容上与检索工具正文没有任何联系,纯粹是为了扩大信息来源,增强检索工具的检索功能而设置的,语言工具的附录不少属于这种性质。附录部分包括摘用的刊物、各种名称的缩写、文字的翻译、术语、原始文献收藏单位、常用图表、相关数据公式、缩略语、补遗、勘误等。4、检索工具的排检方法 检索工具之所以可以作为查检的对象使用,很大程度上取决于其结构和编排。检索工具的排检法,是指各类检索工具的编排与检索方法,对使用者来说是检索方法,对编者来说是编排方法。检索工具的排检方法大致可分成两大体系:(1)按字顺编排,是指根据字词的形体或读音来编排检索工具中的条目,当然不同语言的检索工具,其字顺编排具有差异性,汉语本身的字顺编排也比较复杂。(2)按内容性质编排,根据信息的内容性质来编排检索工具中的条目。5、检索工具的评价 检索工具的主要作用是供人们查找特定的信息,所以评价检索工具的基本原则是检索工具的实用性。从这一原则出发,评价检索工具质量高低通常依据的标准有:(1)内容范围检索工具内容全面与否直接关系到它能否提供答案。作为某一领域的检索工具,其内容的覆盖面至少应该包含该领域中的各种基本信息。(2)编排技术检索工具的编排技术,直接影响其检索功能。考查检索工具的编排技术主要着眼于3方面:正文编排组织是否科学;辅助检索途径是否完备、易用;版面是否清晰易识别。(3)时效性时效性是所有检索工具的基本特征,检索工具所收信息是否新颖、及时,也同样标志着它的实用性。检索工具作为报道信息的工具,必须能够及时反映信息的更新,以满足人们的查新需求。检索工具的出版与修订时间是其时效性的重要标志。(4)权威性权威性主要指考查检索工具的出版者、编著者的资历、威望、实力等内容。当然,权威性只是用来判断检索工具质量的一个相对标准,而不是唯一可靠的因素。总之,要全面衡量一种检索工具的质量,应将各种因素综合起来考虑,同时也应看到,这些标准是相对的,不是一成不变的。评价鉴别一种检索工具的优劣,主要依赖于检索者对检索工具的使用,通过检索具体的问题,才能考查检索工具回答问题的圆满程度以及使用的方便程度,在此基础上,可进一步参考有关书评信息,这样才能获得对一部检索工具较全面、准确的评价。8.1.3 信息检索语言 1、信息检索语言的基本功能 信息检索语言是根据信息检索的需要而创造的人工语言。其实质是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。它可以是从自然语言中精选出来并加以规范化的一套词汇,可以是代表某种分类体系的一套分类号码,也可以是代表某一类事物的某一方面特征的一套代码,用于对文献内容和信息需要进行主题标引、特征描述或逻辑分类。目前世界上有许多种信息检索语言,比较著名的有: 中国图书馆图书分类法、汉语主题词表、国际十进分类法、 杜威十进分类法、 NASA 叙词表等。信息检索语言必须具备两个基本功能:(1)表达信息检索语言必须能够表达信息的多种特征,而且要准确、简明,对文献的情报内容(及某些外部特征)加以标引,对内容相同及相关的情报加以集中或揭示其相关性。(2)组织信息组织信息就是要对大量情报加以系统化或组织化,便于将标引用语和检索用语进行相符性比较。所以,检索语言不但要能够表达信息特征,使其具有专指性,而且要完善地组织信息,使其具有系统性。2、检索语言的组成要素 信息检索语言通常应具备下列三个基本要素:1)有一套用于构词的专用字符。字符是检索语词的具体表现形式,它可以是自然语言中的规范化名词或名词性词组, 也可以是具有特定含义的一套数码、字母或代码。2)有一定数量的基本词汇用来表述各种基本概念。基本词汇是指组成一部分类表或词表中的全部检索语词标识之总汇,如分类号码的集合就是分类语词的词汇,一个标识 (分类号、检索词、代码)就是一个语词。而分类表、词表等可以说成是检索语词词典,是把自然语词转换成检索用语的工具。3)有一套专用语法规则来表达由各种复杂概念所构成的概念标识系统。标识是对文献信息特征所做的最简洁的表述。标识系统是对全部标识按其一定的逻辑关系编排组合成的有序的整体。语法规则是指如何创造和运用那些标识来正确表达文献信息内容和信息需要,以有效地实现信息检索的一整套规则。3、检索语言的特点 (1)严密性检索语言表达的信息多种多样,要准确表达、系统组织,必须要严格规定,力争避免或减少自然语言中多义、同义、异义等现象,使标识与信息对应,这样才有利于信息的标引与检索。(2)可控性由于信息检索语言是在自然语言基础上形成的,而自然语言受多种因素影响,使其有较强的失控性。因此,检索语言必须在自然语言基础上,利用符号、规则,按照学科的逻辑特征和论题的语言特征以及信息的其他特征共同组成。检索语言是由人来操作和使用的,在实际使用中,针对不断出现的新问题,应及时调整、修订,以适应新的变化和反映新的理论、新的事物。(3)系统性检索语言不仅要表达信息,更重要的是组织信息,通过某种标识把各种信息组成一个有序的体系,标识的组织排序应具有系统性、连续性。4、检索语言的类型 5、检索语言的词汇控制 (1)检索语言词汇控制的意义 检索语言的词汇控制也称规范化处理。由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。就自然语言来说,存在以下缺点:词汇的同义现象、多义现象、语义不清、词义含混、词量庞大、词间关系不明晰影响检索效果。在信息检索过程中,检索需求是多种多样的,如族性检索、特性检索、扩检、缩检等,这就必须把自然语言词汇进行规范,以便实行将标引用语与检索用语进行相符性比较,取得理想的检索效率。在现行的一些检索系统中,也比较广泛地直接采用自然语言检索,它虽然节省了词汇控制的成本,但却是以牺牲检索效率为代价的。因此,完全采用自然语言进行信息组织的系统并不是理想的检索系统。由此有了规范化检索语言在网络信息组织中的应用研究,有了网络本体语言的开发。网络信息组织从自由走向规范足以说明词汇控制的重要性。(2)检索语言词汇控制的内容词汇控制的目的是为了使检索词符合唯一性、规律性、定型性、通用性和准确性。为了达到这个目标,应该从以下几个方面进行词汇控制:1)词量控制词量控制是对收入词表的词汇进行压缩、精选,使之与所要标引的信息数量和检索要求相适应。2)词类控制词类控制就是从词类的角度对词类集合做出限定,从总体上控制、排除与标引和检索无关的词。3)词形控制词汇也存在不同的书面表达形式,如不同的词序、简繁体、单复数、不同拼写法,以及标点符号、字母、数字等,为了实现每个词词义和词性的唯一性,必须进行词形控制。4)词义控制指通过对词语的限定,使检索语言中的词汇词义明确,一个词语表示一个概念。5)词间关系控制在情报检索语言词典编制中,对词汇语义和词间关系必须控制,这是为了词典中每个词汇都有独立的语义,词间关系能形成一个语义网。6)专指度控制检索语言词汇的专指度是指语义的内涵与外延和信息主题内容的切合程度。适度的专指度是词表易用性的重要方面。词汇的专指度还受词汇先组度影响。专指度控制的关键是适度,一般应根据文献数量及其分布、用户检索需求为依据加以确定。8.1.4 大型综合性检索系统 1、大型综合性检索系统:(1)中国知识基础设施工程(CNKI,);(2)万方数据资源系统();(3)维普资讯有限公司数据库系统;(4)中国高等教育文献保障系统CALIS();(5)联机检索系统Dialog();(6)联机计算机图书馆中心OCLC();2、常用的大型数据库:(1)中国人民大学书报资料中心复印报刊资料全文数据库;(2)国家科技图书文献中心(NSTL)数据库();(3)北京文献服务处(BDS)全文信息检索系统();(4)上海市图书馆全国报刊索引数据库;(5)ProQuest系统全文数据库(/pqdweb);(6)EBSCO书目与全文数据库();8.2 信息服务8.2.1信息服务概述 1、信息服务(Information Service)的含义(1)概念关于信息服务的概念,有狭义与广义之分:狭义的信息服务:指信息提供服务,它是信息提供者根据用户的需要,运用科学的方法,采用先进的技术手段向用户提供特定信息产品的活动。广义的信息服务:泛指以产品或劳务形式向用户提供传播信息的各种信息劳动,包括信息的传播报道、信息咨询、以及信息技术培训和信息提供等项劳动。 (2)基本要素信息服务的有效开展,必须具备四个基本要素:信息服务者信息服务者是信息服务工作开展的主体,他们通过信息采集、加工、分析、研究、传递等一系列活动,向用户提供符合用户要求的信息产品。信息用户信息用户是信息服务的对象和受益者,他们通过支付费用的方法来获得信息产品或服务,用户的信息要求是信息服务业发展的动力。信息产品信息产品是信息服务的劳动成果,是联系信息服务者和信息用户的媒介和关注焦点,也是信息服务的关键所在。信息基础设施信息基础设施指信息服务工作中所采用的服务设施,它包括计算机、网络、打印机、复印机等一系列现代化的信息加工处理与服务技术手段。2、信息服务的类型 信息服务的类型按信息服务作用的信息客体类型分实物信息服务(包括材料、样品、样机信息服务)交往信息服务(包括信息发布服务等)文献信息服务(包括传统文献服务和电子文献服务)数据服务按信息服务中的信息加工深度分一次服务(以原始信息为内容的服务)二次服务(包括目录、题录、文摘、索引服务)三次服务(在原始信息基础上的研究、综述与评介服务等)按信息服务的主体内容分科技信息服务、经济信息服务技术经济信息服务、法律信息服务流通信息服务、军事信息服务等按信息服务业务形式分信息传输服务(通信服务)宣传报道服务、信息发布服务新闻出版服务、信息提供服务信息检索服务、信息资源开发服务信息分析与预测服务、咨询服务系统开发服务、信息代理服务等按信息服务手段分传统信息服务电子信息服务等按信息服务指向范围分单向信息服务(指向单一用户的服务)多向信息服务(面向众多用户的服务)按信息服务用户范围分内部服务(面向内部用户的服务)外部服务(面向外部用户的服务)按服务的主动性分被动信息服务(由用户先提出服务要求,然后按需组织的信息服务)主动信息服务(主动面向用户的信息服务)按信息服务持续时间分长期信息服务即时信息服务按服务是否收费分有偿信息服务无偿信息服务3、信息服务的原则 信息服务的目的是通过服务人员的智力和体力劳动来满足信息用户的信息需求。信息人员的劳动价值最终在用户信息利用活动中体现。无论开展何种类型的信息服务工作,“为用户服务”的理念对任何信息服务部门都是不可缺少的。同时,为了开展好信息服务,信息服务机构必须坚持以下基本原则。(1)针对性原则针对性是信息服务内容与信息服务对象的“匹配”问题,信息服务就是要为特定的用户找到特定的信息,满足用户的特定需求。(2)及时性原则在信息服务中,信息服务机构必须及时了解用户的信息需求,并尽可能快地根据用户的需求来满足其需要。(3)精练性原则精练性原则要求在信息服务中向用户提供的信息内容要简明扼要,既能满足用户的需求,又不过多地耗费用户的时间与精力。(4)准确性原则准确性是信息服务的最基本要求。要使服务具有准确性,信息服务机构必须保证有可靠的信息来源,同时也要保证其工作不出偏差。(5)方便性原则信息服务要为用户提供最大的便利条件,因此,信息服务机构要提高服务质量,简化服务程序,开展用户培训等工作,这样用户得到很多便利服务,能够刺激用户的消费需求,又为信息服务机构提供了更广阔市场。(6)效益性原则信息服务是有偿服务,信息服务效益性原则要求既要保证信息服务机构与信息用户的经济效益,也要保证信息服务的社会效益。8.2.2信息服务对象研究 信息用户是信息服务的对象,其基本状况和信息需求决定了信息服务的内容和方式。信息用户是指社会信息及其服务的使用者,它的范围极为广泛,凡是在科研、技术、生产、管理、文化等各种活动中利用信息或信息服务的个人或团体都是信息用户。1、用户信息需求的层次 按照情报学家科亨(Kochen)对用户信息需求的划分,用户信息需求的结构可分为三层,即用户信息需求的客观状态、认识状态和表达状态。(1)客观状态用户信息需求的客观状态是指用户对信息的总体需求状态,是由个人的工作、环境、知识等客观因素决定的。(2)认识状态用户信息需求的认识状态是用户对客观信息需求的主观认识,包括用户自己认识到的信息需求,以及因外界刺激如信息机构的信息服务唤起而被动认识到的信息需求。由于用户认识到的信息需求和用户的客观信息需求可能完全符合,但多数情况下仅为部分重合,即用户客观信息需求中还有一部分尚未被用户认识,同时因用户主观因素的影响,用户认识到的信息需求中还可能存在部分非真实的信息需求。(3)表达状态 用户信息需求的表达状态是用户将认识到的信息需求正式表达出来,实现了从需求向行为的转化,需求者以书面或口头的形式向情报机构表达自己的需求已处于行为状态。2、用户需求的影响因素 (1)社会因素用户的信息需求受多种社会因素的影响。 首先,一个国家的历史、文化及科学技术发展水平对信息需求有巨大的影响。如果一个国家文化水平较高、科学技术发达,则其社会成员的信息意识也较强,其信息需求也更为广泛和迫切。 其次,国家的社会政治因素如方针、政策、法律法规等决定着一个国家信息需求的一般特点及总的发展趋势。例如国家重视科学技术的发展并制定相关的科技发展方针政策可为用户的信息需求创造良好的外部环境,并且使他们的信息需求趋向高、尖、深和新。 第三,社会教育水平对用户的信息需求也有较大的影响。通常用户受到良好的教育,其信息需求将会增加且更能准确地表达出来。(2)信息用户的个体因素影响用户信息需求的自身因素主要有: 用户的信息意识和信息素养。信息意识(Information Consciousness)是指人们对信息价值认识的自觉程度、需求信息的迫切程度、捕捉信息的敏锐程度以及分析、判断和吸收信息的洞察程度。信息素质(Information Literacy)是人们查找、识别何时需要信息,以及查找、评价有效利用和传播信息的能力。不断提高用户的信息意识和信息素养,有助于用户的潜在信息需求向正式信息需求转变,并转化为对信息机构的信息服务的需求。 用户的职业和用户所从事的具体工作。这不仅影响着用户所需信息的范围、种类和数量,而且影响着用户信息需求的实现方式。 用户的受教育程度及知识水平。受教育程度不同的用户如博士、硕士、本科和专科等,以及不同的知识水平的用户如高级职称、中级职称和初级职称等,其信息需求有明显差异。 用户个人习惯、志趣及心理等。这些因素影响着用户对信息的特殊需求、用户真实信息需求的表达、以及用户信息需求的实现方式等。(3)信息产品与信息服务的影响(信息机构影响)信息机构的因素主要是指信息机构及其服务能力。信息机构对用户信息需求的积极作用主要体现在吸引更多用户使用信息机构所提供的服务和设施,不断产生新的信息需求,促使更多的潜在信息需求向正式信息需求转变,并使用户正式信息需求得到满足。服务能力强,需求者就乐于到信息机构索取信息;反之,需求者就可能中止信息需求。因此,信息机构也是影响信息需求的主要因素之一。信息机构能否对用户信息需求起到积极作用,具体体现在以下一些方面: 信息服务满足用户各种需求的能力。包括信息服务的种类与数量、所提供的信息是否准确及时、是否针对性强。 信息服务易用性。主要是指信息需求者通过信息机构获取和利用信息时操作程序简单、省力、易于实现。 信息服务环境的友好性。主要指信息工作人员的服务态度和服务水平等。 信息服务的收费。过高的收费将阻碍信息需求者的信息需求的表达及其实现。3、信息需求的特点 (1)模糊性信息需求的模糊性是指在数量、时间、内容、范围等因素上,用户需求的不确定性。如果将用户提出的问题看成是一个阈值,在阈值中有一个核心点,这个核心点才能准确代表信息需求。所以,如果表达的信息正是这个核心点,则信息需求是准确的,如果偏离这个核心点,则认为信息需求是模糊的。偏离越远,模粉性越大。此外,信息需求的模糊性也是与客观世界许多事物的模糊性密切相关的,如新兴学科、综合性学科、边缘学科都存在模糊性,文献的内容、属性也模糊不清等,这也必然影响用户信息需求的准确性。(2)矛盾性信息需求的矛盾性表现在两个方面:指个体需求自身的矛盾性,主要表现为用户的基本需求和信息需求不一致,例如,信息价值原则会吸引用户追求符合自己需要的信息,而省力法则会使用户力求以最小的代价去获取信息,这种原因也是用户需求难以满足的原因之一。指个体与整体需求的矛盾,即个人用户的需求表现出明确的目标,但从整体需求看则表现出差异、矛盾甚至对立,这种需求的矛盾使得满足一部分人的需求势必不能满足另一部分人的需求。(3)可变性信息需求是一个动态的概念。随着社会的发展和技术的进步,信息需求也会不断变化。一方面会产生新的信息需求;另一方面用户对信息的需求也会不断增加(尤其是随着用户知识的增加)。用户在获取信息后,往往有不足之感,这成为新的研究起点,因此,信息需求往往具有无限性,是可变的。(4)广泛性信息最大的特点就是认识主体的高度选择性。信息不具备物质与能源那样广泛的有效性,同样一份信息对于不同的人会产生不同的效应。在当今信息时代,不同渠道、不同载体形式的信息纷至沓来,令人迎接不暇。信息的“爆炸”之势,为人们有效选择和利用有价值的信息带来了诸多不便。为此,人们急切需要社会信息系统生产富有个性化的信息,提供个性化的信息服务。8.2.3信息咨询服务 信息咨询是一种基于各种信息的收集、加工、传递有效利用和反馈的业务活动。1、咨询服务的特点 (1)针对性咨询服务是针对特定用户的特定需求进行的信息服务。要提高咨询服务的质量,咨询机构不仅要充分领会用户的目标和要求,还要注意研究用户所处的环境和业务特点,使咨询服务真正符合用户的需要与利益。(2)创造性咨询服务是一项具有创造性的智力活动,在每一项咨询服务中,咨询人员都要用自己的知识、经验、智能进行开创性研究,提出自己独到的见解和有价值的方案。(3)协作性现代咨询具有高度综合性,它需要不同专业特长的多个专家共同协作完成。至于咨询活动由哪些专家组成,各类专家比例多少,要视咨询任务的不同而定。此外由于咨询课题的复杂性,要完成咨询任务还需要与用户的密切合作才能完成。(4)客观性咨询活动是独立的活动,是咨询方接受用户的委托而开展的课题研究,咨询机构不是委托方的附属机构,不代表任何人的意志,而是以事实为依据,公正、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南地铁笔试题目及答案
- 岳阳电厂笔试题目及答案
- 2025年河北省石家庄第二十八中学中考最后一次模拟化学试卷(含答案)
- 语文初二期末考试试题及答案
- 幼教考试试题及答案
- 《幼儿园教育活动设计与指导》课件-第二章 认识幼儿园教育活动设计
- 企业培训师模拟习题(附答案)
- 金融投资与市场分析报告
- 金融投资基础知识普及与风险防范
- 金融市场心理学的应用
- 钕铁硼材料倒角公差标准
- 2021新译林版新教材高中英语必修三全册单词默写(汉译英)
- 第7讲-化学工程的伦理问题-201912092040097
- 业务往来明细表
- 成品出货检验报告模板
- 网络营销7微博营销
- 苏科版物理八年级上册学期期末试卷(附答案)
- 插花学习通超星课后章节答案期末考试题库2023年
- 测绘技术和质量保证体系
- 手术室护理实践指南侧卧位的摆放
- 基坑支护及土方开挖工程监理实施细则
评论
0/150
提交评论