版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章 信息检索原理2.1 信息检索概念及类型2.2 检索途径与检索语言2.3 检索系统与检索方法2.4 检索技术与检索效果2.5 检索步骤与检索策略2.1 信息检索概念及类型2.1.1 信息检索的概念 1. 信息检索的含义 狭义的信息检索(狭义的信息检索(Information Information RetrievalRetrieval)是指依据一定的方法,从已)是指依据一定的方法,从已经组织好的大量有关信息集合中,查找并经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。这里的信息获取特定的相关信息的过程。这里的信息集合,往往指关于文献或信息的线索,得集合,往往指关于文献或信息
2、的线索,得到检索结果后一般还要通过检索命中的文到检索结果后一般还要通过检索命中的文献或信息线索索取原始文献或信息。献或信息线索索取原始文献或信息。2.1 信息检索概念及类型2.1.1 信息检索的概念 1. 信息检索的含义 广义的检索包括信息的存储和检索两广义的检索包括信息的存储和检索两个过程(个过程(Information Storage and Information Storage and RetrievalRetrieval)。信息存储是将大量无序的)。信息存储是将大量无序的信息集中起来,根据信息源的外部特征和信息集中起来,根据信息源的外部特征和内容特征,经过整理、分类、浓缩、标引内容特
3、征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。查找出满足用户要求的特定信息。2.1 信息检索概念及类型2.1.1 信息检索的概念 2. 信息检索的实质信息检索全过程包括两个方面:信息检索全过程包括两个方面:信息标引和存储过程。标引是用检索语言信息标引和存储过程。标引是用检索语言和分类号、主题词
4、表示信息,通过对大量和分类号、主题词表示信息,通过对大量无序的信息资源进行标引处理,使之有序无序的信息资源进行标引处理,使之有序化,并按科学的方法存储组成检索系统,化,并按科学的方法存储组成检索系统,这是组织检索系统的过程。这是组织检索系统的过程。信息的需求分析和检索过程。分析用户的信息的需求分析和检索过程。分析用户的信息需求,利用组织好的检索系统,按照信息需求,利用组织好的检索系统,按照系统提供的检索方法和途径检索有关信息,系统提供的检索方法和途径检索有关信息,这是检索系统的应用过程。这是检索系统的应用过程。2.1 信息检索概念及类型2.1.1 信息检索的概念 2. 信息检索的实质 信息检索
5、的实质是将描述用户所需信信息检索的实质是将描述用户所需信息的提问特征,与信息存储的检索标识进息的提问特征,与信息存储的检索标识进行比较,从中找出与提问特征一致或基本行比较,从中找出与提问特征一致或基本一致的信息。一致的信息。 信息检索是对信息集合与需求集合的信息检索是对信息集合与需求集合的匹配与选择。匹配与选择。2.1 信息检索概念及类型2.1.1 信息检索的概念 3. 信息检索的作用 1) 1) 避免重复研究或走弯路避免重复研究或走弯路 2) 2) 节省学习者的时间节省学习者的时间 3) 3) 是获取新知识的捷径是获取新知识的捷径 2.1 信息检索概念及类型2.1.1 信息检索的概念 4.
6、信息存储与信息检索的关系 信息存储与信息检索是密不可分的两信息存储与信息检索是密不可分的两个过程,同时又是互逆的。存储是为了检个过程,同时又是互逆的。存储是为了检索,而检索必须先要存储。没有存储检索索,而检索必须先要存储。没有存储检索就无从谈起。这是存储与检索相辅相成、就无从谈起。这是存储与检索相辅相成、相互依存的辩证关系。相互依存的辩证关系。 2.1 信息检索概念及类型2.1.1 信息检索的概念 4. 信息存储与信息检索的关系 2.1 信息检索概念及类型2.1.2 信息检索的类型 1. 按检索方式分 1) 手工检索 手工检索简称手工检索简称“手检手检”,是指人,是指人们通过手工的方式检索信息
7、,其使用们通过手工的方式检索信息,其使用的检索工具主要是书本型、卡片式的的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各信息系统,即目录、索引、文摘和各类工具书。检索过程是由人工以手工类工具书。检索过程是由人工以手工的方式完成的。的方式完成的。2.1 信息检索概念及类型2.1.2 信息检索的类型 1. 按检索方式分 2) 计算机检索 计算机检索简称计算机检索简称“机捡机捡”,是指,是指人们利用数据库、计算机软件技术、人们利用数据库、计算机软件技术、计算机网络及通信系统进行的信息检计算机网络及通信系统进行的信息检索,其检索过程是在人机的协同作用索,其检索过程是在人机的协同作用下完
8、成的。下完成的。2.1 信息检索概念及类型2.1.2 信息检索的类型 1. 按检索方式分 3) 综合检索 在文献信息检索的过程中,既使在文献信息检索的过程中,既使用手工检索方式,又使用计算机检索用手工检索方式,又使用计算机检索方式,也就是同时使用两种检索方式。方式,也就是同时使用两种检索方式。2.1 信息检索概念及类型2.1.2 信息检索的类型 2. 按检索内容或检索目标分 1) 文献型信息检索 文献型信息检索是指利用检索工具或文献型信息检索是指利用检索工具或检索系统查找文献的过程,包括文献线索检索系统查找文献的过程,包括文献线索检索和文献全文检索。检索和文献全文检索。 文献线索检索是指利用检
9、索工具或检文献线索检索是指利用检索工具或检索系统查找文献的出处,检索结果是文献索系统查找文献的出处,检索结果是文献线索。线索。 文献全文检索是以文献所含的全部信文献全文检索是以文献所含的全部信息作为检索内容,即检索系统存储的是整息作为检索内容,即检索系统存储的是整篇文章或整部图书的全部内容。文献全文篇文章或整部图书的全部内容。文献全文检索是当前计算机信息检索的发展方向之检索是当前计算机信息检索的发展方向之一。一。2.1 信息检索概念及类型2.1.2 信息检索的类型 2. 按检索内容或检索目标分 2) 事实型信息检索 事实型信息检索是以特定客观事实为事实型信息检索是以特定客观事实为检索对象,借助
10、于提供事实检索的检索工检索对象,借助于提供事实检索的检索工具与数据库进行捡索。其检索结果为基本具与数据库进行捡索。其检索结果为基本事实。如某个字、词的查找,某一诗词文事实。如某个字、词的查找,某一诗词文句的查找,某一年、月、日的查找,某一句的查找,某一年、月、日的查找,某一地名的查找,某一人物的查找,某一机构地名的查找,某一人物的查找,某一机构的查找某一事件的查找,某一法规制度的查找某一事件的查找,某一法规制度的查找,某一图像的查找,某一数据、参的查找,某一图像的查找,某一数据、参数、公式或化学分子式的查找等。数、公式或化学分子式的查找等。 2.1 信息检索概念及类型2.1.2 信息检索的类型
11、 2. 按检索内容或检索目标分 3) 数据型信息检索 数据型信息检索是一种确定性检索,数据型信息检索是一种确定性检索,是以数值或图表形式表示的数据为检索对是以数值或图表形式表示的数据为检索对象的信息检索,又称象的信息检索,又称“数值检索数值检索”。检索。检索系统中存储的是大量的数据,这些数据既系统中存储的是大量的数据,这些数据既包括物质的各种参数、电话号码、银行账包括物质的各种参数、电话号码、银行账号、观测数据、统计数据等数字数据,也号、观测数据、统计数据等数字数据,也包括图表、图谱、市场行情、化学分子式、包括图表、图谱、市场行情、化学分子式、物质的各种特性等非数字数据。物质的各种特性等非数字
12、数据。2.1 信息检索概念及类型2.1.2 信息检索的类型 3. 按系统中信息的组织方式分 1) 全文检索 指检索系统中存储的是整篇文章乃至指检索系统中存储的是整篇文章乃至整本图书。用户根据个人的需求从中获取整本图书。用户根据个人的需求从中获取有关的章、节、段、句等信息,并且还可有关的章、节、段、句等信息,并且还可以做各种统计和分析。以做各种统计和分析。2.1 信息检索概念及类型2.1.2 信息检索的类型 3. 按系统中信息的组织方式分 2) 超文本检索 超文本结构类似于人类的联想记忆结超文本结构类似于人类的联想记忆结构,它采用了一种非线性的网状结构组织构,它采用了一种非线性的网状结构组织块状
13、信息,没有固定的顺序也不要求读块状信息,没有固定的顺序也不要求读者必须按照某个顺序来阅读。采用这种网者必须按照某个顺序来阅读。采用这种网状结构,各信息块很容易按照信息的原始状结构,各信息块很容易按照信息的原始结构或人们的结构或人们的“联想联想”关系加以组织。关系加以组织。2.1 信息检索概念及类型2.1.2 信息检索的类型 3. 按系统中信息的组织方式分 3) 超媒体检索 由于把多媒体信息引入超文本里产由于把多媒体信息引入超文本里产生了多媒体超文本,也即超媒体。它是对生了多媒体超文本,也即超媒体。它是对超文本检索的补充,其存储对象超出了文超文本检索的补充,其存储对象超出了文本范畴,融入了静态、
14、动态图像及声音等本范畴,融入了静态、动态图像及声音等多媒体信息。信息存储结构从单维发展到多媒体信息。信息存储结构从单维发展到多维,存储空间范围不断扩大。多维,存储空间范围不断扩大。2.2 检索途径与检索语言2.2.1 检索途径 1. 以文献的外部特征为检索途径 1) 题名途径 文献题名是指文献的名称,如图书的文献题名是指文献的名称,如图书的书名、期刊的刊名、报纸的报纸名称、光书名、期刊的刊名、报纸的报纸名称、光盘的光盘名称等。它是认识一篇文献的起盘的光盘名称等。它是认识一篇文献的起点。通过题名途径可查找图书、期刊、单点。通过题名途径可查找图书、期刊、单篇文献。检索工具中的书名索引、会议名篇文献
15、。检索工具中的书名索引、会议名称索引、书目索引、刊名索引等都提供了称索引、书目索引、刊名索引等都提供了从题名进行文献检索的途径。从题名进行文献检索的途径。2.2 检索途径与检索语言2.2.1 检索途径 1. 以文献的外部特征为检索途径 2) 著者途径 文献著者是指对文献内容负有责任的文献著者是指对文献内容负有责任的个人或机关团体,也就是我们常说的作者、个人或机关团体,也就是我们常说的作者、编者、译者等。著者途径也是人们检索文编者、译者等。著者途径也是人们检索文献经常使用的一条途径,包含个人著者、献经常使用的一条途径,包含个人著者、团体著者、专利发明人、专利权人、合同团体著者、专利发明人、专利权
16、人、合同户、学术会议主办单位等。利用责任者途户、学术会议主办单位等。利用责任者途径检索文献,主要利用的是作者索引、作径检索文献,主要利用的是作者索引、作者目录、个人作者索引、团体作者索引、者目录、个人作者索引、团体作者索引、专利权人索引等。专利权人索引等。2.2 检索途径与检索语言2.2.1 检索途径 1. 以文献的外部特征为检索途径 3) 代码途径 很多文献因其本身特点有特定序号,很多文献因其本身特点有特定序号,如科技报告号、专利号、标准号、信息收如科技报告号、专利号、标准号、信息收藏单位的入藏号、藏单位的入藏号、ISBNISBN、ISSNISSN等。代码途等。代码途径就是依据文献信息出版时
17、所编的代码顺径就是依据文献信息出版时所编的代码顺序来检索文献信息的途径。这些序号往往序来检索文献信息的途径。这些序号往往具有唯一性,可以据此识别特定的文献信具有唯一性,可以据此识别特定的文献信息。依据这些序号数字顺序可编制序号索息。依据这些序号数字顺序可编制序号索引,提供序号检索途径。同时,许多检索引,提供序号检索途径。同时,许多检索系统利用事物本身具有的某种符号代码编系统利用事物本身具有的某种符号代码编制成分子式、元素符号、结构式等索引,制成分子式、元素符号、结构式等索引,提供从特定符号代码顺序进行检索的途径,提供从特定符号代码顺序进行检索的途径,如化合物索引。如化合物索引。2.2 检索途径
18、与检索语言2.2.1 检索途径 2. 以文献的内容特征为检索途径 1) 分类途径 分类途径是以课题的学科属性为出发点,分类途径是以课题的学科属性为出发点,按学科分类体系来查找文献信息,以分类按学科分类体系来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、作为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来分类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献查找有关某一学科或相关学科领域的文献信息。它能满足族性检索的需求。信息。它能满足族性检索的需求。 2.2 检索途径与检索语言2.2.1 检索途径 2. 以文献的内容特征为检索途径 2) 主题
19、途径 主题途径是利用信息的主题内容进行检主题途径是利用信息的主题内容进行检索的途径,即利用从自然语言中抽象出来索的途径,即利用从自然语言中抽象出来的,或者经过人工规范化的、能够代表信的,或者经过人工规范化的、能够代表信息内容的标引词来检索。它冲破了按学科息内容的标引词来检索。它冲破了按学科分类的束缚,使分散在各个学科领域里的分类的束缚,使分散在各个学科领域里的有关同一课题的信息集中于同一主题,使有关同一课题的信息集中于同一主题,使用时就如同查字典一样方便和快捷。其最用时就如同查字典一样方便和快捷。其最大优点是把同性质的事物集中于一处,使大优点是把同性质的事物集中于一处,使用户在检索时便于选取,
20、而且将同类事物用户在检索时便于选取,而且将同类事物集中在一起的方法符合人们的工作和生活集中在一起的方法符合人们的工作和生活习惯,直接而准确。习惯,直接而准确。 2.2 检索途径与检索语言2.2.2 检索语言 1. 检索语言的含义 检索语言是根据信息检索的需要而创检索语言是根据信息检索的需要而创造的专供信息存储和信息检索使用的一种造的专供信息存储和信息检索使用的一种人工语言。人工语言。 检索语言是在文献信息检索过程中使检索语言是在文献信息检索过程中使用的特定语言形式,它的作用在于促成信用的特定语言形式,它的作用在于促成信息检索系统与检索用户的沟通。息检索系统与检索用户的沟通。 2.2 检索途径与
21、检索语言2.2.2 检索语言 2. 检索语言的类型 1)描述文献外部特征的语言 (1 1)题名语言)题名语言 (2 2)著者语言)著者语言 (3 3)代码语言)代码语言 2.2 检索途径与检索语言2.2.2 检索语言 2. 检索语言的类型 2)描述文献内容特征的语言 (1 1)分类语言)分类语言 所谓所谓“类类”是指具有共同属性的事物是指具有共同属性的事物的集合。每一种事物都有多种属性,用其的集合。每一种事物都有多种属性,用其某一种属性作为划分依据来对一事物进行某一种属性作为划分依据来对一事物进行划分就称为分类。分类是人类逻辑思维的划分就称为分类。分类是人类逻辑思维的一种最基本的形式。分类语言
22、是用分类号一种最基本的形式。分类语言是用分类号表达学科体系的各种概念,将各种概念按表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。学科性质进行分类和系统排列。2.2 检索途径与检索语言2.2.2 检索语言 2. 检索语言的类型 2)描述文献内容特征的语言 (2 2)主题语言)主题语言 主题主题“是一组具有共性事物的总称,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和用以表达文献所论述和研究的具体对象和问题问题”,即文献的,即文献的“中心内容中心内容”。每种文。每种文献都包含着若干主题,研究或阐述一个或献都包含着若干主题,研究或阐述一个或多个问题。主题词就是表达主
23、题概念的词多个问题。主题词就是表达主题概念的词汇。汇。 2.3 检索系统与检索方法2.3.1 检索系统 1. 检索系统的概念 信息检索系统是为满足信息用户的检信息检索系统是为满足信息用户的检索需求而建立起来的、以提供信息检索为索需求而建立起来的、以提供信息检索为目的的信息存储与检索系统。目的的信息存储与检索系统。 可以说,一个信息检索系统便是一定可以说,一个信息检索系统便是一定范围文献、信息的全部记录的有序集合。范围文献、信息的全部记录的有序集合。2.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (1) (1) 按加工手段和技术设备的不同,按加工手段和技术设备的不同,可将检
24、索系统分为:手工检索系统、机械可将检索系统分为:手工检索系统、机械检索系统、计算机检索系统。检索系统、计算机检索系统。2.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (2) (2) 按载体形式不同,可分为卡片式、按载体形式不同,可分为卡片式、书本式、缩微式、磁性材料式等检索系统。书本式、缩微式、磁性材料式等检索系统。2.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (3) (3) 按著录格式不同,可将检索系统按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索分为目录、题录、文摘、索引、全文检索系统。系统。目录检索系统目录检索系统目录检索系
25、统是对一些相关的文献,主要目录检索系统是对一些相关的文献,主要是单位出版物,如图书、期刊等,加以整是单位出版物,如图书、期刊等,加以整理、分编,并按一定顺序组织起来形成的理、分编,并按一定顺序组织起来形成的一种检索系统,主要记录这些出版物的出一种检索系统,主要记录这些出版物的出版单位、收藏单位及其他外部特征。版单位、收藏单位及其他外部特征。 2.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (3) (3) 按著录格式不同,可将检索系统按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索分为目录、题录、文摘、索引、全文检索系统。系统。题录型检索系统题录型检索系统题
26、录型检索系统是以单篇文献为基本著录单位,将题录型检索系统是以单篇文献为基本著录单位,将书刊、会议录等出版物中大量相关的单篇文献选出,书刊、会议录等出版物中大量相关的单篇文献选出,对文献的外部特征,如文献题名、著者姓名、文献对文献的外部特征,如文献题名、著者姓名、文献出处等加以描述,并按一定的顺序编排起来提供文出处等加以描述,并按一定的顺序编排起来提供文献线索的检索系统,不收录内容摘要,一般用于快献线索的检索系统,不收录内容摘要,一般用于快速报道文献信息。速报道文献信息。2.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (3) (3) 按著录格式不同,可将检索系统按著录格式不
27、同,可将检索系统分为目录、题录、文摘、索引、全文检索分为目录、题录、文摘、索引、全文检索系统。系统。文摘型检索系统文摘型检索系统文摘型检索系统是在文献题录基础上,加上文献篇文摘型检索系统是在文献题录基础上,加上文献篇首的摘要,或由标引人员以简练、准确的语言将文首的摘要,或由标引人员以简练、准确的语言将文献信息的研究目的与方法、主题思想与基本观点、献信息的研究目的与方法、主题思想与基本观点、框架结构、实验结果与结论等摘录下来形成文摘,框架结构、实验结果与结论等摘录下来形成文摘,并按一定的方法著录、标引、组织起来的检索系统。并按一定的方法著录、标引、组织起来的检索系统。2.3 检索系统与检索方法2
28、.3.1 检索系统 2. 检索系统的类型 (3) (3) 按著录格式不同,可将检索系统按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索分为目录、题录、文摘、索引、全文检索系统。系统。索引型检索系统索引型检索系统索引型检索系统是将收录范围内的文献中索引型检索系统是将收录范围内的文献中的题名、主题、人名、地名等名词术语以的题名、主题、人名、地名等名词术语以及其他有关款目抽出,注明出处,并按一及其他有关款目抽出,注明出处,并按一定的排检方式组织而成的一种检索系统。定的排检方式组织而成的一种检索系统。与目录相比,它有利于人们进行更深入的与目录相比,它有利于人们进行更深入的检索。检索。2
29、.3 检索系统与检索方法2.3.1 检索系统 2. 检索系统的类型 (3) (3) 按著录格式不同,可将检索系统按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索分为目录、题录、文摘、索引、全文检索系统。系统。全文检索系统全文检索系统全文检索系统是在题录或文摘的基础上,加上完整全文检索系统是在题录或文摘的基础上,加上完整出版物的全部内容,按一定的方法著录、标引、组出版物的全部内容,按一定的方法著录、标引、组织起来的检索系统。这种检索系统往往对文献全文织起来的检索系统。这种检索系统往往对文献全文中的词、词组及其位置等做更深入的加工、处理,中的词、词组及其位置等做更深入的加工、处理,
30、一般采用自然语言进行自动标引,不仅方便人们一一般采用自然语言进行自动标引,不仅方便人们一次性获取文献全文,而且提供更多的检索途径。次性获取文献全文,而且提供更多的检索途径。2.3 检索系统与检索方法2.3.2 检索方法 1. 常用法 常用法是利用检索工具查找信息的一常用法是利用检索工具查找信息的一种方法,因为这种方法是目前查找信息中种方法,因为这种方法是目前查找信息中最常使用的,故亦称常用法。最常使用的,故亦称常用法。 (1) (1) 顺查法顺查法 (2) (2) 倒查法倒查法 (3) (3) 抽查法抽查法 2.3 检索系统与检索方法2.3.2 检索方法 1. 常用法 (1) (1) 顺查法顺
31、查法 是指按年代由远及近的顺序进行查找是指按年代由远及近的顺序进行查找的方法,如检索的方法,如检索“电视文化电视文化”这一课题,这一课题,首先要弄清起始时间,即首先要弄清起始时间,即“电视文化电视文化”产产生的时间是哪一年,然后从这一年开始查生的时间是哪一年,然后从这一年开始查起,一直查到当前起,一直查到当前“电视文化电视文化”方面的相方面的相关信息为止。这样,关信息为止。这样,“电视文化电视文化”课题就课题就检索完毕。这种方法的查全率和查准率都检索完毕。这种方法的查全率和查准率都较高,但是检索整个课题较费时费力。较高,但是检索整个课题较费时费力。2.3 检索系统与检索方法2.3.2 检索方法
32、 1. 常用法 (2) (2) 倒查法倒查法 是指按年代由近及远的逆时间查找方法,是指按年代由近及远的逆时间查找方法,这种方法多用于新课题、新观点、新理论、这种方法多用于新课题、新观点、新理论、新技术的检索,检索的重点在近期信息上,新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。使用这种只需查到基本满足需要时为止。使用这种方法可以最快地获得新资料,而且近期资方法可以最快地获得新资料,而且近期资料总是既概括、引用前期的成果,又反映料总是既概括、引用前期的成果,又反映最新的水平和动向,因此这种方法比较省最新的水平和动向,因此这种方法比较省力,但查全率不高。力,但查全率不高。2.3
33、 检索系统与检索方法2.3.2 检索方法 1. 常用法 (3) (3) 抽查法抽查法 是一种针对学科发展特点,抓住该学科是一种针对学科发展特点,抓住该学科发展迅速、信息发表较多的年代发展迅速、信息发表较多的年代( (信息的高信息的高峰期峰期) ),抽出一段时间,抽出一段时间( (几年或十几年几年或十几年) ),再,再进行逐年检索的方法。这种方法费时较少,进行逐年检索的方法。这种方法费时较少,获得信息较多,检索效率较高。但是这种获得信息较多,检索效率较高。但是这种方法的成功率和有效率必须建立在熟悉学方法的成功率和有效率必须建立在熟悉学科发展特点的基础上。也就是说,只有对科发展特点的基础上。也就是
34、说,只有对该学科或课题的发展熟悉的情况下,才适该学科或课题的发展熟悉的情况下,才适合使用。合使用。2.3 检索系统与检索方法2.3.2 检索方法 2. 追溯法 追溯法是一种跟踪查找的方法,即以追溯法是一种跟踪查找的方法,即以文献后面所附的参考文献为线索,逐一追文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。溯查找相关文献的方法。2.3 检索系统与检索方法2.3.2 检索方法 3. 循环法 循环法是常用法和追溯法的结合,检循环法是常用法和追溯法的结合,检索时,先利用检索工具查出一批文献,然索时,先利用检索工具查出一批文献,然后选择出与检索课题针对性较强的文献,后选择出与检索课题针对性较
35、强的文献,再按文献后所附的参考文献回溯查找,不再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,断扩大检索线索,分期分段地交替进行,循环下去,直到满意为止。循环下去,直到满意为止。2.3 检索系统与检索方法2.3.2 检索方法 4. 检索方法的选择原则 (1) (1) 检索条件检索条件 (2) (2) 检索要求检索要求 (3) (3) 学科特点学科特点 2.4 检索技术与检索效果2.4.1 常用检索技术 1. 布尔逻辑检索 1) 逻辑与“AND” 逻辑与(逻辑与(ANDAND或或“”)是反映概念之)是反映概念之间交叉和限定关系的一种组配方式,用以间交叉和限定关系的一种组配
36、方式,用以缩小检索范围,减少输出结果,提高查准缩小检索范围,减少输出结果,提高查准率。率。 A AND B A AND B表示同时含有表示同时含有A A、B B两检索两检索项的才为检索结果项的才为检索结果 2.4 检索技术与检索效果2.4.1 常用检索技术 1. 布尔逻辑检索 2) 逻辑或“OR” 逻辑或(逻辑或(OROR或或“+”+”)是反映概念之间)是反映概念之间并列关系的一种组配方式,使用它相当于并列关系的一种组配方式,使用它相当于增加检索词主题的同义词与近义词,可扩增加检索词主题的同义词与近义词,可扩大检索范围、增加输出结果,提高查全率。大检索范围、增加输出结果,提高查全率。 A OR
37、 B A OR B表示文献信息中凡含有检索表示文献信息中凡含有检索词词A A或者检索词或者检索词B B或者同时含有检索词或者同时含有检索词A A和和B B的即为命中结果的即为命中结果 2.4 检索技术与检索效果2.4.1 常用检索技术 1. 布尔逻辑检索 3) 逻辑非“NOT” 逻辑非(逻辑非(NOTNOT或或“”)可以用来排除)可以用来排除不希望出现的检索词,它与逻辑与不希望出现的检索词,它与逻辑与“AND”AND”的作用类似,能够缩小命中信息的范围,的作用类似,能够缩小命中信息的范围,提高检索的查准率。提高检索的查准率。 A NOT B A NOT B用于从包含用于从包含A A的文献信息范
38、的文献信息范围中减去含有围中减去含有B B的内容的内容2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 1) 从截断字符的数量看 (1) (1) 无限截词无限截词 (2) (2) 有限截词有限截词2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 1) 从截断字符的数量看 (1) (1) 无限截词无限截词常用表示符号为常用表示符号为“* *”“”“/”“?”/”“?”,一个无,一个无限截词符可代表多个字符,表示在检索词限截词符可代表多个字符,表示在检索词的词干后可加任意个字符或不加字符,常的词干后可加任意个字符或不加字符,常用于检索同一类词。用于检索同一类词。
39、如使用如使用“employ?”employ?”,可检索到:,可检索到:employemploy,employeremployer,employersemployers,employmentemployment等词。等词。2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 1) 从截断字符的数量看 (2) (2) 有限截词有限截词一个有限截词符只代表一个字符。常用符一个有限截词符只代表一个字符。常用符号号“?”?”表示,代表这个单词中的某个字母表示,代表这个单词中的某个字母可以任意变化,在检索词词干后可加一个可以任意变化,在检索词词干后可加一个或一个以上的有限截词符,一般有限截词
40、或一个以上的有限截词符,一般有限截词符的数量有限制,其数目表示在词干后最符的数量有限制,其数目表示在词干后最多允许变化的字符个数多允许变化的字符个数如如“solut?”solut?”可检索到包含可检索到包含solutionsolution、solutesolute和和solutingsoluting等词在内的信息。等词在内的信息。2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 2) 根据截断的位置 (1) (1) 后截词后截词 (2) (2) 前截词前截词 (3) (3) 中截词中截词2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 2) 根据截断的位置
41、(1) (1) 后截词后截词后截词最常用,即将截词放在一个字符串后截词最常用,即将截词放在一个字符串之后,用以表示后面有限或无限个字符不之后,用以表示后面有限或无限个字符不影响其前面检索字符串的检索结果。影响其前面检索字符串的检索结果。如:如:physicphysic* *,可检出的词汇有:,可检出的词汇有:physicphysic、physicalphysical、physicianphysician、physicistphysicist、physicsphysics等。等。2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 2) 根据截断的位置 (2) (2) 前截词前截词
42、 前截词将截词符号置于一个字符串的前截词将截词符号置于一个字符串的前方,以表示其前方有限或无限个字符不前方,以表示其前方有限或无限个字符不会影响后面检索字符串的检索结果。会影响后面检索字符串的检索结果。2.4 检索技术与检索效果2.4.1 常用检索技术 2. 截词检索 2) 根据截断的位置 (3) (3) 中截词中截词 又称中间屏蔽,指将检索字符置于一又称中间屏蔽,指将检索字符置于一个检索词中间,不影响前后字符串的检索个检索词中间,不影响前后字符串的检索结果。具体地说,就是在一串字符中插入结果。具体地说,就是在一串字符中插入一个或几个屏蔽符号一个或几个屏蔽符号“?”?”或或“!”!”,表示,表
43、示在问号的相应位置上可转换数目相当的字在问号的相应位置上可转换数目相当的字符。符。2.4 检索技术与检索效果2.4.1 常用检索技术 3. 限制检索 1) 检索系统中的限制检索 在检索系统中,使用缩小和限定检索在检索系统中,使用缩小和限定检索范围的方法称为限制检索。限定检索条件范围的方法称为限制检索。限定检索条件多种多样,主要和常用的是字段限制。多种多样,主要和常用的是字段限制。 其中,主题字段如题名(其中,主题字段如题名(TitleTitle)、叙)、叙词(词(DescriptorDescriptor)、标识词)、标识词(IdentifierIdentifier)、文摘()、文摘(Abstr
44、actAbstract)等;)等;非主题字段如作者(非主题字段如作者(AuthorAuthor)、文献类型)、文献类型(Document TypeDocument Type)、语种()、语种(LanguageLanguage)、)、出版年份(出版年份(Publication YearPublication Year)等。)等。 2.4 检索技术与检索效果2.4.1 常用检索技术 3. 限制检索 2) 搜索引擎中的限制检索 搜索引擎中的字段检索多表现为前缀搜索引擎中的字段检索多表现为前缀符限制形式,其中,表示内容特征的主题符限制形式,其中,表示内容特征的主题字段有字段有TitleTitle,Ke
45、ywordsKeywords,SubjectSubject,SummarySummary等;表示外部特征的非主题字段限等;表示外部特征的非主题字段限制有制有imageimage,texttext,appletapplet等;此外,搜索等;此外,搜索引擎还提供了带有典型网络检索特征的字引擎还提供了带有典型网络检索特征的字段限制类型。段限制类型。 2.4 检索技术与检索效果2.4.1 常用检索技术 4. 位置检索 位置算符用于表示词与词之间的相互位置算符用于表示词与词之间的相互关系和前后的次序,通过对检索词之间位关系和前后的次序,通过对检索词之间位置关系的限定,进一步增强选词指令的灵置关系的限定,
46、进一步增强选词指令的灵活性,提高检索的查全率与查准率。活性,提高检索的查全率与查准率。 (1) W (1) W算符(算符(WithWith) (2) N (2) N算符(算符(NearNear) (3) F (3) F算符(算符(FieldField) (4) S (4) S算符(算符(SubfieldSubfield) 2.4 检索技术与检索效果2.4.1 常用检索技术 4. 位置检索 (1) W(1) W算符(算符(WithWith) 通常写作通常写作A A(nWnW)B B,表示词,表示词A A与词与词B B之间至多可以插入之间至多可以插入n n个其他的词(往往个其他的词(往往包括系统禁
47、用词),同时包括系统禁用词),同时A A、B B保持前保持前后顺序不变。后顺序不变。2.4 检索技术与检索效果2.4.1 常用检索技术 4. 位置检索 (2) N(2) N算符(算符(NearNear) 通常写作通常写作A A(nNnN)B B,表示,表示A A与与B B之间之间至多可以插入至多可以插入n n个其他的词,同时个其他的词,同时A A、B B不必保持前后顺序。不必保持前后顺序。 2.4 检索技术与检索效果2.4.1 常用检索技术 4. 位置检索 (3) F(3) F算符(算符(FieldField) 通常写作通常写作A A(F F)B B,表示,表示A A、B B必须必须同时出现在
48、记录的同一字段中,如出同时出现在记录的同一字段中,如出现在篇名字段中,两词次序、现在篇名字段中,两词次序、A A与与B B间间加词个数不限。加词个数不限。 2.4 检索技术与检索效果2.4.1 常用检索技术 4. 位置检索 (4) S(4) S算符(算符(SubfieldSubfield) 通常写作通常写作A A(S S)B B,表示,表示A A与与B B必须必须同时在一个句子中或同一子字段内出同时在一个句子中或同一子字段内出现,但次序可随意变化,且各词间可现,但次序可随意变化,且各词间可加任意个词。加任意个词。 2.4 检索技术与检索效果2.4.1 常用检索技术 5. 多媒体检索 基于内容的
49、多媒体信息检索是指根基于内容的多媒体信息检索是指根据媒体和媒体对象的内容及上下文联系据媒体和媒体对象的内容及上下文联系在大规模多媒体数据库中进行检索。它在大规模多媒体数据库中进行检索。它的研究目标是提供在没有人类参与的情的研究目标是提供在没有人类参与的情况下能自动识别或理解声音、图像、视况下能自动识别或理解声音、图像、视频重要特征的算法。频重要特征的算法。2.4 检索技术与检索效果2.4.1 常用检索技术 6. 超文本检索 超文本检索时其内容排列是非线性的,超文本检索时其内容排列是非线性的,按照知识(信息)单元及其关系建立起知按照知识(信息)单元及其关系建立起知识结构网络,操作时用鼠标去点击相
50、关的识结构网络,操作时用鼠标去点击相关的知识单元,检索便可追踪下去,进入下面知识单元,检索便可追踪下去,进入下面各层菜单。各层菜单。2.4 检索技术与检索效果2.4.2 检索效果 1. 检索效果评价 1) 检索效果评价的指标 检索效果是指检索系统检索信息的有检索效果是指检索系统检索信息的有效程度,反映了检索系统的检索能力。效程度,反映了检索系统的检索能力。 (1) (1) 质量标准质量标准 (2) (2) 费用标准费用标准 (3) (3) 时间标准时间标准2.4 检索技术与检索效果2.4.2 检索效果 1. 检索效果评价 1) 检索效果评价的指标表2.2 检索效果评价22表 2.4 检索技术与
51、检索效果2.4.2 检索效果 1. 检索效果评价 2) 查全率和查准率 (1) 查全率 查全率是指检索出的相关信息量与系统查全率是指检索出的相关信息量与系统中的相关信息总量之比。中的相关信息总量之比。2.4 检索技术与检索效果2.4.2 检索效果 1. 检索效果评价 2) 查全率和查准率 (2) 查准率 查准率是指检索出的相关信息量与检索查准率是指检索出的相关信息量与检索出的信息总量之比。出的信息总量之比。2.4 检索技术与检索效果2.4.2 检索效果 2. 检索效果优化 (1) (1) 提高检索系统的质量提高检索系统的质量 (2) (2) 提高用户利用检索系统的能力提高用户利用检索系统的能力
52、 (3) (3) 制定优化的检索策略制定优化的检索策略 2.4 检索技术与检索效果2.4.2 检索效果 2. 检索效果优化 (3) (3) 制定优化的检索策略制定优化的检索策略 提高查全率的方法提高查全率的方法 为了提高查全率,往往通过采用提高为了提高查全率,往往通过采用提高检索词的泛指度,选全同义词、近义词,检索词的泛指度,选全同义词、近义词,多用截词符;减少使用逻辑多用截词符;减少使用逻辑“与与”、逻辑、逻辑“非非”运算符,增加使用逻辑运算符,增加使用逻辑“或或”运算运算符;取消某些限制符,在多字段或全文中符;取消某些限制符,在多字段或全文中检索;采用分类号检索等多种方法。检索;采用分类号检索等多种方法。 2.4 检索技术
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026上海银清企业服务有限公司招聘参考考试题库及答案解析
- 2026四川成都市双流区川大江安小学教师招聘11人参考笔试题库附答案解析
- 幼儿园校园风景摄影大赛方案摄影活动
- 2025甘肃兰州新区石化产业投资集团有限公司法务专干、造价工程师、会计岗位招聘6人备考笔试题库及答案解析
- 2026西藏民族大学急需紧缺人才引进2人备考考试试题及答案解析
- 深度解析(2026)《GBT 25936.4-2024橡胶塑料粉碎机械 第4部分团粒机安全要求》(2026年)深度解析
- 深度解析(2026)《GBT 25907.3-2010信息技术 维吾尔文、哈萨克文、柯尔克孜文编码字符集 16点阵字型 第3部分:库非白体》
- 2026年威海乳山市民兵训练基地公开招聘事业单位工作人员(1名)参考考试题库及答案解析
- 痛风抗炎症治疗指南(2025 版)解读
- 2025江苏盐城市交通运输局直属事业单位选调1人参考考试试题及答案解析
- 中国近现代史纲要知到章节答案智慧树2023年湖南城市学院
- 钢管表面积计算表
- 木工培训考试及答案
- (中职)Photoshop基础实用教程全册教案2022-2023学年
- 项目经理答辩题库题
- 抗菌药物使用分级授权表
- JJF 1851-2020α谱仪校准规范
- GB/T 7441-2008汽轮机及被驱动机械发出的空间噪声的测量
- 衰弱量表(FARIL)及预防措施
- 全球化视角的国际投资-课件
- 浙江省金华市各县区乡镇行政村村庄村名居民村民委员会明细
评论
0/150
提交评论