版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索基础理论1信息检索基础理论1本章要点信息检索的基本原理查全率查准率信息检索的相关性问题检索系统的评价检索系统/工具的结构及工作原理2本章要点信息检索的基本原理查全率查准率信息检索的相关性问题检信息检索的基本原理信息集合匹配与选择特征化表示特征化表示需求集合课本P123信息检索的基本原理信息集合匹配与选择特征化特征化需求集合课本存储:信息源→标引→标识
检索系统→检索4存储:信息源→标引→标识
检索系统→检索4计算机信息检索原理
示意图5计算机信息检索原理
示意图5存储检索原始文献加工整理数据库提问检索输出6存储检索原始文献加工整理数据库提问检索输出6检索提问式信息的选择与收集信息特征标识语言检索工具匹配检索结果信息源用户信息需求检索提问数据库7检索信息信息标检索工具检信用信检索数据库7
1.文献信息检索系统及检索语言
1.1文献信息检索系统是具有吸收信息、加工信息、存储信息和检索信息的服务工作系统
分为手工检索系统和计算机检索系统。
8
1.文献信息检索系统及检索语言
1.11.2文献信息检索的原理
是通过对大量分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。存储过程--对文献进行标引检索过程--根据需求,确定提问式存储是为了检索,检索又必须先进行存储。91.2文献信息检索的原理92.检索语言=标引语言2.1概念
检索语言(Retrievallanguage)是用来描述文献特征和表达检索提问的一种专门人工语言。检索效率的高低,在很大程度上取决于所采用的检索语言的质量以及对它的使用是否正确。检索语言是根据文献存贮与检索的需要,在自然语言的基础上规范化了的一种人工语言(又称为情报语言、标引语言、索引语言等)。它贯穿于文献贮存和检索的全过程,是检索系统的重要组成部分,是沟通文献贮存和检索两个过程及标引人员与检索人员双方思想的桥梁。检索语言和自然语言一样,具有表达客观事物的能力,但二者又有本质的差别。检索语言是经规范化了的语言,消除了自然语言中存在的多义、同义等影响检索效果的因素,在事物概念的表达上具有唯一性,从而保证了文献标引和检索的准确性。102.检索语言=标引语言2.1概念10信息检索语言的作用?
检索系统的语言基础,沟通信息存储与信息检索两个过程的桥梁。信息存储信息检索11信息检索语言的作用? 检索系统的语言基础,信息存储信息检索2.2构成:2.2.1外部特征:题名、著者、机构、出版者、文献号、文献出处2.2.2内容特征:A·分类语言B·主题语言a.标题词b.元词c.叙词d.关键词122.2构成:12检索语言
描述文献内容特征的语言
描述文献外表特征的语言分类语言主题语言代码语言书/刊/篇名著者姓名
引文代码/序号单元词语言关键词语言叙词语言标题词语言13检索语言描述文献内描述文献外分类语言主题语言代码语言主题词:用以表达文献所论述和研究的具体对象和问题,即文献的“内容”的词或词组。标题词:独立定型,经过规范化处理的可直接表达主题内容的词。单元词:经过规范化处理的可直接表达主题最小、最基本的词。叙词:优选出来,严密控制的主题词和词组。关键词:从文献题名、文摘和正文中抽出,只作极少量规范化处理具有实际意义的词。14主题词:用以表达文献所论述和研究的具体对象和问题,即文献的“在社科文献信息检索系统中,常用的是分类检索语言和主题检索语言,如《中图法》和《汉语主题词表》。为了发挥它们各自的优势,扬长避短,以满足不同的检索需要,人们将分类语言和主题语言加以结合,从而形成一种新型的检索语言,即分类主题一体化检索语言。如《中国分类主题词表》随着计算机检索技术的发展,直接来自文献本身、未经规范化处理的自然语言以其标引检索简便快捷又受到人们的广泛关注。分类主题一体化语言和自然语言代表了未来检索语言的发展方向。15在社科文献信息检索系统中,常用的是分类检索语言和主题检索词是检索语言的基本成分。检索词按语言的受控情况分为:自然语言和人工语言(1)自然语言:采用未加工整理和规范过的词语,即关键词,故又称关键词语言(2)人工语言:采用经过规范化的词和特定的词汇来专指或网罗相应的概念,能较好地规范同义词、近义词、多义词等,如标题词、叙词语言如:plane,airplane,aeroplane,aircraft等
信用-信贷,股票交易-股票买卖16检索词是检索语言的基本成分。16
检索词选取时应注意的问题避免冷僻词选择具体的检索词
如“学校活动”这个概念可以用具体的“班级活动”、“课外活动”、“学生活动”等检索词来表示。找出隐性概念
如“智力测试”,隐含着“能力测试”、“态度测试”、“创造力测试”等概念。
使用核心概念
排除掉无关概念组面,包括意义不大的概念和重复概念。
注意同义词近义词及词型变化
如跨国公司的同义词有跨国企业、跨国经营、国际化经营等;17检索词选取时应注意的问题避免冷僻词172.3检索语言的类型2.3.1.根据表述文献的特征划分(1)表述文献外表特征的检索语言:主要为书名(篇名)、著者、机构、序号、引文等。(2)表述文献内容特征的检索语言:主要有分类语言和主题法语言2.3.2按结构原理划分为:分类语言和主题语言(1)体系分类语言:是建立在科学分类体系基础上用分类号表达文献主题概念的检索语言。它运用概念划分与概括的方法,按照知识门类的逻辑次序从抽象到具体,从一般到特殊,从简单到复杂,对知识进行科学划分,从而产生不同级别且存在隶属关系和体现知识登记体系的类目一个类目以不同的符号(分类号)作标识,从而形成了以分类号为标记的体系分类语言。各种图书分类法的分类体系都属于体系分类语言,如《中国图书馆图书分类法》(简称中图法)、《中国科学院图书馆图书分类法》(简称科图法)、《国际十进制图书分类法》等。182.3检索语言的类型2.3.1.根据表述文献的特征划分18分类语言的特点:
优点:系统性强,族性检索,便于按学科、专业直接检索比较广泛的课题。查全率较高。缺点:缺乏专指性,查准率不高,不能满足专深课题以及新兴学科、交叉学科和边缘学科知识的检索。19分类语言的特点:19国内常见的分类法有:《中国图书馆分类法》,简称《中图法》-我国标准图书分类法《中国图书资料分类法》(简称《资料法》)《中国人民大学图书馆图书分类法》《中国科学院图书馆图书分类法》《中图法》将学科划分为5个基本部类,22个基本大类,再进行层层划分,逐级分开。20国内常见的分类法有:20
《中图法》五大部类、二十二个基本大类A、马克思主义、列宁主义N、自然科学总论毛泽东思想、邓小平理论
O、数理科学和化学B、哲学、宗教
P、天文学、地球科学C、社会科学总论Q、生物科学D、政治、法律R、医药、卫生E、军事S、农业科学F、经济T、工业技术G、文化、科学、教育、体育U、交通运输H、语言、文字V、航空、航天I、文学X、环境科学、安全科学J、艺术Z、综合性图书K、历史、地理
21《中图法》五大部类、二十二个基本大类212222R1预防医学、卫生学R2中国医学R3基础医学R4临床医学其中R47是护理;R446是医学检验R5内科学R6外科学R71妇产科学R72儿科学R73肿瘤科学R74神经病学与精神病学R75皮肤病学与性病学R76耳鼻咽喉科学R77眼科学R78口腔科学R79外国民族医学R8特种医学R9药学23R1预防医学、卫生学23分类号名称级别R医药、卫生一级类目R5内科学二级类目R56呼吸系及胸部系统疾病三级类目R563肺疾病四级类目R563.1大叶性肺炎五级类目分类号基本知识介绍:以R563.1为例,它由一个字母和若干个数字构成24分类号名称级别R医药、卫生一级类目R5内科学二级类目R56呼《中图法》类目表等级关系R医药、卫生R1预防医学、卫生学R2中国医学R3基础医学R31医用一般科学R32人体形态学R33人体生理学R331血液与循环生理R332呼吸生理R333消化与吸收一级类目二级类目三级类目四级类目25《中图法》类目表等级关系R医药、卫生R1预防医学、卫生学(2)主题法语言主题语言是一种描述性语言。它用语词直接表达文献的主题,这些语词是表达主题概念的标识。将这些作为标识的语词按字顺排列,并使用参照系统来间接表达各概念产的关系,这就是主题语言。根据语词的选词原则、组配方式和规范方法,主题法语言可分为标题词语言、叙词语言和关键词语言。26(2)主题法语言26主题语言的特点:以文献的主题内容为依据,用词语作为概念标识,并按一定的顺序排列而成的一种检索语言。优点:直观、直接性、专指性强,适用于特性检索及比较适合专深课题的检索,查准率高。缺点:但不能集中同一学科、专业或族性事物的文献。27主题语言的特点:27主题语言分为:
标题词语言关键词语言叙词语言元词语言又称单元词目前使用较多的是叙词语言和关键词语言。28主题语言分为:
标题词语言28关键词语言与规范化主题语言的比较
前者为自然语言,没有词表的约束和复杂规则的限制,检索者可以使用在文献中出现的任何一个有实际意义的词进行检索,所以,比使用受控语言方便得多。后者对同义词、近义词、一词多义、一义多词加以规范统一,显示多种形式的相关关系,因而,查准率和查全率较高。29关键词语言与规范化主题语言的比较
前者为自然语言,没有词表的第二节文献信息检索工具概念:检索工具是将所收录的文献按一定的规则编制而成的具有存贮、检索和报道文献线索功能的工具。它是在一次文献基础上经过加工、整理、编辑形成的二次文献。
根据检索方式的不同,可分为手工检索工具和计算机检索工具。手工检索工具主要指目录、题录、文摘和索引。计算机检索工具主要指利用电子计算机检索系统等。30第二节文献信息检索工具概念:检索工具是将所收录的文献按一、检索工具的作用
存贮作用
检索作用
报道作用
二、检索工具的特点①信息密集,能提供丰富的知识或文献线索;②是编排有序,提供有规律的检索途径;③以查考为主,供读者释义解难时查考之用。31一、检索工具的作用
存贮作用
检索作用
三、手工检索工具目录(catalogue)又称书目,一批相关完整出版物名字的列表。重点描述文献的外表特征。通常以一个出版单位或收藏单位为基本的著录单位,对文献的描述比较简单。常见的类型有:a馆藏目录b联合目录c国家书目题录是将图书、报刊等文献中论文的篇名按一定的排检方式编排而成的。
索引(index)将文献中的知识单元分析摘录出来,并注明它的出处,按一定原则和方法组织编排,构成的检索工具。32三、手工检索工具32索引和目录的区别目录著录的是完整的出版物,如一本书、一种期刊;而索引著录的是出版物的一部分(某一知识单元)。索引比目录对文献的揭示更深入、更细致。3333索引分两种:一种是作为工具书的主体,如文献题名(篇目)索引。另一种是作为工具书的一部分,一种检索途径,内容索引如:主题索引、著者索引等。4.文摘(Abstract,digest,excerpta):是揭示信息外表特征和内容特征的信息系统,在题录的基础上加上文献内容的摘要。使读者能以较少的时间和精力掌握有关文献的基本内容。进而判断是否需要阅读全文。分指示性文摘和报道性文摘。34索引分两种:345.全文是以一次文献即原始文献为存储对象,著录项目包括了文摘和全文,能够直接为用户提供原始资料或具体数据。
355.全文是以一次文献即原始文献为存储对象,著录项目包括了文信息检索工具的主要类型目录型题录型索引型文摘型36信息检索工具的主要类型目录型题录型索引型文摘型36目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。37目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。【论文题名】网络环境下信息检索与报道服务浅析
【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment
【作者】丁彩云DINGCai-yun
【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004
【刊名】株洲师范高等专科学校学报
【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE
【年卷期】2005Vol.10No.2
【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道
38题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。
39索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。【论文题名】网络环境下信息检索与报道服务浅析
【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment
【作者】丁彩云DINGCai-yun
【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004
【刊名】株洲师范高等专科学校学报
【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE
【年卷期】2005Vol.10No.2
【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道
【摘要】网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.
40文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘《中国药学文摘》著录格式:41《中国药学文摘》著录格式:41全文:全文检索技术是一种面向全文、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。42全文:全文检索技术是一种面向全文、提供全文的新型检索技术。它参考工具书:字典、词典:在秦汉时代就有了《尔雅》、《说文解字》等,下至清代有《康熙字典》,现有《辞源》、《辞海》等。年鉴、手册:《人民手册》,《中国卫生年鉴》43参考工具书:43计算机检索工具1数据库分为:书目数据库事实数值数据库 全文数据库2信息网络分为:分类目录型搜索引擎(SearchEngine)型混合型44计算机检索工具44第三节文献信息检索方法和途径一、
文献检索的方法常规法它又分为顺查法、倒查法和抽查法。追溯法综合法(一)常规法 常规法是文献检索中经常使用的方法,就是利用检索工具按年代顺序查找文献的方法,又称工具法。它可分为顺查法、倒查法和抽查法三种。4545
1.顺查法即从过去某一年代开始,按时间顺序由远及近逐步查找文献的方法。此种方法优点是系统、全面、漏检的可能性小,但工作量大,较费时间。
2.倒查法与顺查法相反,是一种按时间顺序由近及远的查找方法。就是从近年的检索工具开始查找,逐年向远处回溯过去的文献,一直查到文献满足为止。此种方法重点放在近期文献上,比较节省时间,灵活性大,但查全率不如顺查法。3.抽查法就是根据课题发展特点,抽取该课题研究最活跃、论文发表最集中的一段时期,逐年进行文献检索的一种方法。该方法能用较少的时间获取较多的文献,但一定要在检索前对学科和课题特点掌握清楚,能准确把握其发展时期,否则难以取得预期效果。4646(二)追溯法 追溯法就是利用已知文献后面所附的参考文献提供的文献线索,逐一查找原文,然后再利用查出的原文后面所附的参考文献进一步扩检,继续追踪下去。这样查出的文献就像“滚雪球”一样,不断增多。在没有检索工具或检索工具不全的情况下可利用这种方法来查找文献,也可作为一种平时积累资料办法。此法缺点是工作量大,检索不全面,容易出现漏检和误检,另外越查文献越陈旧,离原课题主题越远。47(二)追溯法 4748484949(三)综合法综合法又称循环法、分段法,是将常规法和追溯法综合运用的一种方法。即先利用检索工具查出一批文献(一般3~5年),然后根据查出的这些文献后面所附的参考文献提供的线索利用追溯法进行查找,扩大检索效果,又获得一批文献。如此交替使用两种方法,直到满意为止。这种方法效率高、速度快,针对性强,有人认为是“最佳检索方法”。上述检索方法各有特点,在实际检索工作中,应根据课题要求、检索工具情况以及学科特点,灵活掌握运用,选择合适的检索方法。50(三)综合法50引自田纳西大学CarolTenopir的研究报告51引自田纳西大学CarolTenopir的研究报告51二、文献信息检索途径1.分类途径分类途径是按文献内容所属的学科类别来检索文献的途径,通过分类号或类别进行检索。利用分类途径检索文献,需掌握一定的分类法。利用分类途径可以了解学科概念之间的隶属、并列、相关等关系,适用于回溯性检索和广义概念的检索,能够满足族性检索的要求。查全率高,但查准率低。52二、文献信息检索途径1.分类途径522.主题途径
主题途径是通过反映文献内容主题的语词来检索文献的途径。检索时按语词字顺查找,即可找到相应主题的文献。利用主题途径检索文献,专指性强,能集中反映同一主题而分散在不同学科中文献(特性检索),能够解决多学科、交叉学科、边缘学科之间文献交叉分散的矛盾,同时利于新课题检索(词表每年修改),查准率高,但缺点是不能集中同一学科、专业或类族事物的文献。532.主题途径
主题途径是通过反映文献内容主题的语词来检索文3.关键词途径4.著者途径5.题名途径6.号码途径:书号(ISBN)、刊号(ISSN)等7.其他途径:分子式索引、药名索引、地名索引等543.关键词途径54文献检索的常用途径1
题名:注意题名关键词的排序特征2.作者:通常按姓在前名在后方式检索3.分类:我国高校与公共图书馆的文献资料,一般采用《中国图书馆图书分类法》(简称《中图法》)进行分类。4.主题词:主题是指表征文献内容特征、经过规范化的名词术语。检索者通过检索这些规范的词语来找到所要的文献和情报。《现代汉语主题词表》5.关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化检索词。6.顺序号检索:专利号,标准号,研究报告号。7.全文检索:
8.引文检索:利用被引文献来查找原文献的检索方法。如:CNKI中国期刊网被引用字段,维普中文期刊数据库引文检索途径。
9.其它:超文本检索,基于概念的自然语言检索,图象等。55文献检索的常用途径1
题名:注意题名关键词的排序特征55课题分析---排除重复无关的概念
项目“河豚毒素的液相色谱分析”从项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念主要概念:
河豚毒素、液相色谱检索式:河豚毒素and液相色谱56课题分析---排除重复无关的概念项目“比较“主题词”与“关键词”主题词举例
如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式规范为“白细胞介素2”。关键词举例
如:对于“白细胞介素2”这一概念可有白介素2、白细胞介素2、IL2、IL-2等不同形式来表达。
57比较“主题词”与“关键词”57第四节文献信息检索步骤及效果评价
一、文献检索的步骤(重点)A.分析检索课题,明确目的和要求B.根据课题要求,制定检索策略包括选工具、定方法、选途径、定标识C.查找文献线索D.获取原始文献58第四节文献信息检索步骤及效果评价58二、检索结果评价文献检索的基本要求:全面、准确、快速。检索效果是文献检索结果的有效程度。它有两个重要指标:查全率、查准率。检出的相关文献量查全率=————————————×100%文献库中相关文献总量5959检准的相关文献量查准率=————
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 传感器网络安全防护策略
- 品管圈在护理服务中的应用与效果评估
- 神经外科患者的肠内营养支持与护理
- 灾区护理人员的专业技能提升
- 璧山区出租汽车客运价格调整听证方案
- 广东省汕头市潮南区2026年初中学业水平模拟考试数学试卷附答案
- 眼科患者的自我管理教育
- 失能老人常见疾病预防与护理
- 2026年数字孪生工厂设备预测性维护指南
- 2026年秸秆收储运市场化运营“政府引导 企业主导”模式解析
- 2026河北衡水恒通热力有限责任公司公开招聘工作人员28名考试参考题库及答案解析
- 网吧的安全保卫制度
- 2026届高三高效学习方法与备考策略
- 2025人武专干军事考试题库及答案
- 2023年鲁迅美术学院附属中学(鲁美附中)中考招生语文数学英语试卷
- 肝豆状核变性指南 (1)课件
- 威廉斯科特Scott财务会计理论(第七版)全套课件
- 渗透检测工艺卡(空)
- 四年级下册数学课件-第一单元练习三 人教版 (共14张PPT)
- (高清版)《组合结构设计规范 JGJ138-2016》
- 筏板基础CFG桩施工方案和平面图纸
评论
0/150
提交评论