




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索的类型信息检索(传统)信息检索(现代)文献检索事实检索数据检索文本检索数值检索声频与视频检索信息检索效果的评价评价指标:查全率(检全率)查准率(检准率)检索出的相关文献量数据库中的全部相关文献查全率R=*100%检索出的相关文献量检出的文献总量查准率P=*100%提高检索效果的措施熟悉检索语言和检索工具认真分析课题需求灵活掌握检索方法和提高制定检索策略的能力文献检索的类型1.相关性检索2.确定性检索1.相关性检索以图书、期刊、资料、数据库中的篇章或全文为检索对象的一种检索检索结果为文献线索(包括题名、著者、出处)或全文以二次文献(检索刊物或数据库)或全文数据库为检索工具2.确定性检索根据检索对象不同又可分为---事实检索---数据检索检索结果为某一个具体的答案以三次文献(参考工具书)为检索工具文献检索原理1.文献替代2.文献整序3.文献特征标识与检索提问标识的匹配1.文献替代一次文献的文献特征标识(外部特征和内容特征)按一定的标准格式著录成它的替代文献(二次文献)的过程。著录项目与格式:中图分类号题名/著者(著者所在单位邮政编码)//刊名/主办单位.—出版年,卷(期).—所在页码文摘……。图x表x参x(文摘员)
将杂乱无章的替代文献(二次文献)按一定的顺序(通常按学科类目)排列,并编制各种索引的过程。经过文献替代和文献整序后,完成了文献存储的过程。2.文献整序文献检索的过程就是文献特征标识与检索提问标识两者匹配的过程为了实现这种匹配,标引人员和检索人员必须采用一种共同的语言,即检索语言。3.文献特征标识与检索提问标识的匹配检索语言1.
分类检索语言2.
主题检索语言检索语言是一种人工语言,用于各种检索工具的编制和使用,并为检索系统提供统一的、作为基准的、用于信息交流的符号化或语词化的专用语言。分类检索语言(
Classfication)用分类号表达各种概念,将各种概念按学科性质进行分类和系统排列从学科门类的角度对文献进行分类检索标识:分类号分类语言(图书分类法)
分类语言是以文献内容的学科性质为对象,运用概念概括与划分的方法,按照知识门类的逻辑次序从一般到具体、从简单到复杂层层划分,所形成的一种等级体系。
《中国图书馆图书分类法》(中图法)《中国科学院图书馆图书分类法》(科图法)《DeweyDecimalClassificationSystem》(杜威十进分类法)《LibraryofCongressClassification》(美国国会图书馆图书分类法)
《UniversalDecimalClassification》(国际十进分类法)杜威十进分类法(DeweyDecimalClassification,DDC)广为全球各地图书馆使用的分类法。这个分类系统最早在1873年时MelvilDewey提出此分类构想,而于1876年正式出版DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,此外,DDC更能用来组织网际网络上的各种资源。DDC是用传统的学科来分类,总共以10个主要的学科(mainclasses)来涵括所有的知识体系,每个大类下细分10类(divisions),接着又再分成10小类(sections)。DDC中每个学科都会给予特定范围的数字来表示,它的十个大类(mainclasses)分别是:000Computers,information,&generalreference计算机、信息及总类100Philosophy&psychology哲学及心理学200Religion宗教学300Socialsciences社会科学400Language语言学500Sciences科学600Technology科技700Arts&recreation艺术及娱乐800Literature文学900History&geography历史及地理学第二层的分类有100个divisions,是以三个数字中的第二个数字表示,例如:500表示科学,510则表示数学、520是天文学、530则是物理学。第三层的分类则有1000个sections,是以三个数字中的第三个数字表示。例如,530表示物理学,而其下的531则是古典力学、532是流体力学,而533则是气体力学。在这种分类精神下,可以得知DDC的类目间是有层级关系的,因此在书架上置于相邻的资料,都可知道他们在内容是相关的。国际十进分类法UDC(UniversalDecimalClassification),又称为通用十进制分类法。国际通用的多文种综合性文献分类法。现在由国际文献联合会(FID)统一主持对它的修订工作。UDC由主表和辅助表及索引组成。主表分为以下10大类(据1989年英文中型版):0总类、科学和知识1哲学、心理学2宗教、神学3社会科学4(语言)5数学和自然科学6应用科学、医学、技术7艺术、娱乐、体育8语言、语言学、文学9地理、传记、历史中国人民大学图书馆图书分类法,中国人民大学图书馆集体编著,简称<人大法>。体系结构:《人大法》根据毛泽东关于知识分类的论述和图书本身的特点,设立了总结科学、社会科学、自然科学、综合图书等4大部类,总共17个大类。结构:《人大法》包括主表和复分表两部分,主表设有大纲、简表、基本类目表和详表。复分表有9个:综合复分表、中国民族复分表、中国时代复分表、中国地区复分表、苏联加盟共和国复分表、国家复分表、国际时代复分表、世界地区复分表。另有“书次号使用方法说明”和“文别号使用方法说明”两个附录。《中图法》即中国图书分类办法,就广义而言,包括《中国人民大学图书馆图书分类法》、《中国科学院图书分类法》、《中国图书馆图书分类法》、台湾赖永祥仿十进分类法(所谓"中国图书分类法")、《国际图书集成分类法》。就狭义而言,《中图法》是《中国图书馆图书分类法》的简称,是我国目前通用的分类图书的工具。《中图法》:以拉丁字母与阿拉伯数字相结合的混合制号码作为类目的分类号,将人类的文献分为五个基本部类,22个基本大类。A马克思主义、列宁主义、
毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律
E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理T工业技术
U交通运输V航空、航天X环境科学、安全科学Z综合性图书N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学图书的分类中国图书馆图书分类法(第四版)(22个大类)TB一般工业技术TD矿业工程TE石油、天然气工业TF冶金工业TG金属学与金属工艺TH机械、仪表工业TJ武器工业TK能源与动力工程TL原子能技术TM电工技术TN无线电电子学、电信技术TP自动化技术、计算机技术TQ化学工业TS轻工业、手工业TU建筑科学TV水利工程T工业技术(16个二级类目)图书的分类与排架C53/126-2:4或C53126-2:4C53:分类号126:种次号-2:第二版4:第四辑(丛书)不同类别的图书按字母顺序排列同一类别的图书按数字顺序排列例如:A561/3、B848/64、C53/12F270/79、F270.4/56、F272.3/67图书馆的藏书都是按分类号排架的。分类号的排列采用由左至右逐位对比的方法进行排列,先比较字母部分,再比较数字部分。
——字母部分按英文字母固有的次序排列。例:B2中国哲学B3世界哲学E27各种武装力量E512苏联军事TM92电气化、电能应用TU201建筑设计原理
——分类号中的阿拉伯数字依小数制排列。例:B021辩证唯物主义的物质论B022辩证唯物主义的意识论B022.2客观规律性与主观能动性D035.37交通公安管理D035.4监察、监督分类号的排列次序
读者实际利用图书馆时,往往需要知道书刊的分类号和索书号(又称索取号)。
索书号是图书馆赋予每一种馆藏图书的号码,是读者查找图书非常必要的代码信息。它的第一部分是分类号,第二部分是书次号。索书号的两部分之间有一个空格或一条斜线“/”。书次号或者是按照图书作者姓名所编排的著者号码,或者是按照图书进入馆藏时间的先后所取用的顺序号码。不同的索书号确定排列先后顺序的步骤是,先比较分类号码;如分类号码相同再比较著者号码或顺序号码。分类号和索书号图书馆信息查询系统书目查询读信者息新书通报:一个月内到馆的新书、馆藏地,并可查看新书订购征询信息发布:预约到书列表、超期罚款、超期催还、委托借阅到书列表如何利用计算机进行检索书刊查询读者信息查询图书馆主页的功能信息发布功能:图书馆最新服务动态、电子资源试用等均及时在主页上发布。
信息服务功能:通过本网站上的应用程序直接向读者提供信息服务。如馆藏书刊查询、读者信息查询、新书通报、书刊荐购、数据库检索、读者咨询、读者培训等。
资源导航功能:提供本馆馆藏资源、电子资源、网络资源的入口及访问方式。
图书馆主页内容框架
最新动态
包括新闻、新资源、通知等;公共查询
包括馆藏图书、期刊、报纸查询、读者信息查询、预约催还、新书通报、图书导读、书刊荐购等;电子资源
包括中文数据库、外文数据库、试用数据库、网络资源、搜索引擎等;服务指南
包括咨询台、读者培训、代查代检、文献传递、馆际互借、投稿指南等;本馆概况
包括馆情介绍、馆舍分布、机构设置、开放时间、服务电话、规章制度等。
书目查询结果显示:索取在结果中查号询:输入(题名、、题名、作者、出版信息作者、出版社、主)选中图书查看相关信息题词注意:处于“在馆”状态的图书可借点击预约书刊可预约该书预约图书:选定所需图书,输入证号、密码,执行预约点击机读格式可查看该书的MARC信息步骤:图书馆主页书目查询输入内容查询类型查询文献类型:所有书刊、中(西)文图书、中(西)文期刊查询类型:题名、作者、主题词、索取号、出版社、ISBN(书)、ISSN(刊)、订购号、分类号、从书名高级查询在题名、著者、丛书名、主题词、出版社、ISBN(书)、ISSN(刊)、索取号、起始年代中填入自己确定的内容,其余的可以不填写;选定语种(17种)和文献类型,然后进行检索。结果可检索到所需文献的题名、著者、出版信息、索取号查看选中图书的相关信息
公共图书馆比麦当劳多
95%的公共图书馆能上网美国公众去图书馆的次数是去电影院的两倍高校的教育经费用在图书馆的不超过3%好的中学生更愿意进有好图书馆的大学2002年ALA对图书馆的调查
25-34岁的受访者中,平均每年去24次图书馆
81%的人认为图书馆员是技术性工作人员
65%的受访者有借书证
91%的人认为图书馆在未来仍会存在各有46%的人认为去图书馆是为了学习目的和娱乐消遣目的2.
主题检索语言直接采用词语进行主题标引。从文献主题出发对文献进行分类,文献主题指文献所论述的对象和研究的问题。检索标识:主题词2.
主题检索语言
标题词:经规范化处理的词或词组,先组式语言(主标题副标题说明语言)单元词:最基本的且概念不可再分的词。叙词:独立概念的经规范化处理的词或词组,后组式语言,可自由灵活组配
关键词:未经规范化处理,直接从文献题名、原文或文摘中选取的能反映原文主题内容的自由词汇前组式语言指在检索实施前已组配好的一种检索语言,用户只能用固定好的检索词组形式去完成检索,它有较好的直接性和专指性,但灵活度差,如标题词语言。
后组式语言是指标识主要供组配使用,而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言。
标题词:是从文献的题目、正文或摘要中抽选出来,经过规范化处理,用以描述文献内容特征的词和词组。例如:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”来叙述,第三篇文章用“微机”来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词,这三篇文章都必须用“微型计算机”作标题词。叙词叙词特点:从文献中抽取出来的名词术语;经过规范化处理;词与词之间有严格的语义关系;具有组配性能(概念组配)。叙词语言构词原理和方法
字面组配概念组配模拟+控制模拟控制模拟+控制模拟控制香蕉+苹果≠香蕉苹果香蕉味食品+苹果香蕉苹果彩虹+电器≠彩虹电器彩虹牌商品+电器彩虹电器a.它保留了单元词法组配的基本原理;b.采用了组配分类法的概念组配,以及适当采用标题词语言的预先组配方法;c.采用并进一步完善了标题词语言的参照系统,采用了体系分类法的基本原理,采用叙词轮排索引。
叙词的概念组配是用布尔逻辑运算来实现的。前组式语言指在检索实施前已组配好的一种检索语言,用户只能用固定好的检索词组形式去完成检索,它有较好的直接性和专指性,但灵活度差,如标题词语言。
后组式语言是指标识主要供组配使用,而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言。
检索语言的类型描述内容特征语言描述外表特征语言主题语言分类语言代码语言责任者题名其他自然语言受控语言关键词语言——(keyword)标题词语言——(heading)单元词语言——(uniterm)叙词语言——(descriptor)检索工具的定义检索工具是人们用来存储、报道和查找文献的工具,它具有存储和检索的功能。4个基本条件:(1)能够详细著录文献的外部特征和内容特征(2)具有即定的检索标识(3)全部文献必须根据标识,系统科学地排列成为一个有机地整体(4)能够提供多种检索途经检索工具的作用主要作用:1、文献高度集中;2、提高检索速度;3、提供有规律的检索4、消除语言障碍检索工具的分类(一)按存储内容划分(二)按存储载体划分(一)按存储内容划分1.目录型
2.题录型3.文摘型4.全文型索引、参考工具书、搜索引擎
1.目录型目录型检索工具是以整本图书或期刊的外部特征为报道对象。报道内容:图书:书名/著者//出版地:出版者,出版时间期刊:
刊名/编著出版地:出版者,创刊年2.题录型题录型检索工具是以书刊中的某篇文献(或章节)的外部特征为报道对象报道内容:文献篇名/著者//刊名出版年、月(卷、期)、页码3.文摘型报道对象与题录相同,但对文献内容揭示的程度较题录更深入更具体,增加了文献的摘要文摘按其内容特征可分:指示性文摘、报道性文摘、指示—报道性文摘例:文摘型【题名】中国淡水蛏的形态学研究【作者】饶小珍陈寅山
【机构】福建师范大学生物工程学院
【刊名】福建师范大学学报.1998,14(4).-71-75,102
【ISSN号】1000-5277
【CN号】CN35-1074
【馆藏号】94783X
【关键词】中国淡水蛏形态学淡水蛏蛏科缢蛏
【分类号】Q959.194
【文摘】报道了以解剖法对中国淡水蛏外部形态和内部结构研究的结果。并与蛏科的缢蛏和刀蛏科的尖刀蛏的形态进行了比较。
4.全文型报道对象与题录相同,但增加了文献的全文按载体不同:
全文数据库(中文、外文)期刊等印刷型索引、参考工具书等索引:揭示具有重要检索意义的内容特征标识或外部特征标识,按照一定顺序排列,并注明文献条目线索的检索工具。参考工具书:是分析和著录大量具体常用的科学数据与事实,以备查找使用的各种常用工具书的总称。搜索引擎:通过网络机器人建立网络数据库(二)按存储载体划分印刷型(书本式、卡片式)缩微型电子型:
联机型(磁性载体、计算机及通信网络)光盘型(光盘、计算机及光驱)
网络型(Internet、网络数据库)检索工具的结构组成:主题部分、索引、目次表、使用说明(指南)、其他(附录)内容形式:手工检索工具、计算机检索工具文献检索方法1.检索工具法2.追溯法3.分段法4.浏览法1.检索工具法(1)顺查法:以课题研究的起始年代为起点,由远而近按时间顺序逐年查找的方法(2)倒查法:由近而远按时间顺序逐年查找的方法(3)抽查法:针对学科发展的高峰期,选取一定时间段进行查找的方法2.追溯法是指利用已知文献后所附的参考文献入手,逐一追查原文,再从此原文后所附的参考文献逐一查找下去,直到获得满意的结果。3.分段法又称循环法、交替法、综合法。即利用检索工具法和追溯法交替使用的一种方法。4.浏览法指直接在一次文献中查找所需的文献,也称直接检索法。该方法带有盲目性,一般只作为对上述各种检索方法的补充,主要用于查找新近发表的文献。1.分类途径2.主题途径3.著者途径4.其它途径文献检索途径是从学科分类角度来查找文献的一种途径。利用目次表或目录来查找。检索文献的关键:分析课题,确定课题所属的类目与检索工具目次表中的类目相匹配,才能查准。特点:族性检索
(适合从学科体系出发泛指性比较强的课题的检索,但不适合专指度高的课题以及新兴学科、交叉学科、边缘学科的课题的检索)1.分类途径从文献主题内容角度来检索文献的一种途径。利用检索工具后所附的主题索引,以主题词作为检索入口。检索文献的关键:分析课题,选准主题词,并了解主题索引的结构和编排。特点:特性检索(适合比较具体专深的课题以及新兴学科、交叉学科、边缘学科的课题的检索)2.主题途径3.著者途径在已知著者姓名的情况下,利用著者索引作为工具检索文献的途径。一般著者索引(个人或团体)均按著者姓的字母顺序编排,姓在前,名在后,姓用全称,名用缩写。分子式途径序号途径文献题名途径4.其它途径文献检索的具体步骤和方法分析研究课题,明确检索要求、时间、范围1、分析课题的实质内容以及所涉及的学科范围及相互关系,抽出主题概念,确定逻辑组配2、明确需要的文献种类、语种、年代以及文献量。3、明确检索的侧重点:对查新、查准、查全的指标要求。查找文献线索1、做好检索记录2、文献类型的识别确定检索策略1、选择检索工具:内容、专业性、技术手段、更新、性价比等2、确定检索途经3、优选检索方法4、制定、调整检索策略索取原始文献信息1、掌握两种还原法:缩写与全称转换、非拉丁语系出版物名称还原2、向著者索取原始文献3、利用馆藏目录、公共查询系统、联合目录获取原始文献4、利用网上全文数据库获取原始文献5、利用网上全文传递服务检索原始文献6、利用网上出版社、杂志7、利用文摘数据库的原文服务检索结果评价1、提高查全率和查准率2、降低漏检率和误检率检索时常见问题分析造成误检或漏检的原因:1)课题分析不透;“学科归属”不清。2)“语言”不通。3)主题概念不是大了,就是小了。4)“同义词库”不全5)核心词太多6)选择的检索工具专业性不够。E-journalorsearchengine?
1)课题分析不透;“学科归属”不清对课题的真正含义和学科归属不清楚,会造成最大的失误。如查找有关“玻璃钢”制造工艺方面的资料,如果从字面含义着手,以为它属玻璃工业或金属材料的范畴,而事实上,玻璃钢既不属硅酸盐工业里的玻璃类,也不属金属材料里的钢铁制品,而是合成树脂与塑料工业里的增强、填充塑料制品。如果没有认真分析课题的真正含义和学科归属,就匆匆着手检索,往往会欲速不达,或多走弯路,甚至导致失败。2)“语言”不通基于计算机的文献检索的特点与其说是人机对话,不如说是标引人员与检索人员的对话,只有标引人员与检索人员所表达的“语言”一致,才能顺利实现文献检索。往往检索工具使用的是标引语言,而检索者使用的多数是自由词,未经规范化,这样在表达方式上有差异,造成了检索障碍。如:自由词:维生素C(vitaminC);标引词:抗坏血酸(ACID,ASCORBIC)自由词:艾滋病(AIDS);标引词:ACQUIREDIMMUNODEFICIENCYSYNDROME(后天免疫缺陷综合症);又如“沙示”(SARs),禽流感(Birdflu)…….3)主题概念不是大了,就是小了检索者不知道如何正确定位课题的主题概念,往往会不是大了,就是小了,初学者更容易把概念偏大。主题概念的范畴太大造成大量没用的文献被误检,太小造成重要的的文献被漏检。如“石油工业的废水处理”,若用“废水处理”作为主题概念,就会太大,在《中国期刊网》中有1400多篇,如果我们知道石油工业主要排放的是毒性较大的含酚废水,那么主题概念定位在“含酚废水处理”就比较恰当了,此时查出的文献大概有20~30篇。4)“同义词库”不全往往同一件事情或事物,不同作者喜欢用不同的词来表达,这就造成了庞大的同义词库,如果偏偏你头脑中的“同义词库”不是那么全,造成漏见就不足为怪了。例:艾滋病——艾滋病、爱滋病碳纤维——碳纤维、炭纤维聚四氟乙烯——PTFE,polytetrafluoroethylene,Teflon设备——apparatus,equipment,device……汽车——car,automobile,vehicle……5)核心词太多对于由A、B、C、D、E多个主题组合的多主题概念课题,如果将所有主题混在一起同时组配,会造成“零结果”现象。因为,只要A、B、C、D、E其中之一的检索结果为零,则经过布尔逻辑“和”的运算,检索结果=A*B*C*D*E=0。6)选择的检索工具专业性不够E-journals:中文:中国期刊网、万方数据库系统、维普。。。。。。英文:Elsevier……Searchengine:北大天网,百度,GooGle,Yahoo!Openfind,…….
解决上述问题的方法1、掌握文献和文献检索的基本知识2、熟悉各种文献信息的分布3、掌握文献检索的基本技巧:检索算符、检索语法、常用搜索引擎和数据库的特殊技巧4、不断实践、不断归纳总结如:关键词的选择技巧
我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。在当今互联网上,你永远不会愁你找不到东西,而是东西太多,你无法找到你需要的东西,因此搜索效率便成为最重要的一环,搜索效率直接关系到搜索的关键词的选择。关键的分析必须保证两点:一是专业性,即这个词是很精的,可能简化你的搜索结果,因而词甚至可以怪一点,尽量避免大众化的词,如net,site等。即使需要大众化词,如password,username,但若加入一两个特征词,则结果将大大简化。二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。有机检索理念
强调的是有计划,有组织,协调检索过程,使检索变得简单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年扶余市博物馆公开选调解说员(4人)考前自测高频考点模拟试题及答案详解(名师系列)
- 2025年上半年甘肃陇南文县教师资证认定模拟试卷及答案详解(必刷)
- 2025年乐山事业单位真题
- “百万英才汇南粤”2025年佛山市高明区公开招聘中小学教师(第四场)模拟试卷附答案详解(典型题)
- 2025年甘肃庆阳华池县事业单位选调工作人员考前自测高频考点模拟试题及1套完整答案详解
- 2025广东广州医科大学附属医院第一次招聘163人考前自测高频考点模拟试题含答案详解
- 2025年淡水养殖产品种苗项目合作计划书
- 2025年高邮市市级机关公开遴选考试真题
- 2025年福建省厦门市体育局所属事业单位厦门市体育运动学校公开招聘4人考前自测高频考点模拟试题附答案详解
- 2025贵州省第二人民医院第十三届贵州人才博览会引才招聘13人模拟试卷及答案详解(有一套)
- 乒乓球比赛裁判员学习用(教学)
- 非口服药物的吸收(生物药剂学与药物动力学课件)
- 《中外美术史》课件
- 七年级语文上册课外阅读之《朝花夕拾》读书分享课件
- 节目组劳务合同模板
- 锅炉培训课件
- 青岛 二年级 数学 上册 第4单元《8的乘法口诀》教学课件
- 广东省东莞市五校2024-2025学年高一上学期第一次联考数学试题(无答案)
- 中华人民共和国标准设计施工总承包招标文件(2012年版)
- PVC-地面中水泥基自流平找平层的施工作业指导书
- 道路施工分包合同范例
评论
0/150
提交评论