




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息源及信息检索技术,基本概念,信息,文献,知识,情报,相互关系,1、是尚未被认识的信息区;2、是未被记载和传递的知识区;3、是非实物型载体情报区;4、是未被利用的文献区;5、是信息+知识+情报+文献的统一区。,相互关系,相互关系,基本概念,信息源:是我个人为满足其信息需要而获得信息的来源。,信息资源的类型,研究重点,存在状态,什么是信息资源:信息资源就是经过人类加工处理后的、有序化的、大量的有用信息的总称。,文献信息源的分类,按出版形式和内容划分,图书,期刊,报纸,专利文献,标准,学位论文,科技报告,会议论文,政府出版物,产品样品资料,技术档案,信息源,各种不同的文献产生和运用的背景不同,他们的识别要素、特点与主要用途也有区别,搞清楚它们的特点与用途,在我们有特定的信息需求时,才会采用正确的信息源。各种文献对比见教材表2-5,第21页,知识的一半就是知道到哪儿去寻找!,彼得德鲁克在后资本主义社会中所说:“在知识社会里,对于任何一个人、组织、企业和国家,获取和应用知识的能力是竞争成败的关键”。,路易斯肖:“懂得如何查询到所需要的知识等于掌握了知识的一半”。,如何选择?,文献信息源的分类,信息源,主要的信息源及其选择信息生产者:高等院校、政府机构、企业/组织、学术团体、科技人员、管理人员等图书馆资源高校图书馆、公共图书馆、专业(行业)图书馆(如国家科学图书馆、国家工程图书馆、国家农业图书馆)、联合图书馆(虚拟)CALIS、NSTL搜索引擎开放存取资源(OpenAccess)商业数据库CNKI、万方、EI、SCI个人网站/官方网站/专题网站(P30)新媒体(微博、微信)论坛/贴吧(先导信息源),开放存取(OpenAccess)(P35)是网络上提供免费资源最常见方式之一,它是指某文献可以在Internet公共领域里被免费获取,允许任何用户阅读、下载、拷贝、传递、打印等。国内1.Socolar平台()2.预印本服务系统()3.科技论文在线(,信息检索委托与求助,要具有较高的信息素养,就要有较多信息获取方式和手段。通常信息的获取渠道包括网络(搜索引擎、开放获取、论坛、机构网站)、图书馆、学术会议(同行交流)等。当这些渠道无法满足需求时,就需要申请委托检索或者直接联系作者获取。1通过文献传递、馆际互借服务方式求助2通过参考咨询方式求助3Email向作者索取全文4向论坛求助5其它求助方式,信息源使用经验与技巧,在检索信息选择信息源,应该考虑以下三个问题,这种资源应该在哪里?哪种资源会跟我的研究主题相关?面对的问题可使用哪种资源解决?,特别提示:要把信息源与实际需求结合起来,即不同的信息源基于不同的信息需求,一个问题可能需查寻多种不同的信息源。,如何找到需要的信息资源,如果你阅读本章前面内容就会发现,不同的信息在其生产、加工、传递的不同的时段会出现在不同地方,寻找信息资源,尤其是寻找学术、科研、重要的商业信息资源,首先是利用身边的图书馆,其次是利用网络资源,再次可以通过求助方式获取。,v,信息源选择举例,布尔逻辑检索:逻辑算符是表达检索提问的各概念之间的逻辑关系。逻辑算符有三种:逻辑与:用于交叉概念或限定关系的组配;逻辑或:用于并列概念的组配;逻辑非:用于从原来的检索范围中排除不需要的概念。三种算符可同时在一个检索式中使用,也可单独使用。,逻辑与:作用:可以缩小检索范围,提高查准率。可使用“*”、“AND”、“与”、“并且”、“并含”来表示。其检索表达式为:”AANDB”或“A*B”,即检索记录中必须同时包含A词与B词才算命中。例如:“中国*对外贸易”。,逻辑或作用:可以扩大检索范围,提高查全率可使用“+”、“|”、“OR”、“或者”、“或含”来表示。其检索表达式为:“AORB”或“A+B”,即检索记录中含有A词或者B词中的任何一词即可。例如:“高清晰电视|HDTV”,逻辑非作用:可以缩小检索范围,提高查准率。可使用“-”、“NOT”、“非”、“不含”来表示。其检索表达式为:”ANOTB”或”A-B”,即检索记录中包含A词但不含有B词。例如:“新能源-太阳能”,使用逻辑算符时应注意的事项:逻辑算符的优先级为:NOTANDOR;可用括号来改变优先顺序。搜索引擎及少量外文数据库通常以:以“包含以下全部的关键词”或“matchallterms”表示逻辑“与”;以“包含以下任意一个关键词”或“matchanyterm”逻辑“或”;以“不包括以下关键词”或“mustnotcontain”表示逻辑“非”。,截词检索是指用给定的词干做检索词,用以检索出含有该词干的全部检索词的记录。它可以起到扩大检索范围、提高查全率、减少检索词的输入量、节省检索时间等作用。检索时,若遇到名词的单复数形式、词的不同拼写法、词的前缀或后缀变化时均可采用此方法。,常用的截词检索技术截词检索又称通配符,不同的检索系统中使用的符号不同,通常用“*”、“?”来表示。无限截词符*Computer可检出Computer、Microcomputer等词integra*能检出含有integral、integrate、integrated、integrating、integration、integrative、integrator等词的记录。有限截词符?WOM?N可检出WOMAN,WOMEN,字段检索(P63)字段检索是指将检索词限定(Within)在某个或某些字段中,用以检索某个或某些字段含有该检索词的记录。限制检索字段通常有两种方式:其一,通过下拉菜单选择检索字段。此时,字段名一般用全称表示,如:题名、摘要、Title、Abstract等。其二,输入检索字段符限定检索字段。,常用检索技术,常用字段检索,常用检索字段表,信息检索技术,如要检索研究老舍的文章,输入“老舍”时必须选择途径为“标题”或者“关键词”,不能选择作者途径,这是因为“老舍”在这里被研究的对象而不是论文的作者。,检索词的选取,选取原则准确性:选取最恰当、最专指意义的专业名词作为检索词。一般选取使用各学科在国际上能用的、国内外文献中出现过的术语作检索词;选取检索词既不能概念过宽,又不能概念太窄。全面性:选取的检索词能覆盖信息需求主题内容的词汇,需要找出课题涉及的隐性概念,注意检索词的缩写词、词性变化以及英美的不同拼法。规范性:选取的检索词要与检索系统的要求一致。化学结构式、反应式和数学式原则上不用作检索词;非公知公用的专业术语及其缩写不得用作检索词。简练性:目前搜索引擎和数据库并不能很好地处理自然语言。因此在提交搜索请求时,最好把自己的想法提炼成简单的,并且与希望找到的信息内容主题关联的查询词。,检索词的选取,选取方法方法一:主题分析法首先,将检索主题分为数个概念(一般包括研究对象、方法、材料、过程、条件等具有独立检索意义的一些基本概念,可作为检索词);确定反映主题实质内容的主要概念;去掉无检索意义的次要概念;然后归纳可代表每个概念的检索词,同时寻找检索词的同义词、上位词、下位词和相关词;同义词是指意义完全相同的词。如GIS与信息系统;上位词指概念上外延更广的主题词,如水是海水的上位词,液体是海水的上位词;下位词指概念上内涵更窄的主题词,如尾气污染、废气污染是大气污染的下位词;相关词是指意义相关的词,如出口与外贸。最后将不同概念检索词以布尔逻辑加以连接。,方法二:头脑风暴法在开始检索之前,写出一些详细描述检索主题的句子,用下划线将句子中的关键词和短语划出来。有了最初的关键词列表之后,要尽可能地列举出更多的关键词或短语。请记下你的任何想法,甚至是一些看上去还没有考虑成熟的想法。如果是英文,别忘了单词的不同拼写、简称、缩写等情况。同时应该区分哪些词扩展了原来的含义(上位词),哪些词缩小了原来的含义(下位词)。如:universitystudentundergraduatefreshman例1:提高电子邮件的安全可以通过改善邮件程序、对邮件地址进行认证以及提高用户的警惕性。关键词:电子邮件;email;e-mail;安全;程序;认证;警惕性;网络安全;电子邮件系统;软件例2、通过对上网用户的研究发现,沉溺于网络能够影响一个人的心理健康。一些调查表明,长时间上网可导致情绪供低落和性格孤僻。关键词:研究;网络;internet;用户;在线;健康;沉溺;痴迷;调查;影响;情绪低落;孤独;沮丧;孤僻例3、请列举出与internet同义或相近的词。关键词:Internet;网络;WorldWideWeb;Web;互联网;在线;计算机;电脑;信息高速公路,检索词的选取,方法三:切分法1、切分切分就是指将用户的信息需求语句分割为一个一个的词,即以词为单位划分句子和词组。例:高校|扩招|对|劳动力|市场|及|教育|收益率|影响|的|研究要点:A.词是语义切分的最小单元,也是检索的最小单元。切分必须彻底,必须“到词为止”。如:“信息检索”可切分为:“信息|检索”。B.切分也要适度,不能因切分而改变语义。如:不能将“操作系统”切分为“操作|系统”思考:电动汽车的研究现状及发展趋势如何切分?,如何提取检索词,2、删除将课题转换成关键词的集合A.删除不具有检索意义的虚词(包括介词、连词、助词、副词等)删除因使用太宽泛而不具有检索意义的限定词(如作用、意义、研究、device、precess、system、http,com等)例:”电动汽车的研究现状及发展趋势”。通过切分删除后,仅“电动汽车”可做检索词。B.删除过份具体的限定词铁路货车车轴承保持架残损分析及对策研究(铁路货车铁路车辆)成德绵产业带现代集成制造系统发展战略和关键应用技术研究(成德绵区域),如何提取检索词,3、替换用更明确、更具体、更本质的概念替换表达欠佳的概念稀土材料的研制(主要研究的是钐钴,因而用钐钴替换稀土)新能源(新能源包括风能、海洋能、地热能、太阳能、氢能、核能)煤灰利用(考虑到通常煤灰的利用方式,可用砖、水泥、混凝土、路基代替)垃圾处理(在“处理”这个检索概念上,就要考虑增加“再生”、“回收”、“循环”等字面后隐藏的同义词)难点:隐含概念与隐含词的选取,如何提取检索词,4、补充A、补充还原词组:WTO世贸组织世界贸易组织B、补充同义词(检索词的全称、简称、俗称、英文缩写及不同拼写方式可统称为检索词的“同义词”)C、增加限定词(解决一词多义现象):杜鹃杜鹃(动物)、杜鹃(植物)线路考虑增加“道路”、“车辆”或“电子”、“无线电”作为检索词思考:高铁,检索词的选取要点及技巧隐含概念与隐含词的选取在分析课题时,不仅仅是题面上的拆分,更重要的是对课题的主题概念(特别是课题的隐含主题概念)认真分析,掌握课题的内容实质,概括出能最恰当地代表主题概念的检索词。同时注意用词的通用性,准确性和规范性。利用工具书、CNKI知识无搜索、超星的读秀搜索等辅助工具了解背景知识;阅读初查文献,从篇名,关键词、摘要、原文、参考文献中挖掘隐性词;利用自己的专业知识和平时积累的知识或与导师、同学进行交流,挖掘隐性词。英文词的选择在检索英文文献时,英文检索词选取不准确将直接影响检索的命中率及检出文章的质量。从检出的中文文献的英文标题、关键词、摘要、文后的英文参考文献中选词。如果知道中文关键词,可利用一些专门的翻译工具进行翻译。利用网上百科(维基、百度百科)查词。需要注意的是,中英文翻译时不一定都能按字面对译。在选择检索词有些中英文之间可以是一一对应,但有很多却不是一一对应的。思考:“网络资源”怎么翻译,采用截短处理英文采用截词运算符,中文采用截短处理。中文没有词尾的变换,但却有大量的仅变化修饰性定语的词类,如刺绣、苏绣、湘绣、蜀绣等。如果要查全上位类的刺绣方面的文献,可以把修饰性的定语全部省略。这在特性检索的主题体系当中,可以在一定程度上弥补分类的不足。网络数据库的安全性研究:其安全性包括安全机制、安全措施、安全模型、安全系统等,所以在选择检索词时,只需安全即可在检索中逐渐优化检索词从较少的关键字开始检索,尽量简明扼要地描述要查找的内容。先进行初检,再从结果中发现一些有效的提示,可根据提示,反复修正检索词。由于检索时所输入的所有字词都会用到,因此每增加一个词,就会对结果多一些限制。如果一开始就限制过多,将会错过许多有用的信息。在不同的检索环境中选用不同的检索词一些口语化的词在搜索引擎中可以使用,但在数据库中尽量使用规范词和标准词,即注意你想要的检索工具中的作者的用词习惯。,信息检索技术,关于作者名【排列规则】1、统一采用姓+名的顺序。英文的人名需实行倒置!如:ArrowBSmith(阿罗B史密斯)Smith,Arrow.B.2、复姓作者,将复姓作整体看待例:MargaretMartin-SmithMartin-Smith,Margaret【中文人名拼写形式】如:张建国ZhangJG或ZhangJianGuo(通常),ZhangJ(有时),【中文翻译成英文的处理】3、音译:直接用汉语拼音。西南交通大学Xinanjiaotonguniversity4、意译:通常有多种写法,检索式必须列举各种写法,才能保证查全率。例:原西南师范大学在欧洲专利数据库中就有三种写法:SouthwestChinaNormalUniwersity/SouthwestUniversity/XinanTeachers,University,例:论|高校|扩招|对|劳动力|市场|的|影响|研究中文:(高校+大学)*扩招*劳动力*市场外文:(UniversityORcollege)AND(enrollmentexpansionORenlarg*enrollment)AND(labormarketORlabourmarket)【实例】要检索张启发院士刊登在分子植物育种上关于水稻基因表达方面的论文。,检索式的表达,信息检索一般按分析检索课题、选择检索工具、确定检索策略、调整检索策略、获取原文等五个步骤进行。,信息检索的一般步骤,信息检索的一般步骤,1、分析检索课题、明确检索要求分析研究课题,是实施检索中最重要的一步,也是影响检索效果和效率的关键因素。在课题分析中,要明确以下几个问题。,信息检索的一般步骤,2、选择检索工具在明确了课题的检索范围和要求后,就要据此来选择检索工具。首先,根据检索要求和检索工具的学科特点和收录范围,初步选择一些符合要求的检索工具,然后,再根据这些工具的质量、性能以及检索人员以往使用的经验,来最终确定一个或几个合适的检索工具。选择检索工具应参考的原则是:(1)考虑学科范围和数据量(2)了解收录的信息类型(图书、期刊、学位论文)(3)考虑信息的时间范围(4)考虑检索工具的检索功能(易用性,是否熟悉)(5)检索工具的检索费用(中文:一般为0.5元/页或2元/篇),信息检索的一般步骤,3、确定检索途径、检索方法检索途径是开始查找的入口点。常用的有分类检索途径、主题检索途径、著者检索途径、题名检索途径。采取哪种检索途径,要从课题检索要求出发。如果课题检索要求泛指性强,所需文献范围较广,则最好选择分类途径;如果课题检索要求专指性强,所需文献比较专深,则最好选择主题途径、题名途径、分子式途径等进行检索为好;知道著者的姓名,则可以采用著者途径;同时根据用户检索的目的,期望的文献数量以及有关主题在学科中的状况,选用适当的检索方法。常规方法:按时间顺序获取文献(顺查法、倒查法、时间抽样法)引文法:利用文献后所附的参考文献、引文注释查找相关文献。【示例】交替法:常规法+引文法,信息检索的一般步骤,4、调整检索策略确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代范围内具体查找,以获得文献线索。在具体的检索过程中,当结果中出现了太少(1000)的相关记录时,则需要对我们的检索策略进行调整和优化。5、获取原文信息检索的最终目的是获取有用的原始文献。原文获取的方式主要有以下几种:利用全文数据库直接获取。现在有许多全文数据库,通过检索均可直接获得原文。如“中国期刊全文数据库”、万方数据化期刊等。利用文摘数据库传递系统获取。利用OPAC检索系统,进行馆际互借。,优化检索效果的方法,一、提高查全率的方法(扩检让结果更多)降低检索词的专指度,如用上位词或相关词补充到检索式减少检索词,删去某个不重要的检索词外文单词进行截词检索,如用“plant*”,可检索planting、planted等放宽检索途径,全文主题摘要篇名/关键词放松或取消某些限定条件,如信息的类别、语种、年代范围等增加同义词或近义词,并用逻辑“或”将它们连接起来;二、提高查准率的方法(缩检让结果更少)缩小检索途径,全文主题摘要关键词篇名有些数据库还能限定期刊范围:全部期刊重要期刊
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石油库区管理办法
- 生产照明管理办法
- 盐酸液碱管理办法
- 特困资金管理办法
- 租借合同管理办法
- 硫酸储存管理办法
- 白事乐队管理办法
- 移民转款管理办法
- 疫情升级管理办法
- 源泉扣缴管理办法
- 2025新兴宠物用品市场洞察报告-大数跨境-202507
- 服务外包合同服务外包协议
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2018年最新房屋买卖合同(适用个人)(精品模板)
- 三年级数学《重量单位的换算口算题(共60道)》专题训练
- 《普通混凝土配合比设计规程》JGJ55-2011
- 夜市摊位租赁合同
- 2019初中英语教师选调进城考试模拟试题及答案(五套)
- 标识标牌施工组织设计
- 建筑施工现场安全警示(案例)教育.ppt
- 高纯高值材料制备技术PPT课件
评论
0/150
提交评论