信息检索第一章...ppt_第1页
信息检索第一章...ppt_第2页
信息检索第一章...ppt_第3页
信息检索第一章...ppt_第4页
信息检索第一章...ppt_第5页
免费预览已结束,剩余74页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索,王玲艳,课程的基础情况,课程的目标普及学生科技文献检索技巧推行研究生信息素养教育提高学科科学研究能力,Tags:信息检索素养教育,课程的基础情况,具体目标:有效发现和描述科研过程中的信息需求了解图书馆和Internet的资源与服务具备信息获取的方法与技巧培养信息的筛选与评价能力初步建立信息的管理、交流和利用技能,课程的基本情况,上课方式:讲授、上机考核方式:实习作业、专题报告、考试考勤10%、作业30%、考试60%教学网站:教材:于光,信息检索,电子工业出版社,北京,2010。花芳,文献检索与利用,清华大学出版社,北京,2009。孟连生,科技文献信息溯源,高等教育出版社,北京,2006。张文德,现代信息检索,福建科学技术出版社,福州,2012。赖茂生,科技文献检索,北京大学出版社,北京,1994。沈固朝,信息检索(多媒体)教程,高等教育出版社,北京,2002。,教学安排,绪论实体图书馆与网上图书馆的比较分析中文信息资源外文信息资源网络信息资源信息资源的综合利用,第一章绪论,科研与信息素养信息检索基础知识,一、科研与信息素养,信息素养科研与信息素养的关系做好科研需要什么样的信息素养?,1.1信息素养,信息素养(InformationLiteracy)1974年,保罗.泽考斯基PaulZurkouski向全美图书馆学和信息学委员会提交的报告中首次使用了IL的概念:“经过训练能够在工作中应用信息资源的人就能够被称作具备信息素养。他们学习了广泛应用信息工具和原始信息源来解决实际问题的技术(technique)和技能(skill)。”,Tags:信息源信息工具信息获取技能,1.1信息素养,信息素养(InformationLiteracy)1989年,美国图书馆协会IL主席委员会总结报告提出了IL的定义,是今天被最广泛地使用的定义:“为了具备信息素养,人们必需能够识别何时需要信息,能够查找、评价和有效地利用需要的信息从最根本上讲,具备信息素养的人是那些学会了如何学习的人。他们懂得如何学习,因为他们懂得知识是如何组织的,如何找到信息,以及如何以一种其他人能够向他们学习的方式利用信息。他们为终身学习做好了准备,因为他们总是能够为手中的任何任务和决策找到需要的信息。”,Tags:信息技术终身学习社会性,1.1信息素养,信息素养(InformationLiteracy)美国大学和研究型图书馆协会(2001)界定所需信息的范围有效地获取所需信息严格评价信息及其相关资源把所选信息融合到个人的知识库中有效地运用信息达到特定目的合法和合理地获得和利用信息一般而言,“信息素养”是表示一个人在信息社会“理解以及与外界做有意义的沟通所需要的能力”,“为终生学习奠定基础”。未来意味着“变化”(change),知识是不会保持静态的,我们的学生必须具备信息素养,始能成为终身的学习者,严谨而有创新能力的科研工作者。,11,ModuleundVariations_E,信息素养,1,2,3,4,信息意识,信息知识,信息道德,信息能力,1.1信息素养,认识信息的重要性对信息具有敏感性,认识和了解信息源信息术语信息工具,信息的价值观信息利用的道德与学术伦理,发现、获取信息评价、利用信息交流、传播信息,1.2科研与信息素养,但是,我们常走入这样的误区:“信息源是全文”找到了全文,就是找到了信息信息太多了,找几篇看看就行“信息检索是一种知识?”查文献很简单,不存在什么技能与知识“有了学科专业知识,就能做好文献评估与分析”我们也常有这样的困惑:信息多是好还是坏?爆炸、丰富、快捷、冗余、鱼目混杂?信息为我所用?我无信息可用?我为信息所累?我们依靠传统的或单一的方式获取信息:老师/师兄(姐)告诉我Google(Baidu)就是我的“图书馆”,1.2科研与信息素养,知识分成两类,一类是我们要掌握的学科知识;另一类是知道到哪里可以找到相关知识的知识。Knowledgeisoftwokinds.Weknowasubjectourselves,orweknowwherewecanfindinformationuponit.,塞缪尔约翰逊,1.2科研与信息素养,美国教育技术CEO论坛提出21世纪的能力素养包括5个方面:基本学习技能(读、写、算的能力)信息素养创新思维能力人际交往与合作精神实践能力,“信息素养需要培养和锻炼”,1.2科研与信息素养,信息素养是科研的基础能力之一我需我知明确个人的信息需求知道自己的信息需求明确表达信息需求我识我选能识别、会选择信息源问题:科研中有哪些不同类型的信息源?手到擒来掌握必要的信息检索技能按图索骥有效地获取信息源的途径火眼金睛评价和鉴别信息继承发展分析和利用信息遵规依法合理合法地利用信息,1.2科研与信息素养,意识引发创新,能力优化过程,信息意识,获取能力,分析能力,学习能力,交流能力,创新能力,1.3做好科研需要什么样的信息素养?,信息素养的标准标准1:有能力界定所需信息的性质和范围标准2:具备有效地获取所需要的信息的能力标准3:评估信息质量和来源,把有用的信息融合到你们的知识库和价值体系中标准4:能够有效地利用信息解决问题,实现特定的目标标准5:合理、合法利用信息,二、信息检索基础知识,1.术语信息文献信息检索文献检索,1.1信息,古希腊:报知,指天上的信使带给人间的消息。*汉语辞源:信息即消息“梦断美人沉信息,目穿长路倚楼台”,*维纳-“信息是人们在适应外部世界并使这种适应反作用于外部世界过程中,同外部世界进行交换内容的总称”*麦克卢汉-“媒介就是信息”*香农“信息是消除不确定的东西”,信息:信息是用文字、数据或符号等形式通过一定的传递和处理来表现各种相互联系事物在运动变化中所具有特征内容的总称。,1.2知识,知识是人类在认识和改造世界的社会实践中获得的对事情本质认识的成果和结晶。世界经济合作与发展组织(OECD)从知识使用的角度对知识进行了分类:事实性知识(knowwhat、when、where)原理性知识(knowwhy)技能性知识(knowhow)知道谁有知识(knowwho),1.3文献,定义:文献是以文字、符号、图形、声频、视频等手段将知识信息记录在各种载体上形成的物质实体。三个要素*要有一定的知识内容(灵魂)知识:人类对客观世界认识的成果和结晶*有用以保存和传递知识的记录方式如:文字、图形、符号、声频、视频等*要有记录知识的物质载体如:甲骨、纸张、软盘、光盘、磁带等,1.4情报,情报是一定目的,具有一定时效,经过发送由载体传递,能为感觉器官或感觉系统接收的情况的报导。钱学森-“情报就为了解决一个特定的问题所需要的知识”,信息、知识、文献、情报四者关系,知识对信息加工、吸收、提取、评价的结果,系统化的信息成为知识,知识记录下来成为文献,文献经传递并加以应用成为情报,情报体现了人运用知识的能力。,信息,知识,情报,文献,1.5信息检索,信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。它包括三个方面:数据检索、事实检索、文献检索,数据检索是以数据为检索对象,例如,查喜马拉雅山有多高,杭州六和塔建于何年等。事实检索是以事实为检索对象,例如:查某位科学家或工程师的简历,某同类产品中那种牌号的销量最大等。文献检索以文献为检索对象,例如“工业化住宅的系统工程”;“水产品及食品中微囊藻毒素高灵敏度色质联用快速检测方法研究”。数据检索、事实检索、文献检索三者中以文献检索为主。,1.6文献检索,检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。,二、信息检索基础知识,2科技信息资源的分布规律根据载体划分根据加工深度划分根据文献的编辑出版形式划分,2.1信息资源的分布规律载体形式划分,印刷型文献缩微型文献音像型文献机读型文献,2.2信息资源的分布规律加工深度划分,2.3信息资源的分布规律编辑出版形式,图书book,图书是对已发表的科研成果、生产技术和经验的总结性的概括论述。图书可分为三类:阅读性包括教科书、科普读物和一般生产技术图书工具性包括辞典、手册和百科全书等原始文献含有独创性内容的专著特点:系统性好、完整性好出版周期较长,报道速度相对较慢图书特征:著者、出版项(出版地、出版社名和出版年份)、ISBN图书作用:便于人们对某一课题的历史、现状及未来进行研究和探讨。978-7-121-10280-6,期刊journal,periodical,期刊:采用统一名称,定期或不定期出版的连续性刊物。特点:名称固定;有连续的卷、年月顺序号;出版周期短,报道速度快;数量大,内容丰富;期刊特征:ISSN、CN、年、卷、期卷、期Vol.2No.4V2N42(4)科技期刊两种主要形式学术型期刊检索型期刊作用:能及时反映各学科的发展水平及动向。,会议文献conferencepaper,会议文献:是指在各种学术会议上发表的论文(通称为proceedings)。特点:传递信息及时针对性强内容新颖会议文献特征:有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等出版形式:图书、期刊、科技报告、声像形式作用:是迅速获得最新技术信息的一个重要途径。,学位论文dissertation,学位论文:是著者为获得某种学位而撰写的论文特点:一般偏重于理论附有大量的参考文献借此可以看出有关专题的发展过程和方向学位论文一般不出版发行,而是保存在授予学位单位的图书馆里。,专利文献patentdocument,专利文献:是一切与专利制度有关的专利文件的统称。如:专利申请书和专利说明书。专利说明书是公开的文献,但只能由各国专利局发行,反映了当前最新的技术成果。申请专利三个条件:新颖性、创造性和实用性中国专利类型:发明专利、实用新型专利、外观设计专利,标准文献standard,标准文献:是对工农业产品和工程建设的质量、规格及其检验方法所做的技术规定,是从事生产、建设的一个共同技术依据,有一定的法律约束力。反映了当时的技术工艺水平及技术政策。标准文献的特点是:有标准号。标准号由三部分组成:标准颁布机构代码+顺序号+颁布年份例如:GB2683-98标准颁布机构代码顺序号颁布年份,科技报告,technicalreport是关于某项科学研究成果的正式报告,或是对研究和试验过程中各阶段进展情况的实际记录。特点:每份单独成册,有专门的编号内容专深具体报导比期刊早保密或控制发行作用:能代表一个国家和专业的发展水平与动向。,PB民用工程报告AD军用工程报告NASA航空航天报告DOE能源报告这四大报告每年公开和解密部分约6万件。,世界上著名的科技报告是:美国政府的四大报告,即,政府出版物,governmentdocument政府出版物:是各国政府部门及其所属机构颁布和出版的文件资料。内容主要分为行政性文件(如法令、统计等)科技文件两大类。作用:对了解一个国家的科技和经济政策及其演变情况有一定的参考价值。,产品资料,指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品技术资料一般向厂商直接索取。作用:产品资料是人员选型、设计和引进国外设备仪器有价值的参考资料。,技术档案,是指生产建设和科学技术部门在技术活动中形成的。对技术人员有重要的使用价值技术档案的特点:真实性、保密性、准确性,二、信息检索基础知识,3信息检索语言信息检索语言就是信息组织与信息检索时所用的语言,也称文献检索语言、情报语言。,3信息检索语言的类型,检索语言,特征的语言描述文献外部,特征的语言描述文献内部,题名语言,著者语言,号码语言,分类语言,主题语言,3.1分类检索语言-体系分类法,体系分类法是一种直接体现知识分类的等级概念标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。它提供某学科、专业的集中文献。类型:中图法科图法资料法人大法,中图法,5大部类22个大类总论复分表,R,S,T,医药、卫生,农业科学,工业技术,社会科学,自然科学,综合,中图法展开图,经济类,工业技术的二级类为:,T工业技术TB一般工业技术TL原子能技术TD矿业工程TM电工技术TE石油、天然气工业TN无线电电子学、电讯技术TF冶金工业TP自动化技术、计算机TG金属学、金属工艺TQ化学工业TH机械、仪表TS轻工业、手工业TJ武器工业TU建筑科学TK动力工程TV水利工程,工业技术的三级类为,级级派生,同位类,类号,类目,上位类,下位类,层层隶属,从简单到复杂、从低级到高级、从重要到次要、从理论到应用、从一般到个别,总论复分表,-43教材-44习题表-52全集、选集-53论文集、会议录-54年鉴、年刊-61名词、词典、百科全书(类书)-62手册、指南、一览-64图册、数据例如:哲学辞典的号码是B-61,图书分类举例,三级考试应试过关30练,B类/匡松主编.TP3-44/36索书号=分类号+作者号ABCDEFGHIJKLMNOPQRSTUWXYZ0123456789,3.2主题法检索语言-标题法语言,标题法语言经过词汇控制,用来标引信息资源的词或词组,通常为比较定型的事物名称。如:“图书”、“信息资源”、“信息检索”等。标题法还采用了大量复分标题,如:水果病虫害;音乐奥地利等。,叙词语言,叙词,国内也称为主题词,是从自然语言中精选出来的、经过严格处理的做为文献主题标识,通过概念组配方式表达文献主题的主题法类型。汉语主题词表是目前我国使用最广泛的叙词表。,中科院汉语主题词表标引检索系统,中科院汉语主题词表标引检索系统,关键词语言,关键词(Keyword)是指从文献的标题、文摘以及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。关键词是标示文献关键主题内容,但未经规范处理的主题词。如:关键词“原子能”(其规范的主题词是“核能”)关键词“信息检索”(其规范的主题词是“情报检索”),二、信息检索基础知识,4计算机检索的基本技术布尔逻辑检索截词检索位置检索字段限定检索(fieldlimiting),4.1布尔逻辑检索,是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。逻辑运算符有三种:与(AND)、或(OR)、非(NOT),布尔逻辑算符,逻辑与:逻辑运算符:“AND”、“*”逻辑表达式:A*B、AANDB语义表示:被检索的文献记录中同时含有A和B两个概念“同时包含”关系,表示数据库中既含有A概念又含有B概念的文献才被命中,其作用是缩小检索范围,提高查准率。,布尔逻辑算符,逻辑或:逻辑运算符:“or”、“+”逻辑表达式:AB、AORB语义表示:被检文献中同时含有A或含有B以及两词概念都包含。“分别包含”关系,要求检出文献中包含概念A或概念B或同时包含概念A和概念B,其作用是扩大检索范围,增加命中文献数。,布尔逻辑算符,逻辑非:逻辑运算符:“not”、“-”逻辑表达式:AnotB、AB语义表示:被检文献中含有A而不含有B概念。“排除其他”关系,要求在检出的包含概念A的文献中去掉含有概念B的文献,其作用是缩小检索范围,布尔逻辑算符,可以使用括号改变执行顺序。如果一个提问式中有多个逻辑算符,则它们的执行顺序是:NOT、AND、OR。,4.2截词检索,截词检索是针对由于近义词、同一词根、单复数等原因,造成对检索词列举不全形成漏检现象而提出来的特殊检索技术。截词技术可以作为扩大检索范围的手段。截词符:?、*?表示有限截词,*表示无限截词,后截断:最常用的截词检索技术,它将截词符号置于一个字符串右方,表示其右面的有限或无限个字符不影响字符串的检索,也称为右截断。前截断:它将截词符号置于一个字符串左方,表示其左面的有限或无限个字符不影响该字符串的检索,也称左截断。从检索性质上讲,前截断是后方一致检索。,中间截断:它将截词符号置于一个检索词的中间,表示这个位置上的有限个字符的异同不影响该检索词的检索,也称为屏蔽。它对于解决英、美不同拼法、不规则的单复数变化等很有用。如:wom?n,(woman、women)前后截断:它是将截断和后截断结合使用,例:,1-6,1、2、7,1、2,1-9,2、7,4.2、截词检索,前方一致(前方匹配)例:comput?后方一致(后方匹配)例:?computer中间一致(模糊匹配)例:?comput?完全一致(精确匹配)例:computer,4.3位置检索,位置检索又称邻近检索,用位置算符表示检索词之间的位置邻近关系。常用的位置算符:(W)(nW)(N)(nN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论