网络信息资源及相关知识概述ppt课件_第1页
网络信息资源及相关知识概述ppt课件_第2页
网络信息资源及相关知识概述ppt课件_第3页
网络信息资源及相关知识概述ppt课件_第4页
网络信息资源及相关知识概述ppt课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/5/7,1,网络信息检索与论文写作,2019/5/7,2,学习目标,本课程目的在于使学生具有掌握知识情报的意识,具有获取与利用文献的技能。以此作为培养学生自学能力和独立研究能力的重要环节。,2019/5/7,3,自学能力的培养,学习首先是获取信息的过程,转变学习观念:学习是开放学习,主动学习,个性化的学习。 学习首先要构建学习内容的信息采集系统。这里的学习信息采集系统分层架构: 一是构建专家人脉资源,专家人脉资源采集就是逐步了解跟进与个体学习兴趣或专业研究相关的领域前沿专家,了解他们研究方向、动态、思想体系。 二是构建专业学科知识结构,专业学科知识结构构建,就是要通过学科课程、专业杂志、相关协会等构建领域的知识框架。 三是捕获泛在的网络信息资源。网络信息资源就是通过互联网络选择自己感兴趣的社群、网站等以获取最新的信息。在逐步构建学习内容的信息采集系统的过程中,就要形成信息采集系统的知识地图,并采用一定的形式对其进行管理,以保持动态更新。,2019/5/7,4,学习内容,本课程主要包括两大部分内容:1信息资源检索与利用。2学术论文的写作。 第一部分信息资源检索与利用。着重介绍基于因特网的数据库和网上各类学术性电子资源检索利用的方法,让学生系统了解和较为熟练地掌握各类网络资源的浏览与收集的方法及技巧,并能简单地整理和分析所检索的结果。 第二部分主要帮助学生了解学术论文写作的基本知识,包括学术论文各部分的写作要求与写作方法,学术论文的选题以及学术论文写作的常见问题等等。,2019/5/7,5,学习方法,课堂讲授和上机实习相结合 1.平时成绩占40%, 考试成绩占60%。 2.平时成绩包括实习成绩与上课考勤情况。,2019/5/7,6,参考教材,1. 王日芬等编著,网络信息资源检索与利用 东南大学出版社. 2. 张帆等,信息存储与检索高等教育出版社 3. 可以借阅:G252.7或G354 情报检索类的书。,2019/5/7,9,一、信息的涵义和种类,1信息的涵义 信息:是物质的一种基本属性。它是自然和人类社会中一切事物自身运动状态与方式,是事物的内在联系和含义的表征(本体论)。信息是认识主体所感知或所表述的事物运动的状态与方式(认识论)。这一含义告诉我们要获得信息,必须具备一定的认识能力,其中包括信息意识,信息查找技能、信息组织能力和信息分析评论能力。,2019/5/7,10,知识:是人类实践经验的总结,是人的主观世界对客观世界的如实反映和概括,是认识的结果。知识是信息的一部分,是由信息提炼,转化而成的是经过人类认识,挑选,系统和深化了的信息。 获取知识的途径有两种:一是直接来源于产生信息的客观事物。二是通过信息载体或媒介。获得的信息能否转化为知识,转化的是否充分、完整,取决于接受主体的认知能力。一个人要获取知识,必须阅读文献,掌握相关的思想、事实、理论和方法等信息,在此基础上进一步分析、综合和分析,才能有所创新,2019/5/7,11,信息素质指从各种信息源中检索、评价和使用信息的能力。信息素质的内涵具体包括能意识到准确和完整的信息是决策的基础;了解信息需求及问题所在;制定信息检索策略;掌握信息检索技术;能评价信息;能根据实际用途组织信息;使用信息,将新信息融会到现有知识结构中。 美国图书馆协会信息素质教育委员会在1989年年终报告中指出,具有信息素质的人也是具备终生学习的能力,应为他们不管碰到什么问题或做什么样的决定,都能够发现必要的信息。,2019/5/7,12,2信息的种类,(1)按信息所依附的载体,可分为文献信息、 口头信息和电子信息。 (2)按信息产生的客体性质来分类,信息还可 分为自然信息、社会信息等。,2019/5/7,13,网络信息资源,是指通过计算机网络可以利用的各种信息资源的总和。目前世界上最大的现代化信息网络是Internet,随着Internet的普及,因特网上的信息资源成为被广泛存取与利用的资源,因此,我们也可以将网络信息资源理解为“通过因特网可以利用的各种信息资源”。 因特网信息资源的特点:信息资源丰富多样;利用不受时空限制;信息传递快捷;查询信息方便;平等性;交互性;共享性;能获取最新资料; 稳定性差,变化频繁;局部有序性与整体无序性;信息质量参差不齐,价值不一。,二、网络信息资源概述,2019/5/7,14,2、网络信息资源的类型,(1)根据网络传输协议不同,可分为:Web信息资源 、 Telnet信息资源 、FTP信息资源 、Gopher信息资 源 、用户服务组信息资源等。 (2)根据人类信息交流方式不同,可分为:非正式出版 信息 、半正式出版信息 、正式出版信息 。 (3)按信息发布方式不同可分为 :邮件型、电话型 、揭 示板型(公告牌型) 、广播型 、图书馆型、书目、 型 、交互型信息资源 。 (4)按正式出版物类型可分为:电子图书、电子期刊、电 子报纸。,2019/5/7,15,第二节 三峡大学图书馆数字资源简介,访问图书馆的几个途径 1、 2、 3、5 4、,2019/5/7,16,第三节 信息检索的基本原理,信息检索是信息资源利用的重要环节。信息检索(Information Retrieval)是用户根据特定的需求,借助某种检索工具,采用一定的检索策略和方法,从待检的信息源或信息集合中查找所需信息的过程。,2019/5/7,17,信息检索的类型,由于用户的需求不同,信息检索的发展呈现多种不同的类型: (1)按检索的信息类型划分:文献检索(例如查找2005年 我国关于环境保护研究方面的文献)、数据检索(例 如查找2005上半年年我国GDP增长率)、事实检索 (核酸在人体代谢中的作用) (2)按检索系统中信息的组织方式划分:全文检索、多媒 体检索、超媒体检索(含有超文本的多媒体文献检索) (3)按信息检索方式划分:手工检索、计算机检索,2019/5/7,18,计算机检索的发展阶段,1. 脱机信息检索的阶段(1954-60年代中期) 2. 联机信息检索的阶段(20世纪60年代中期 至今) 3. 光盘信息检索的阶段(80年代中期至今) 4. 网络信息检索的新阶段(20世纪90年代至 今)以网络为平台的计算机检索。,2019/5/7,19,信息检索的基本原理,信息检索就是将特定的用户需求进行主题分析,使这形成能代表用户需求的概念,并通过信息检索语言的规范进行概念转换,然后与检索系统或检索工具中的信息资源线索进行异同的比较与匹配,选取两者相同或部分相符的信息资源予以输出。,2019/5/7,20,信息检索的原理图,2019/5/7,21,计算机检索的工作过程,计算机检索工作过程: 输入检索提问标识 倒排文档(与数据库标引标识进行比较匹配) 顺排文档(根据记录号) 输出结果 。 (结果不理想时要进一步修改检索提问标识),2019/5/7,22,顺排文档、倒排文档,顺排档(Linear File),它也称为主文档(Main File)、引文文档(Citation File), 它是按记录存取号的大小顺序排列记录而成的文档。 倒排档(Inverted File)倒排档是按记录中的可检字段的某种顺序排列的文档。倒排文档的编制方法:将文献记录中的特征标识(如主题词、作者、自由词、出版年等)抽出来作为款目词,如以“电子商务”为主题的倒排文档为:,电子商务 1002,3378,4421(所有主题词字段包含电 子商务的文献记录在顺排文档中的记录号),2019/5/7,23,2.信息检索语言,检索语言就是把信息存储与检索,把信息检索人员与用户之间进行交流的媒介。 目前检索语言按表述信息内容特征划分为分类语言和主题语言。常用的分类语言如等级体系分类法(简称分类法)。主题语言是直接用代表信息主题概念的主题词作为信息的标识的一种检索语言,为那些不懂人工语言的网络用户提供了极大的便利。常用的主题语言有标题词语言、关键词语言和叙词语言。,2019/5/7,24,信息检索系统一般有两种使用分类法的做法: 一是采用国内外常用的分类法,如中国图书馆分类法、中国科学院图书馆分类法、美国国会图书馆分类法(LC分类法)、杜威十进分类法(DC分类法)、国际十进分类法(UDC分类法)等。 二是根据信息检索系统的特点自行编制的分类法,如搜索引擎Yahoo!就是采用自身编制的等级式主题指南分类法。,2019/5/7,25,第四节 网络信息检索的技术,信息检索技术是应用于用户提问与所收集的文献集合之间的匹配比较的技术。信息检索经历了手工检索、脱机检索、联机检索、光盘检索基于Internet的网络检索,从开始的基于关键词检索,发展到基于概念的检索,再到基于内容的检索。当然目前绝大多数中文检索仍停留在关键词检索阶段,运用的是关键字匹配算法,效率低检索精度差。,2019/5/7,26,概念匹配与文字匹配,概念匹配: 计算机 微 机 计算机 电 脑 PC 机 文字匹配:计算机 计算机 PC机 PC机,电 脑 电 脑,2019/5/7,27,1布尔逻辑检索技术,布尔逻辑检索是一种比较成熟、流行的检索技术,布尔逻辑检索的基础是逻辑运算,规定检索词之间的逻辑关系. 主要的逻辑算符有三种,分别是逻辑或(OR)、逻辑与(AND)、逻辑非(NOT),2019/5/7,28,(1)逻辑“或”OR或+,表示方法:A OR B 或 A+B,表示要检索含有A、B词之一或同时包含AB两词的文献,如下图阴影部份为检中文献 适用场合:主要用于并列关系的概念组配,扩大检索范围,防止漏检。,2019/5/7,29,布尔逻辑算符逻辑“或” 例如:查找有关“计算机”的相关文献 检索策略: 分析:计算机 电脑 逻辑关系:逻辑或 中文库:计算机OR电脑,2019/5/7,30,(2)逻辑“与” AND或*,表示方法:A AND B或者A*B,表示要找出同时含有这两个词的文献集合,如下图阴影部分为命中文献。 适用场合:主要用于交叉概念或限定关系概念之间的组配,可以缩小检索范围,提高检准率。,2019/5/7,31,布尔逻辑算符逻辑“与” 例如:查找有关“计算机文献检索” 的相关文献 检索策略: 分析:计算机 文献检索 逻辑关系:逻辑与 中文库:文献检索 and 计算机,2019/5/7,32,(3)逻辑“非” NOT或-,表示方法:A NOT B或A - B,表示要找出含有检索词A而不含检索词B的文献 适用场合:用于排斥与选择关系的组配,也是缩小检索范围的措施,2019/5/7,33,布尔逻辑算符逻辑“非” 例如:查找有关“硬件”而非“软件”方面相关文献 检索策略: 分析:硬件 软件 逻辑关系:逻辑非 中文库: 硬件 NOT 软件,2019/5/7,34,注意 1. 布尔逻辑算符执行的优先顺序为NOT、AND、OR,当然有括号时,括号最优先,括号又称为优先符。 2. 大多数的检索系统都支持布尔逻辑检索,但表现形式不尽相同,有的用大写,有的用小写,有的大小写均可,有的以符号代替,有的直接把布尔逻辑算符隐含在菜单中。,2019/5/7,35,2截词检索,截词检索是指在检索标识中保留相同的部分,用相应的截词符代替可以变化的部分。截词符为“?”或“*”。 截词法有前截断、中截断或后截断。 前截断 后方一致检索: 例如键入检索词“?computer”,那么计算机进行匹配时,索引词“minicomputer,microcomputer等均算命中。,2019/5/7,36,后截断前方一致检索 例如键入检索词“computer?”,可以检索出含有computer开头的文献,如computers,computerize,computing,computerization等。 中截断中间一致检索 例如键入“?computer?”可以命中包含该字根所有索引词,如minicomputer,microcomputer,computers,minicomputers等。,2019/5/7,37,截词检索适用于自由词检索,特别是那些具有单、复数不同表现形式,有美、英拼写差异或词尾变化形式的检索词,减少检索词的输入量,扩大检索范围,提高查全率。 需要注意的是,截词检索可能检索出大量无关资料,针对这种情况,有些计算机检索系统规定了右截断的限度。,2019/5/7,38,3字段限制检索,字段限定检索是一种将检索词限定在某一特定的字段范围内的检索方法。字段分为两种:主题字段(题名、主题词、文摘等)、非主题字段(作者、文献类型、语种、出版年份等) 例如:在DIALOG系统中,“TI”代表题名,“AU”代表作者,用字段加代码实现检索。 利用后缀符对主题字段进行限制:Laser/ti,de,ab 利用前缀符对非主题字段进行限制:AU=peter;DT=periodical;PY=200?等。,2019/5/7,39,基本字段: 字段名称 字段代码 文摘(Abstracts) AB 题目(Title Word) TI 主题词(Descriptor) DE 标识词(Identifier) ID,2019/5/7,40,常见的前缀代码及其所限定的字段名称,前缀代码 所限定的字段名称 AU =author(著者) CS =corporate source(著者所属机构) DT =document type(文献类型) JN =journal name (期刊名称) CO =company(公司) CC =classification code(分类号) SO =source publication(来源出版物) LA =language(语种) PY =publication year(出版年) UD =update(更新日期) SP =conference sponsor(主持单位),2019/5/7,41,4位置检索,位置运算符:用于指明检索项在记录中的位置关系的符号。在实际检索中,为提高查全率和查准率,往往需对检索词之问的位置关系加以限定,因为用不用位置逻辑算符和用什么样的位置逻辑算符,所得出的检索结果、查准率都各不相同,2019/5/7,42,常用的位置逻辑算符:(W)与(nW)、(N)与(nN)以及(X)与(nX )三类。 (W)要求检索词A紧挨着检索词B,之间除可以有一个空格 或有一个标点符号,或一个连接号外,不得夹有任何 其他单饲或字,并且顺序不得颠倒。 (nW)由(W)引申出来,其唯一区别是词A与词B间最多嵌 入几个词。 (N)要求检索词A与检索词B必须紧密相连,其间不允许插 入任何单词或字母,但词序可以倾倒。 (nN)和(N )的唯一区别是在词A和词B间最多可以插入n 个单词。 (X) 要求其两侧的检索词完全一致,并以特定的顺序相 邻,中间不允许插入任何单词或字母。 (nX)和(X)的唯一区别是两检索词之间最多可以插入n个 单元词。,2019/5/7,43,例如 building(w)construction 可命中 building construction;building-construction information(1n)retrieval 可命 information retrieval; information and retrieval;retrieval of information,2019/5/7,44,5. 全文检索,全文检索,也称为任意词检索。 在全文数据库中,任意字、词和字串都有检索意义,都可以用来对整个数据库进行全面匹配查找。 对全文数据库检索的结果可以是信息全文,也可以是信息中的某个词,某个字串的出处,或所在句,段的上下文。,2019/5/7,45,第五节 信息检索一般步骤,第一步:分析检索课题 第二步: 选择数据库或网络检索工具 第三步:提炼检索词,制定检索式 第四步:检索策略构成和调整 第五步:检索结果输出,2019/5/7,46,第一步:分析检索课题,明确检索目的,从而确定检索需求 。 检索目标: 解决技术疑难需较高查准率; 开题调研、成果查新需较高查全率; 探索性查准率和查全率不一定很高要求 检索要求: 学科、文献类型及语种、年代、篇数和检索费用,2019/5/7,47,1对于大学生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。,2019/5/7,48,2Internet网上虽然有一些较好的资源,但是与专业的网络数据库来比,无论是质量还是数量上都有很大的差距,检索文献目前来说最主要的来源还应是专业数据库,即正规的出版物上发表的文献。仅用搜索引擎来查找文章 是非常不可取的。,2019/5/7,49,3不要忽略摘要数据库,虽然检索摘要数据库不能马上得到全文,但是摘要数据库的数据量大,范围广,是查找文章线索极好的检索工具。就目前的情况而言,不可能全部都能得到电子版的全文,先找到文章线索再根据线索查找印刷版的全文是一项不错的组合。,2019/5/7,50,第二步:选择数据库或网络检索工具,选择合适检索工具的前提是对网络资源有一个较全面的、清晰的了解,具体地说要对检索工具的类型、内容特点、时间范围、学科范围、甚至出版商的大体情况都要有一个了解。 方法:1、注重平时的积累 2、不要盲目检索,应养成检索前了解一下数 据库的习惯 3、注重与他人的交流 4、重视图书馆主页的资源,2019/5/7,51,第三步:提炼检索词,制定检索式,检索词是用来描述检索课题的简洁、概括性词语。 注意事项 : 1.要提炼关键的、核心的词作为检索词,去掉意义太泛或“无所谓有”的词。 例如检索: “从更宽阔的视野观察和思考冶金反应工程学的问题。” 去掉不具有检索意义的虚词及无专业所属的通用概念 检索词:冶金 反应工程学,2019/5/7,52,2. 检索词尽可能使用词或词组,然后用布尔逻辑运算符 将检索词连接起来,切忌将整个题名输入到检索框中。 3. 有时不需要死抠文字,意思匹配即可 例如检索: 智能机器人控制系统的研究 控制 控制系统 控制理论 控制方法 控制器 所以将“控制”作为检索词即可,2019/5/7,53,4. 有时要注意隐含主题的揭示. 隐含主题需经过分析,推理得到. 如:“人力泵”这个课题。人力泵是题目中已有的词,称显性主题。表达人力泵的概念,还有手摇泵、脚踏泵等,手摇泵、脚踏泵就是隐含主题词,检索词应包括隐含主题。 因此,要弄清课题实质及用户的真实需求。,2019/5/7,54,5. 要避免漏检 如:忽略了同义词,或同一个词的多种表达,有可能造成漏检 。 同义词:自行车单车 脚踏车 airplane aircraft plane 专有名词的固定表达: SPS(spark plasma sintering)放电等离子 NC(numerical control)数字控制 中英文混用:网络数据库web数据库 代理技术agent技术,2019/5/7,55,避免漏检的方法: 1)将同义词等列出来,然后用布尔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论