知识发现与信息检索.ppt_第1页
知识发现与信息检索.ppt_第2页
知识发现与信息检索.ppt_第3页
知识发现与信息检索.ppt_第4页
知识发现与信息检索.ppt_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知识发现与信息检索,张小云 2004年9月1日 Tel:7885491 Email:,2,课程目标,面对日益增长的Internet的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息,并综合成章。 这就是本课程所希望解决的问题。,分三部分:,1.知识发现 2.信息检索基本概念 3.信息检索,4,第一部分:知识发现,5,知识经济时代,知识、知识创新与知识资源利用问题引起社会的高度关注。 知识成为经济社会发展的首要资源,是衡量国家能力的主要因素。知识作为一种创造财富的战略资源,随着现代信息技术和国家信息化进程的迅速发展,以及科技、文化的进步在经济发展竞争中作用日益增强,人们对获取知识的能力和利用知识的水平得到了空前的提高。,5,1知识发现,6,伟大的科学家牛顿说过:“假如说我比别人看的略微远些,那是因为我站在巨人的肩膀上。”,6,1知识发现,7,塞缪尔约翰逊(Samuel Johnson)说:知识分成两类: 一类是我们要掌握的学科知识; 另一类是要知道在哪儿可以找到有关知识的信息。 Knowledge is of two kinds. We know a subject ourselves, or we know where we can find information upon it .,1知识发现,8,知识资源利用创新必然成为知识资源的高度共享乃至整个国家信息化发展战略的重要组成部分。 美国和西方发达国家均视其知识为国家发展的重要战略资源。 我国将“发展国家知识与创新体系”、“强化信息资源共享”作为基本国策,充分体现了这一战略资源及其知识资源共享的重要战略意义。 必须大力提高人们获取与利用知识的能力,在更大程度上、更大规模上、更大范围内实现知识资源的高度共享,充分满足人们在知识创新过程中对知识的需求。,8,1知识发现,9,传统文献信息资源的数量庞大,类型多样,但开发利用是有限的。传统的文献资源共享主要是信息物质载体的共享,即文献的共享。这种共享由于受共享交易成本的限制,只能是在一定时间、空间范围内有限的共享。,9,1知识发现,10,现代计算机技术、网络技术的发展,改变了人们获取、利用和交流知识的方式,打破了知识信息传递的时空限制,使知识信息的交流、获取形式更为生动和直观,为知识信息服务提供了崭新的信息环境,开辟了知识资源无限共享的新天地。,10,1知识发现,11,网络信息技术加快了知识的传送,拓展了知识领域的广度。网络环境下信息和知识服务已不再局限于一个固定建筑实体形态,其服务边界不断扩大并日益模糊化,知识提供与传播形式呈现多向性、共享性、交互性、实时性等特点,社会知识需求的复杂性日益增加,查询、利用知识信息的手段趋于计算机化、网络化。,11,1知识发现,12,知识的获得、组织与传播,通过异地共享和远程传播越来越显示出无比的优势。基于计算机网络的快速、虚拟知识空间,可构建一个具有扩展和辐射能力的开放化、立体化的知识资源共享保障服务系统。在这种现代技术网络环境之中,可最大限度地满足人们对知识信息的无时空障碍的知识需求,实现知识资源共享所应达到的一种高级境界。,12,1知识发现,13,为了使人们进入网络环境下知识资源高度共享的境界,多年来国内外专家、学者和企业在知识资源共享方式的设计和服务技术的实现上不断改革创新,陆续推出了不少新的知识产品和服务技术与模式:,13,1知识发现,14,知识挖掘、个性化服务、知识可视化等。 “知识服务”理念,成为当今知识资源共享模式设计的核心指导思想。在这种共享模式之下,人们从知识资源中获取的不仅仅是一条条信息,而是一个个针对特定问题的解决方案,即知识。 这样的知识资源共享方式,已经成为现代知识服务业所追求实现的高级境界。 *,14,1知识发现,15,基于 “知识元”水平上的全文关联的、数据结构标准化的、人与资源可实时以多媒体信息交互的知识服务平台,无论数据库的物理位置何在,无论数据库专业性质和具体结构如何,都可使其在知识信息的内容上跨越数据库界限而浑然成为一体。人们在这个平台上可以用平台的各种个性化服务手段,从所有数据库中任意获取所需要的知识信息,并可在人与人的交流互动过程中得到新的知识。,15,1知识发现,16,第二部分:信息检索基本概念,17,信息,知识,文献,2信息检索基本概念,18,21 信息 定义物质存在的一种方式,一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。 (*注:中国情报与文献工作词汇基本术语(GB48944-85)有关信息的定义。,2信息检索基本概念,19,信息的概念十分广泛,围绕信息而出现的信息资源、信息技术、信息系统、信息产业、信息化社会和社会信息化等相关术语不胜枚举。那么,什么是信息,至今仍无确切、统一的定义,站在不同的角度旧有不同的理解或解释。,2信息检索基本概念,20,信息既不是物质,也不是能量,而是依附于自然界客观事物而存在,只要有物质存在,就有表征其属性的信息。,20,2信息检索基本概念,21,信息的概念,实际上就是客观事物运动状态、时空特征、能量大小、质料系统特征、相互联系方式等一切反映事物客观属性的总称。从这种意义上看,信息比客观事物的属性更具一般性与普遍性。,21,2信息检索基本概念,22,信息概念的实质在于它以某种编码形式储存或传输于某种介质之中,如储存在书本、纸张上的文字信息,记录在唱片、录音带上的声音信息,印制在画报、照片、录象带上的图像(形)信息,计算机系统种的信息系统各种数字、数据信息等。,22,2信息检索基本概念,23,例子:据说上古时期,诺亚的方舟在洪水中飘荡许久,当放出的飞鸽衔回一束橄榄,意味着带回了洪水已退的信息。,23,2信息检索基本概念,24,从自然界角度看,表征物质的属性:地球昼夜的变化是一种信息,它反映出地球绕太阳自转的运动特性和状态;山的高度是一种信息,它反映出山的空间特性;树干的年轮是一种住处它反映了树木成长的时间特性树龄等等。,24,2信息检索基本概念,25,1)按信息的加工程度划分 l 零次信息资源指尚未被记录下来,只是通过口头携带和传播的信息资源。零次信息资源的出现和传递带有极大的偶然性。其特点是鲜活、生命力旺盛。 l 一次信息资源 指经加工或粗略加工的原始信息资源,如正在研究或创造过程中产生的信息,包括会议记录、论文报告、统计报表、专利等。其特点是比较零散,系统性不强,半包括所有的主要内容。 l 二次信息资源指在一次信息资源基础上加工整理而成的信息资源,如文摘、索引、目录等,它们是引导和使用一次信息资源必不可少的工具。 l 三次信息资源通过二次信息资源提供的线索,对某范围内的一次文献进行分析、研究加工而成的信息资源,亦称三次文献,包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。,25,2信息检索基本概念,26,2)按信息表现形式划分 文字信息 图像信息 数值数据信息 语音信息,26,2信息检索基本概念,27,信息交流渠道: 正式渠道:信息是指由正式组织发布并经由正式组织渠道向外传播,如官方新闻发布会、正式报告、国家统计部门发布统计信息等。 非正式渠道:非正式渠道信息指从正式渠道以外获取的信息。,27,2信息检索基本概念,28,2.2知识 是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。提供某种经过思考的判断和某种实验的结果。,28,2信息检索基本概念,29,知识的来源: 第一类是直接源于产生信息的客观事物; 第二类是通过信息载体或媒介(文献、电视、广播、他人等)的传递、交流而间接获得。,29,2信息检索基本概念,30,据经合组织(OCED)出版的以知识为基础的经济报告对知识的分类: 1)“知事(Know-what)”,关于事实方面的知识,可理解为Know-when、Know-where;即在什么样的时间(Know-when)、什么样的地点或条件下(Know-where)能解决什么样的问题; 2)“知因(Know-why)”,自然原理和规律方面的科学理论,知识生产是在专门研究机构如实验室和大学完成的; 3) “知道怎样做的知识(Know-how)”,做某些事的技艺和能力,称为技术情报和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术; 4) “谁以及是怎样创造知识的(Know-who)”侧重创造思想、方法、手段、过程以及特点等的了解。,30,2信息检索基本概念,31,2. 3文献 记录有知识的一切载体。 权威的定义主要 1)是文献情报术语国际标准(草案)(ISODIS5127):“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。这种附着在各种载体上的记录统称为文献。” 2)国标:各种媒介和形式的信息集合,包括文字、声像印刷品、电子信息、数据库等。,31,2信息检索基本概念,32,1)按文献出版类型划分 a图书 b期刊 c政府出版物 d科技报告 e专利文献 f会议文献 g学位论文 h技术标准和规范 i产品样本说明书 j技术档案,32,2信息检索基本概念,33,按文献的存储载体分: 印刷型 缩微型 声像型 电子型,33,2信息检索基本概念,34,文献的构成要素 : A、文献信息是文献的内容 B、符号系统是信息的携带者 C、载体是符号赖以依附的“寄主” D、记录方式是将文献的符号进入载体的方法和过程,34,2信息检索基本概念,35,35,2信息检索基本概念,36,知识是有组织的大量的信息,获得知识有赖于获得信息; 信息是知识得以形成和传播的中介,而不是知识本身,知识是经过精心研究、领会后的有用信息,是人类对信息加工处理后的产物 。,36,2信息检索基本概念,37,第三部分:信息检索,38,3.1概述 3.1.1信息检索概念 信息检索Information Retrieval / Access:是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。从原理上看,它包括存储与检索两方面。 *,38,3信息检索,39,文献检索原理是:将检索提问标识与存贮在检索工具中的标引标识相比较,两者一致或信息标识包含着检索提问标识,则含有该标识的信息就从检索工具中输出; 对信息的著录是按一定规则对信息的外表特征和内容特征加以简单明确的表述,信息的标引是对其内容按一定的分类表或主题词表给出分类号或主题词; 检索过程则是按同样的主题词表或分类表及组配原则分析课题,形成检索提问标识,根据检索工具所提供的检索途径,从信息集合中查找与检索提问标识相符的信息特征标识的过程。(如下图),39,3信息检索,40,3信息检索,信 息 源,信息 的选 择与 收集,信息 特征,标 识 语 言,检索工具 匹配 检索式 提问,检 索 结 果,数据库,用 户,信 息 需 求,检索 提问,检索 提问式,41,What ? Where ? How ?,42,检索是信息组织的反变换过程。信息组织的目的是将零散的信息组成一个有序的体系,检索的目的则是迅速从这个体系中搜寻所需的信息。,3信息检索,43,信息检索分类 1)按存储和检索的内容划分为: 文献信息检索 数据信息检索 事实数据检索 Reference book Database: Numeric Database (数字) Property Database (特性) Textual-numeric Database(文本数字) Full-text Database(全文) Terminological Database(专业) Graphic Database (图形). *,43,3信息检索,44,对应于信息检索方法的操作主体,检索方法可分为: 手工检索; 机器检索。,3信息检索,45,信息检索特征: 1)有确定的目标; 2)有一个可能的信息解的集合; 3)有一定的线索(即启发信息); 4)搜索过程是针对一定的目标、遵循一定的线索,不断缩小搜索范围的求解过程。,45,3信息检索,46,从信息资源管理的角度讲,信息检索是从已存储的信息资源中检索出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程的总和,以文献检索为本源。,46,3信息检索,47,也就是说,这是一种从大量集合的文献中查找出主题及其属性符合用户要求的情报过程。查找的对象不一定就是文献,有时也可能是正在研究中的项目,或正在进行某项工作的人员与机构,或图书馆的藏书目录等,但基本原理是一致的。,48,信息检索能力(信息技能): 寻求有关新知识的能力 具体表现为以下6种技能:,48,3信息检索,49,1)明确任务(Task Definition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急; 2)信息查询策略(Information Seeking Strategies):了解各种信息源,能够作出评价并确定优先查找的次序;,49,3信息检索,50,3)查找和检索(Location and Access):确定信息藏址,从信息源中找出信息; 4)信息利用(Use of Information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值;,50,3信息检索,51,5)信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等); 6)信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。,51,3信息检索,52,检索者一方面要弄清文献的组织编排方式,要具有“解构”能力;另一方面要善于分析提问,善于将信息需求转化为可检索的概念术语。这是一个双向分析和匹配的过程,是一个以满足用户信息需求为目标,以用户提问为线索,不断缩小检索范围并查找用户所需信息的过程。,52,3信息检索,53,信息检索方法: 检索方法的运用离不开各种检索工具(如目录、索引、文摘等),检索技术的利用则离不开相关硬件和软件。它们共同构成了联结信息资源体系和用户信息需求的纽带与桥梁。,53,3信息检索,54,对应于信息组织方法,信息检索方法可分为: 字顺(如题名、著者等)检索方法; 类号检索方法; 主题检索方法; *,54,3信息检索,55,检索点: 主题 subject 分类 classification 著者 author 名称 title 号码 code, coden .,55,3信息检索,56,主题途径: 是根据文献所论述的主题,利用主题语言编制的主题索引而进行的信息检索。主题索引大多按字母排列方式,因此,检索也要用相应的方式。,56,3信息检索,57,分类途径(classification): 是根据文献所论述的主题内容,利用分类语言的学科专业体系进行的检索。大多数检索工具都采用分类语言作为正文编排体系的依据,分类目次通常不采用字顺排列类目和检索类目,而是按照学科专业角度的层层逻辑划分建立分类类目体系。检索时要选择合适的分类类目。,57,3信息检索,58,著者途径: 作者(Author) /团体著者(Corporate Author/ Authors Affiliation) 检索中,著者是一个广义的概念,是对文献内容负有责任的作者、编者、译者等,可以是个人、团体、机构、组织,甚至还包括著者的单位。通过著者途径进行检索,主要可利用著者索引。所有著者索引都采用字顺排列方式,如果著者是个人,就以个人姓名字顺排列,如果著者是机构,就以机构名称字顺排列。因此,检索也应该按相应的途径。,58,3信息检索,59,题名途径 (Title) : 检索中,文献题名是一个广泛的概念,包括文献篇名、图书书名、期刊刊名。常见的题名索引主要有篇名索引、书名索引、刊名索引等。题名索引通常按字顺排检方式,因此,检索也应该采取相应的途径。,59,3信息检索,60,序号途径: 许多文献除普通外表特征外,还具有序号特征,如,专利文献有专利号、标准文献有标准号、馆藏文献有索书号。 序号索引一般按照文献序号的大小顺序排列,如文献序号纯粹由数字组成,就按数字大小生序排列,如果序号包含数字和字母,就按数字大小和字母顺序升序排列。如果前面是字母后面是数字混合组成的序号,就先按字母顺序排列,字母相同,再按后面的数字大小排列。因此,序号检索也应按照同样方法。,60,3信息检索,61,直检法:专业核心期刊跟踪 常规法: 顺查法, 倒查法, 抽查法 追溯法: 参考文献, 引用目录 综合法: 分段法, 循环法, 交替法,3信息检索,62,常用法 顺查法: 从远及近查,用于了解某一事物发展的全过程, 倒查法: 由近及远查,重点为近期 抽查法: 查找某一段时间的文献,3信息检索,63,检索词/语言:Searching Language & Thesaurus 描述检索系统中信息特征与表达用户信息提问的一种专门语言,是为沟通文献信息用户和文献信息之间的语言,理论上讲,是用于文献标引和检索提问的约定语言。 非规范词(非受控词 自由词) uncontrolled,free-term/自然语言 natural Language 规范词(受控词) controlled/人工语言 Artificial Language 主题词表,63,3信息检索,64,按照表达文献主题概念的语词形式,有分类语言和主题语言。 描述文献信息内容特征的语言: 标题词语言 Subject Heading 单元词语言 Uniterm 叙词语言 Descriptor 关键词语言 Keyword 分类语言,64,3信息检索,65,例如规定:aircraft 表示“飞机”而不用airplane;plane;aeroplane。 作到文献存储和检索的一致性。这些规范化词的集合构成了词表。,65,3信息检索,66,检索效果 查全率 R (Recall ratio) R=检出的相关文献量/检索系统中相关文献总量*100% 查准率 P (Precision ratio) P=检出的相关文献量/检出的文献总量*100%,3信息检索,67,检索方式 (1)命令检索(command search) 算符(operator) 检索式(statement formula) (2)菜单检索(menu search) 提示 选项 填空,67,3信息检索,68,检索技术 (1)常用算符 逻辑算符 (boolean operator),68,3信息检索,69,常用的布尔逻辑算符有三种: 分别是逻辑或OR,+ 逻辑与AND,*,+ 逻辑非NOT, -。,69,3信息检索,70,(1)逻辑或“OR” 逻辑或(A OR B)检索出凡含有检索词A或者含有检索词B或者同时含有检索词A和B的信息资源。 逻辑或“OR”可以扩大信息的检索范围,使用它相当于增加检索词主题的同义词与近义词,能提高检索的查全率。 *E 概念大小、关系,70,3信息检索,71,(2)逻辑与“AND” 逻辑与(A AND B)检索出同时含有检索词A和检索词B的信息。 如果A和B无关,则没有命中文献,Q=0; 如果A和B有一定相关性,则有MQ0,或NQ0; 这表明,逻辑与“AND”可以缩小信息的检索范围,提高检索的查准率。 *t,71,3信息检索,72,(3)逻辑非“NOT” 逻辑非(A NOT B)检索出含有检索词A而不含有检索词B的信息资源。 如果A与B无关,则Q=M; 如果A与B有一定相关性,则QM; 如果A与B 密切相关,则当MN时,Q=M-N,当MN时,Q=0; 因此,逻辑非“NOT”可以用来排除不希望出现的检索词,它与逻辑与“AND”的作用类似,能够缩小命中信息的范围,提高检索的查准率。 *W,72,3信息检索,73,信息检索过程和检索策略 无论是作为一种方法还是一种技术,信息检索都表现为一种过程,该过程始于用户的信息提问而终于检索结果的输出。 检索策略是针对一定的检索目标,围绕信息检索过程而制订的具体实施计划或实施方案,其实质是对检索过程的科学规划,与检索方法和检索技术相比较,检索策略更为具体,更为实用,更富于可操作性。,3.信息检索,74,3信息检索,开始,提问,弄清(明确)问题的实质,提问的分析综合处理,用情报检索语言表达提问,编制提问检索式和检索提问式,切题文献和信息的检索,形成检索结果,显示检索结果,分析结果与提问的相关性,结果,不相关,相关,75,维药老鼠瓜抗风湿性关节炎有效部位的新药研究 The study concerning with Capparis spinosa L. as a new medicine,76,检索词 #1 老鼠瓜 或 槌果藤 或 野西瓜 Capparis spinosa L. #2 类风湿性关节炎 Rheumatoid arthritis or RA 检索式 #1 * #2,77,78,检索策略: 检索词: #1光漂白photobleaching; #2聚合物polymer(PMMA/DR1、Poly-3BCMU和 polydiacetylene); #3波导光栅waveguide grating; #4、非线性光学 the third order nonlinearities; #5单光束扫描法z-scan; #6、双光束扫描法two beam scan technique #7非线性定向耦合器nonlinear directional coupler; #8 光栅耦合器chirped grating coupler; 检索式: #1 * (#2+#3+#4+#5+#6+#7+#8),79,精氨酸基因工程菌中试发酵工艺研究 检索词: 1. 精氨酸 arginine 2. 基因工程菌 gene-engineering strain 3. 黄色短杆菌 brevibacterium flavum 4. 大肠杆菌 escherichia coli 5. 合成 component or synthesis or synthetiae 6. 发酵 fermentation 检索式:1*(2+3+4+5+6),80,计算机检索的特点,信息量大 信息及时 检索功能强 检索效率高,3信息检索,81,确定检索点/词,检索课题,用户,主题分析,选择检索系统,选择数据库,制定检索式,计算机处理,结果检验,词表,N,Y,82,数据库检索 网络资源检索,3信息检索,83,3.2数据库检索 3.2.1数据库的基本概念 数据库的定义: 至少由一种文档组成, 能满足特定目的的或特定数据处理系统需要的数据集合.,3信息检索,84,3.2.2.数据库的类型 (1)参考数据库 书目数据(bibliographic database) 目录数据库(catalog database) 文摘索引数据库(abstract/index database) 指南数据库(directory database),3信息检索,85,(2)源数据库(source database,data bank),数值数据库(numeric database) 文本-数值数据库 (text-numeric database) 全文数据库(full-text database),3信息检索,86,有3.2.3四个必要的层次: 字段(field) 记录(record) 文档(file) 数据库(database),3信息检索,87,1.字段(数据项),是组成数据库的最小基本单位。 它的作用是描述一个数据处理对象的某些属性。 如书目型的数据库,字段可为文献的篇名,作者,作者单位,刊名等。,88,2.记录,与某一数据处理对象有关的一切数据项构成了该对象的一条记录。 如书目型数据库,一条记录反映了一篇文献的相关信息,89,例2 书目型数据库中的记录,Automatic detection of lung cancers in chest CT images by the variable N-quoit filter Miwa, Tomoko; Kako, Jun-Ichi; Yamamoto, Shinji; Matsumoto, Mitsuomi; Tateno, Yukio; Iinuma, Takeshi; Matsumoto, Toru Author Affiliation: Knowledge-Based Info. Eng. Dept., Toyohashi University of Technology Source: Systems and Computers in Japan v 33 n 1 January 2002 p 53-63 . In English Abstract,90,内容 Content 范围 Coverage 时效 Currency 费用 Cost,选库的4C原则:,91,中文数据库的类型,1)按提供信息加工的层次分 参考数据库 包括书目数据库、指南数据库。 源数据库 包括全文数据库、数值数据库、多媒体数据库。 2)按是否需要在线使用分: 光盘数据库:单机使用光盘、光盘镜像。 网络联机数据库,92,万方数据资源系统,数据库介绍,93,概况 是由中国科技信息研究所、万方数据集团公司开发的网上数据库联机检索系统。 2) 收录特色 是一个以科技信息为主,集经济、金融、社会、文化、教育、卫生等各行业信息于一体的信息服务系统。它包括110余个数据库,归属5个子系统,内容涉及自然科学和社会科学各个专业领域,收录范围包括期刊、会议、文献、题录、报告、论文、标准专利、连续出版物、 最新科技成果,称得上是一个拥有海量信息的中文信息检索系统。,94,3.3网络资源检索基础,95,因特网基础,96,进入90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。 检索方法更简单,检索结果更全面; 经过40多年的发展,从早期的书目信息到后来的全文本信息,到今天的网络与多媒体信息,网络信息资源已成为现代社会不可缺少的资源财富; 其处理技术从简单的字段与关键词检索到全文检索,再到今天成为网络主流的超文本与多媒体处理。 处理技术的演进与发展,一方面使网络信息资源的内容从单一的书目到图文并茂的多媒体,更富有吸引力和使用价值; 另一方面,超文本的广泛利用改变传统的信息组织的线性方法,使电子资源的组织更接近于“自然”,大大方便了用户的使用,使电资源的利用变得非常容易,用户不需要太多的检索知识与技术。,97,按提供的内容网络信息资源可分为:,参考型数据库:指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库 全文数据库:指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、人大报刊资料库、博硕论文全文库等。 事实型数据库:直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。 电子图书:计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。 电子期刊:直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science online等 电子报纸:如:人民日报的网络版。 其它类型:如软件,新闻等,98,网络信息资源的特点,以网络为传播媒体 以多媒体为内容特征 以现代信息技术为记录手段 数据结构县通用性、开放性和标准化 高度的整合性,便于多种媒体一体化 交互性能增强,动态性、缺乏管理 结构复杂,分布广泛,99,常用网络类型代码: com 商业机构 mil 军事部门 edu 教育机构 net 网管组织 gov 政府部门 org 非营利组织 int 国际组织,100,WWW检索工具的含义及类型,广义 一种基于环球网()的信息查询系统。包括信息存储、信息管理和信息检索。 狭义 一种为搜索环球网(WWW)上的网页而设计的检索软件。,101,按检索功能分:,主题指南/目录(Subject Guides or Directory) 按某种分类规则建成树状等级目录. 字顺法、时序法、地序法。 由人工干预,保证了查准率,但查全率较低。 如Yahoo 检索引擎(Search Engines) 通过Robot、Spider等自动跟踪标引软件搜寻网络资源。它不需要人工干涉,查全率较高,但查准率较低。 如AltaVista,102,按检索内容分:,通用检索工具 是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。 如Yahoo 、Go、AltaVista等。 专业检索工具 是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。 如Medical World Search、Medical Matrix等。,103,Web通用检索工具的使用,104,Yahoo! ,1994.4由美籍华人杨致远等创建。 120万个网址;14个主题逐级细分。 有150个编辑人员维护。 鼓励用户利用联机表格递交自己的网址。 目录提供多项服务(购物、免费邮件、拍卖、聊天和新闻等)的门户,105,简单检索,分类目录点击检索 检出结果:网址 例:查找数字化图书馆,106,107,108,109,高级检索,点击Advanced Search,3信息检索,110,检索方法: 1.检索栏输入: 必须检索 Hepatoma +diagnosis 排除检索 Liver - kidney 短语检索“kidney failure” 右截词检索 cap*,3信息检索,111,2.其它方式选择: 逻辑检索(and,or); 区域选择; 时间选择等。,3信息检索,112,Google(),“手气不错“ 按钮自动将您带到Google推荐的网页。您无须查看其他结果,省时方便。 不支持 “or”,空格即代表and 不支持“*” 对大小写不敏感 专用词语上加上双引号 支持“-”功能,用以有目的地删除某些无关的网页,但减号之前必须留一空格。,3信息检索,113,中文搜索引擎,1. 雅虎中文 (简体中文) 2. 搜狐 3. 新浪网 4. Google中文 ,114,网络资源查找,图书 期刊 技术报告 专利 会议文献 学位论文 标准文献,115,网上图书资源,网上中文数字化图书 超星数据图书馆 网址: 书生数字图书馆 网址: 中国数字图书馆 网址:http:/www.d-L 网上外文数字化图书 NetLibrary e-book 网址: Springer Link 网址:http:/link.springer.de/,116,网上期刊文献资源,中文全文期刊重要数据库: 重庆维普全文数据库中国期网 网址: 万方数据库 网址:/ 中国期刊网 网址: 万方数据库 网址:46 天津工业大学网址:0,117,118,中国期刊网 Http:/,119,中国期刊网 ,万方数据资源系统,/,121,网上科技报告,国研报告 中国商业报告 U.S.Department of Energy 美国能源部科学技术信息网站。 . Scientific and Technical Report Collection 美国国防部(Department of Defense)提供的科技报告,涉及国防极其相关领域。 Http:/ NASA Scientific and Technical Information Program NASA(National Aeronautices & Space Administration)提供的有关航空航天方面的丰富的科技报告全文。 National Technical Information Service(NTIS) 提供美国政府工作报告。 /,122,网上专利文献 国内专利文献 中国知识产权局 http:/www.sipo.gv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论