




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。关键字:网络信息检索;检索工具;因特网;web资源检索目录摘要I1 信息检索的定义12网络信息检索简介12.1网络信息检索定义12.2 网络信息检索的原理12.3网络信息检索与传统信息检索的区别22.4网络信息检索技巧23网络信息检索工具类型33.1非web资源检索工具33.2web资源检索工具34网络信息检索工具的功能45网络信息检索展望55.1网络信息检索的展望55.2网络信息检索工具展望5参考文献6浅谈网络信息检索及其检索工具1 信息检索的定义什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。2网络信息检索简介随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。2.1网络信息检索定义网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。2.2 网络信息检索的原理网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。(1)布尔逻辑模型这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。(2)模糊逻辑模型它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。(3)概率模型它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。2.3网络信息检索与传统信息检索的区别 检索方式比较方面网络信息检索传统信息检索检索时间快慢检索指标查全率高查准率高检索费用相对低相对高(信息使用费、服务费、通讯费)信息内容范围数字化、多媒体信息纸制文献信息检索信息质量查全率高查准率高2.4网络信息检索技巧目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。最著名的搜索引擎有AltaVista、Excite、HotBot、Info seek等;另一种是按主题分类指南进行检索,如Yahoo ! 就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。 而后者的信息组织系统性较强,精确度较高。但主要问题在于获取率较低且很难反映信息之间的关联性。由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。(l) 检索关键词具体化;(2) 运用词组检索;(3) 巧用Boolean逻辑词:AND、OR 和NOT。3网络信息检索工具类型网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。按检索资源的类型,可分为两大类:即非web资源检索工具和web资源检索工具。3.1非web资源检索工具非web 资源检索工具是以 FTP、Telnet、Gopher等为检索对象。(1)FTP类的检索工具这是一种实时的联机检索工具,用户首先要登陆到对方的计算机,登陆后即可以进行文献搜索及文献传输有关的操作。使用 FTP(文件传输协议)几乎可以传输任何类型的正文文件、二进制文件、图像文件、声音文件、数据压缩文件等。在这类检索工具中,Archie是最常用的。Archie是自动标题检索软件,它借助于 FTP来访问。用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。与一般检索工具不同的是,它不用主题来实现相应的检索,而只能根据文件名和目录名进行检索。它是获取免费软件和共享软件资源不可缺少的工具。(2) Telnet 类的检索工具它指的是借助远程登陆在网络通信协议的支持下,在远程计算机上登陆,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问,使用远程计算机中对外开放的资源。使用Telnet协议进行远程登陆时需要满足以下条件:本地计算机上必须装有包含Telnet协议的客户程序;必须知道远程主机的IP地址或域名;必须知道登录标识与口令。(3) 基于菜单式的检索工具-Gopher Gopher是一种交互式、菜单式信息查询软件,它将各种信息资源加以分类,再用菜单的形式显示给用户。目前通过Gopher可以进行以下类型信息查询:文本文件信息查询、 Telnet信息查询、电话簿查询、专有格式文件查询。3.2web资源检索工具web信息资源是指建立在超文本、超媒体技术基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式,与之对应的 web 检索工具多种多样,大体分为三类:搜索引擎、目录型检索工具、多元搜索引擎。(1)搜索引擎搜索引擎使用自动索引软件来发现、收集并标引网页 ,建立数据库;以 Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录 , 并返回结果且按相关度排序输出。使用此类工具的检索方法被称为“关键词搜索”,可以在主页查询,也可以在类目下查询。此类检索工具的优点是信息量大且新 , 速度快;缺点是准确性较差。著名的搜索引擎如Meta Vista、Excite、天网、悠游等。根据其逻辑功能的不同,可分为:搜索器、分析器、索引器、检索器、用户接口。(2)目录型检索工具它是按照某种分类体系编制的一种可供检索的等级结构式目录。分类方法以学科分类为主,也有采用图书分类方法的。使用此类工具的检索方法被称为“分类搜索”,这是一种“自顶向下、逐步细化”的搜索方法。自顶开始,每一层都分布有若干“链接点”,选择其中一个,就可沿此分支进入下一层,直到出现所需目标。此类检索工具的优点是检索质量较高,缺点是检索到的信息数量有限,且新颖性不够。有代表性的目录型检索工具如 Y ahoo、G alaxy、Lycos、网易、263 等。现在,搜索引擎和目录型检索工具逐渐整合在一起,以增强检索能力。(3)多元搜索引擎多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面 , 且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。其优点是省时,缺点是由于不同搜索引擎的检索机制、所支持的检索算法、对提问式的解读等均不相同,导致检索结果的准确性差。常用的多元搜索引擎有DOGPI LE、INFEREN等。4网络信息检索工具的功能网络检索工具产生和发展的历史虽然不长,但它的功能却非常强大,关键词检索(Keyword)是最基本功能,包括以下几个方面:(1)布尔逻辑检索布尔检索在网络信息资源检索中使用的相当广泛,常用的布尔逻辑算符有 3 种: 逻辑或(运算符为 OR/ or ,有时也可用“|”符号表示)、逻辑与(运算符为 AND/ and ,有时也可用“&”、“+ ”号表示)、逻辑非(运算符为NOT/ not,有时也可用“!”、“- ”号表示)。(2)词组检索词组检索是将一个词组作为一个独立运算单元,进行严格匹配以提高检索的精度和准确度。词组检索是一般数据库中最常用的方法,是通过使用逗号、双引号和括号进行检索。(3)字段检索字段检索是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的手段,多以字段限定方式实现。(4)截词检索为提高查全率而设计,绝大多数网络检索都支持这一功能,有的是自动截词 , 有的是有条件的截词,尤其在西文检索工具中更是广泛使用。(5)位置检索位置检索是指允许指定 2 个单词之间的词序和词距的检索。词序指单词之间前后顺序 , 词距指 2 个单词之间间隔单词数。其操作符多为“NEAR” 。(6)概念检索概念检索是指使用某一检索提问词进行检索时 , 能同时对该词的同义词、近义词、广义词、狭义词同样进行检索 , 以达到扩大检索 , 避免漏检的目的。5网络信息检索展望5.1网络信息检索的展望人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。信息检索作为传递、搜索信息的手段发展愈来愈快。如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。所以,我们应充分利用信息资源,避免重复劳动。科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提 。更新自身知识积累,适应社会发展需要。在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段。5.2网络信息检索工具展望科学技术的日新月异和用户需求的不断提高促使网络检索工具相应发展, 其发展趋势大致可以分为以下几个方面:一是检索工具的智能化。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表达的检索要求进行分析,形成检索策略进行检索。它主要包括智能搜索引擎、智能浏览器、智能化自动索引软件。检索工具的智能化的内涵在于检索工具具有学习、分析、辨别推理的能力,它们按照用户的要求,对信息进行更深一步的分析,然后交由用户。 二是用户友好化进一步提高。未来科技的发展都要以人为本,网络信息检索也不例外,用户友好化是一个重要的发展趋势。它主要包括两个方面的内容,一是用户界面友好化,使用户更方便、快捷的使用各种检索工具,满足用户各种检索要求。另一方面是更好的检索结果提供方式,使用户方便的进行浏览、选择和利用。 三是信息提供的深入化。这也包括两个方面,一是检索深度的提高,现阶段, 网络检索大多实行相关性检索,其结果往往是海量的,这会分散用户的注意力, 背离原有的目的。为避免这种情况,就要求提高检索深度,由相关性检索向直接性检索发展。另一方面是检索内容的综合化与专业化相结合。网络既提供广泛的信息,又提供更深的内容,依次服务于用户。网络信息检索工具的研究具有非常重要的意义 , 随着信息技术和新一代因特网的发展 , 它的研究和应用也将迈上一个新的台阶 , 我们期待着网络信息检索工具的发展为网络信息资源检索带来一个美好的明天。参考文献1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030中国白葡萄酒行业市场深度分析及发展预测与投资策略报告
- 2025至2030中国电力滤波器行业发展研究与产业战略规划分析评估报告
- 2025至2030中国生姜油行业市场占有率及投资前景评估规划报告
- 2025至2030中国玄武岩连续纤维行业产业运行态势及投资规划深度研究报告
- 2025至2030中国物联网专业服务行业产业运行态势及投资规划深度研究报告
- 应对叛逆期的教育与心理引导技巧探索
- 地质专业培训课件
- 打造跨文化教育资源平台促进全球教育交流
- 学生自我认知与教育心理学的关系探讨
- 医疗健康领域中教师的科研方向与挑战分析
- 2023年春季国开《学前教育科研方法》期末大作业(参考答案)
- 上海科学院事业单位工作人员招考聘用笔试参考题库+答案解析
- EXCELVBA函数参考手册
- 成都石室中学初中学校新初一分班(摸底)语文模拟试题(5套带答案)
- SB/T 10279-2017熏煮香肠
- GB/T 3452.1-2005液压气动用O形橡胶密封圈第1部分:尺寸系列及公差
- GB/T 27065-2015合格评定产品、过程和服务认证机构要求
- GB/T 13384-1992机电产品包装通用技术条件
- SYB第一步:把自己作为创业者来评价课件
- 建筑工程中级职称论文范文精选6篇
- 变电站值班员技师实操试卷(答案)
评论
0/150
提交评论