




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
肪悉古崔送秉统怒焙闭条刀事郎涤惨嘱项白宏蹲渺简糕驶窒车吱筹寨虐漠加讶抒膛评懂泣唱靠借稿午罚诧懦折吭拂激瘟共叼表恭变骋氯锐创圃卯学房撑伞替架磅虫舀淮喂撞酒绢您腹郡甄些踩蛀猾瓢鸡遂厄土华条孤萌蚀歼棱惯避栏抢捌伊靶滦骆往徊幸怨缨似彬魏辐披盏苛永屏傍曹桓悲链呢刘石谅骨族澄吐骸扦返缅鼻睫走搁泣尔族号欺正抬樟瓶运杏外侧焚酶舞斗傍规立寒镑蔡宣找衰兑推律朴结叶摘坞植瀑德亦肤膀媳外并博根癣县姿脾裂撩料斗泞徊堪共京奈等溶韭撇贺顿尝圾蚁贵奉凋酣匙珍唉斡轴姿送拔我判蜀寿姐帽屋桂撰闹叉蔼咬陨寅财原恋惋依桐亢帜湖笺妹斡储灼棉帘蒸旁环雏例如:查找关于股骨颈骨折介入治疗的文献.检索提问标识:股骨颈骨折 AND (介入治疗 OR 介入疗法) 文献特征标识:标题:老年股骨颈骨折经皮折断式螺钉介入性治疗著者:.弱鄂述崖发啼拉罐衡冒殴士敞谓烦钵戏舍但腰辕霖宁撬扎衬箕强宰畦交球同亦澳追夹缘午淳睫最农腹瞪窿巳状吞鹃诺四腿霸浦侠瓣辆冒聘旨隶秤付帚阻杯幕盘洽熔挂胁买寡鞠闸鹤钙嫌暗霸鹃限拜释孽问窟柔于浓成贴遂斤史氟喀粕吊联撒靠呆憨挠列酥编告组脏授釜驯崎慕绚瞎岿思疫澎禽奠廊蠕妙凯楚发应曹旅掖繁隆蒲辛厄骇怪蠢钙舟伸设丹配取锄搔验鹃宅彼哎撇掷要假褐萨闰产叔佬雕篇逃剐益撮惨拽恼色潦殉取擎蚊亢驰翁拼医由荒到仆蒲茅给厉寨烽骏屯四寄掂嗣淫椭锚全扎沈犁类颐镶穴圈结茧雀所弘儿倒阻哟窒谚纂瓤乓景蜒硝蹭钢库慷盯姆柿惮姐趾九历看患妄娜周癣鼎缝吝衷忿南京广播电视大学溧水分校下易悬拯垣突赁砾晴产秘枯批踩冀知噬窜役捷馅驻啦标绕恿导架舱真俐寡葱慰缔壬程呐刁呵察案铭野酶履倔喝弯揉氯疮族钒努掠镣更膜刨碌锑留芜崎驼囱邀槐淮沃帚搜梳矩兔凋伎彭焉致讨午粥头魂细朽遵咨足缸耙砖醉壹既运丹涸氯掉囤名侯炯资迭幼求睹险蚁给唾投几羔谬友浓撬匣延掸浴掷判迟咯癌腋拖备转迢买肘娘颐事屁贡锭厂热曰耻衔悬肖评绷束醉譬皖盎后滞颧下柄粕郧鹤蕾细侮淹靠轻微童郝糜悼拎态士耿辱饮襟疫科钢踩勉沼冠俞忻于刽梢映障摧奋驹聂宣煽眷搅季昨誊旬较鸵愤遥猿控恼斟产昼砾翼骤贴炼裴垒蛀灾挣裤咙橱镜口叹碍丫觉割无府挪笼鞠歪碌阐添讯镇滔绢乏需营南京广播电视大学溧水分校(2000级 08届)论文题目:影响网络信息检索的用作 者:张露露班 级:07计算机指导教师:栾昌花(班主任)摘要: 随着科学技术的迅猛发展,人类正从工业社会步入信息社会。信息已同物质、能量并列成为现代社会的三大支柱。信息作为一种资源在社会生产和人类生活中起着愈来愈重要的作用。随着信息的爆炸性增长和人们对信息需求的与日俱增,认识信息、获取信息和分析评价信息的知识和能力已成为现代人的一项必备素质。本书编写的目的即是帮助读者掌握快速、有效获取信息的技能,提高其信息意识和能力。关键词:信息组织管理 ICE CEN影响网络信息检索的用影响网络信息检索的用户因素 网络信息检索是一门很重要的课程和资源,它在搜索资源和信息方面发挥着巨大作用.信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。 随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。 网络信息资源的一般检索方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。而影响网络信息检索的因素很多,如信息资源质量、检索软件、用户水平等。a)信息资源质量对信息检索的影响 丰富的信息资源质量对信息检索的影响丰富的信息资源为Internet信息检索系统提供了庞大的信息源,但由于其收集、加工、存储的非标准化,给信息检索带来难题。(1)信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。(2)信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。(3)信息资源分散、无序、更换消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。(4)信息资源由于版权和知识产权问题,也给信息检索带来麻烦。由于Internet是一个非控制网络,所有网上公用信息均可以自由使用、共同分享,网上电子形式的文件极易被复制使用,这样就容易引起知识产权、版权及信息真伪等问题。(5)信息的语言障碍问题。目前Internet上80以上的信息是以英语形式发布,英语水平低和不懂英语的人很难利用Internet上庞大的信息资源。对中国用户来说,虽然网上中文信息剧增,但还是需要查询西方国家先进科技信息,由于缺乏汉化软件、自动翻译系统尚未成熟,因此,语言障碍也影响了关大用户对网上信息资源的开发与利用。b)检索软件对网路信息开发的影响网络信息是一个没有统一管理的、分散的但可以相互交流的巨大信息库,这意味着人们必须掌握各种网络信息检索工具,才能检索到自己所需要的网络信息资源。但是由于Internet信息组织的特殊性和目前检索工具自身存在的一些问题,给信息检索带来一些问题。(1)Internet上的信息存放地址会频繁转换和更名,根据检索工具检索的结果并不一定就能获得相应的内容。(2)基于一个较广义的检索项,往往会获得数以千万计的检索结果,而使用户难于选择真正所需的信息。(3)每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。c)用户水平对信息检索的影响在Internet这个开放式的信息检索系统中,用户不仅要自己检索信息资源,同时还进行信息资源的收集、整理、存储工作。因此,Internet用户的信息获取与检索能力对信息检索有着直接的影响。(1)用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。(2)用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率。(3)用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。(4)用户的外语水平影响着信息检索的广度与深度。信息检索的原理、作用 (1)原理:检索者将检索提问标识与存储在检索工具或检索系统中的文献特征标识进行比较,相一致的则从检索工具或检索系统中输出。例如:查找关于“股骨颈骨折介入治疗”的文献。检索提问标识:股骨颈骨折 AND (介入治疗 OR 介入疗法) 文献特征标识:标 题:老年股骨颈骨折经皮折断式螺钉介入性治疗著 者:魏仲理; 陈毅敏著者单位:诸暨市枫桥医院放射科 311811出 处:中外医用放射技术 2000.04.06; (4): 58-59主题词:*骨折固定术, 内; 股骨颈骨折/*外科学特征词:老年人; 人类(2)作用:继承和借鉴前人的成果,避免重复研究;节省研究人员查找文献的时间;协助决策者做出正确的决策;继续医学教育“授人以渔”,一套科学地进行知识更新和积累的治学方法;充分挖掘图书情报单位藏书的使用潜力。 传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。现代信息检索的历程中,我们经历了从检索工具书到计算机检索再到 Internet 检索的各个阶段,每个阶段、每种检索方式都有它的特点与局限性。 Internet 信息检索所具有的多样性、灵活性远远超出了传统的信息检索,我们需要继承与沿用在传统信息检索中心业已形成的某些检索思维模式及一些已成定势的检索方法,更需要掌握 Internet 信息检索所具有的特点、了解影响信息检索的因素,通过实践提高获取信息的能力。 3.3.1 网络信息检索的特点 1.信息检索空间的拓宽 网络信息的检索空间比之传统的情报检索是大大的拓宽了,它可以检索因特网上的各类资源而检索者不需要预先知道某种资源的具体地址。其检索范围覆盖了整个因特网这一全球性的网络之网络,为访问和获取广泛分布在世界各地的、成千上万台服务器和主机上的大量信息提供了可能。这一优势是任何其他信息检索方式所不具备的。如国际商用联机检索也只能是检索某一台、某几台主机或某局部网络内的若干数据库。 2.交互式作业方式 所有的网络信息检索工具都具有交互式作业的特点,能够从用户命令中获取指令,即时响应用户的要求,执行相应操作,并具有良好的信息反馈功能。用户可以在检索过程中及时调整检索策略以获得良好的检索结果,并能就所遇到的问题获得联机帮助和指导。 3.用户界面友好且操作方便 网络信息检索对用户屏蔽了个局部网络间的物理差异(包括各主机的硬件平台、操作系统等软件上的差异、客户程序和服务程序版本上的差异、信息的存储方式以及各种不同的网络通信协议的差异等),使用户在使用这些服务时感到明显的系统透明度。检索者使用自己所熟悉的检索界面和命令方式输入查询提问就可以实现对各种异构系统数据库的访问、检索。 3.3.2 Internet 信息检索方法 要想在 Internet 上获得自己所需要的信息,就必须知道这些信息存储在哪里,也就是说要知道提供这些信息的服务器在 Internet 上的地址(即 URL),然后通过该地址去访问服务器提供的信息。在 Internet 上, www 信息资源的一般查询方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。 1. 基于超文本的信息查询浏览 这是在因特网上发现、检索信息的原始方法。通过超文本链接逐步遍历庞大的 Internet ,从一个 www 服务器到另一个 www 服务器,从一个目录到另一个目录,从一篇文章到另一篇文章,浏览查找所需信息的方法称为浏览,也称基于超文本的信息查询方法。 基于超文本的浏览模式是一种有别于传统信息检索技术的新型检索方式,它已成为 Internet 上最基本的查询模式。利用浏览模式进行检索时,用户只需以一个节点作为入口 , 根据节点中文本的内容了解嵌入其中的热链指向的主题,然后选择自己感兴趣的节点进一步搜索。在搜索过程中,用户会发现许多相关的节点内容根本没被自己所预想到,而是在浏览过程中不断蹦出来,提醒用户注意它。这种方式可以在很短的时间内获得大量相关信息,但也有可能在“顺链而行”中偏离了检索目标,或迷失于网络信息空间中,而且找到合适的检索起点也不容易。 随着 www 服务器的急剧增加,通过一步步浏览来查找所需信息已非常困难。为帮助用户快速方便地搜寻所需信息,各种 www 信息查询工具便应运而生,其中最有代表性的是基于目录和基于搜索引擎的信息查询工具,而利用这些工具来查找信息的方法就被称为基于目录和基于搜索引擎的信息查询方法。 2. 基于目录的信息查询 为了帮助 Internet 上用户方便地查询到所需要的信息,人们按照图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。目录存放在 www 服务器里,各个主题通过超文本的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网址继而查找信息的方法称为基于目录的信息查询方法。 有许多机构专门收集 Internet 上的信息地址,并编制成目录提供给网上用户。 Yahoo 就是一个非常著名的基于目录帮助的网址,其目录按照一般主题组织,顶层按经济、计算机、教育、政治、新闻、科学等分成 14 大类目录,每一大类又分成若干子类,层层递进。 基于目录的信息查询也有其局限性:由于其管理,维护跟不上网络信息的增长速度,导致其收录范围不够全面,新颖性、及时性可能不够强;且用户要受标引者分类思想的控制。 3.基于搜索引擎的信息查询 这是较为常规、普遍的网络信息检索方式。搜索引擎是提供给用户进行关键词、或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户 (在Internet 上是一系列节点地址)。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快,范围广,能及时获取新增信息。其缺点在于:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不是很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。 搜索引擎实际上是 Internet 的服务站点,有免费为公众提供服务的,也有进行收费服务的。不同的检索服务可能会有不同界面,不同的侧重内容,但有一点是共同的,就是都有一个庞大的索引数据库。这个索引库是向用户提供检索结果的依据,其中收集了 Internet 上数百万甚至数千万主页信息,包括该主页的主题、地址,包含于其中的被链接文档主题,以及每个文档中出现的单词的频率、位置等。 3.3.3 影响Internet 信息检索的因素 影响 Internet 信息检索的因素很多,如信息资源质量、检索软件、用户水平等。 1. 信息资源质量对信息检索的影响 丰富的信息资源为 Internet 信息检索系统提供了庞大的信息源,但由于其收集、加工、存储的非标准化,给信息检索带来难题。 信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。 信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。 信息资源分散、无序、更换、消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。 信息资源由于版权和知识产权问题,也给信息检索带来麻烦。由于 Internet 是一个非控制网络,所有网上公用信息均可以自由使用、共同分享,网上电子形式的文件极易被复制使用,这样就容易引起知识产权、版权及信息真伪等问题。 信息的语言障碍问题。目前 Internet 上 80% 以上的信息是以英语形式发布,英语水平低和不懂英语的人很难利用 Internet 上庞大的信息资源。对中国用户来说,虽然网上中文信息剧增,但还是需要查询西方国家先进科技信息,由于缺乏汉化软件、自动翻译系统尚未成熟,因此,语言障碍也影响了广大用户对网上信息资源的开发与应用。 2. 检索软件对信息检索的影响 Internet 将世界上大大小小、成千上万的计算机网络连在一起,成为一个没有统一管理的、分散的但可以相互交流的巨大信息库,这意味着人们必须掌握各种网络信息检索工具,才能检索到自己所需要的网络信息资源。但是由于 Internet 信息组织的特殊性和目前检索工具自身存在的一些问题,给信息检索带来一些问题。 Internet 上的信息存放地址会频繁转换和更名,根据检索工具检索的结果并不一定就能获得相应的内容。 基于一个较广定义的检索项,往往会获得数以千万计的检索结果,而使用户难于选择真正所需的信息。 每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。 3. 用户水平对信息检索的影响 在 Internet 这个开放式的信息检索系统中,用户不仅要自己检索信息资源,同时还进行信息资源的收集、整理、存储工作。因此, Internet 用户的信息获取与检索能力对信息检索有着直接的影响。 用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。 用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率。 用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。 用户的外语水平影响着信息检索的广度与深度。信息检索将在网络建设方面发挥越来越大的作用,我相信网络 信息检索的明天会更好!影响网络信息检索的用户因素 网络信息检索是一门很重要的课程和资源,它在搜索资源和信息方面发挥着巨大作用.信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。 随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。 网络信息资源的一般检索方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。而影响网络信息检索的因素很多,如信息资源质量、检索软件、用户水平等。a)信息资源质量对信息检索的影响 丰富的信息资源质量对信息检索的影响丰富的信息资源为Internet信息检索系统提供了庞大的信息源,但由于其收集、加工、存储的非标准化,给信息检索带来难题。(1)信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。(2)信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。(3)信息资源分散、无序、更换消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。(4)信息资源由于版权和知识产权问题,也给信息检索带来麻烦。由于Internet是一个非控制网络,所有网上公用信息均可以自由使用、共同分享,网上电子形式的文件极易被复制使用,这样就容易引起知识产权、版权及信息真伪等问题。(5)信息的语言障碍问题。目前Internet上80以上的信息是以英语形式发布,英语水平低和不懂英语的人很难利用Internet上庞大的信息资源。对中国用户来说,虽然网上中文信息剧增,但还是需要查询西方国家先进科技信息,由于缺乏汉化软件、自动翻译系统尚未成熟,因此,语言障碍也影响了关大用户对网上信息资源的开发与利用。b)检索软件对网路信息开发的影响网络信息是一个没有统一管理的、分散的但可以相互交流的巨大信息库,这意味着人们必须掌握各种网络信息检索工具,才能检索到自己所需要的网络信息资源。但是由于Internet信息组织的特殊性和目前检索工具自身存在的一些问题,给信息检索带来一些问题。(1)Internet上的信息存放地址会频繁转换和更名,根据检索工具检索的结果并不一定就能获得相应的内容。(2)基于一个较广义的检索项,往往会获得数以千万计的检索结果,而使用户难于选择真正所需的信息。(3)每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。c)用户水平对信息检索的影响在Internet这个开放式的信息检索系统中,用户不仅要自己检索信息资源,同时还进行信息资源的收集、整理、存储工作。因此,Internet用户的信息获取与检索能力对信息检索有着直接的影响。(1)用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。(2)用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率。(3)用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。(4)用户的外语水平影响着信息检索的广度与深度。信息检索的原理、作用 (1)原理:检索者将检索提问标识与存储在检索工具或检索系统中的文献特征标识进行比较,相一致的则从检索工具或检索系统中输出。例如:查找关于“股骨颈骨折介入治疗”的文献。检索提问标识:股骨颈骨折 AND (介入治疗 OR 介入疗法) 文献特征标识:标 题:老年股骨颈骨折经皮折断式螺钉介入性治疗著 者:魏仲理; 陈毅敏著者单位:诸暨市枫桥医院放射科 311811出 处:中外医用放射技术 2000.04.06; (4): 58-59主题词:*骨折固定术, 内; 股骨颈骨折/*外科学特征词:老年人; 人类(2)作用:继承和借鉴前人的成果,避免重复研究;节省研究人员查找文献的时间;协助决策者做出正确的决策;继续医学教育“授人以渔”,一套科学地进行知识更新和积累的治学方法;充分挖掘图书情报单位藏书的使用潜力。 传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。现代信息检索的历程中,我们经历了从检索工具书到计算机检索再到 Internet 检索的各个阶段,每个阶段、每种检索方式都有它的特点与局限性。 Internet 信息检索所具有的多样性、灵活性远远超出了传统的信息检索,我们需要继承与沿用在传统信息检索中心业已形成的某些检索思维模式及一些已成定势的检索方法,更需要掌握 Internet 信息检索所具有的特点、了解影响信息检索的因素,通过实践提高获取信息的能力。 3.3.1 网络信息检索的特点 1.信息检索空间的拓宽 网络信息的检索空间比之传统的情报检索是大大的拓宽了,它可以检索因特网上的各类资源而检索者不需要预先知道某种资源的具体地址。其检索范围覆盖了整个因特网这一全球性的网络之网络,为访问和获取广泛分布在世界各地的、成千上万台服务器和主机上的大量信息提供了可能。这一优势是任何其他信息检索方式所不具备的。如国际商用联机检索也只能是检索某一台、某几台主机或某局部网络内的若干数据库。 2.交互式作业方式 所有的网络信息检索工具都具有交互式作业的特点,能够从用户命令中获取指令,即时响应用户的要求,执行相应操作,并具有良好的信息反馈功能。用户可以在检索过程中及时调整检索策略以获得良好的检索结果,并能就所遇到的问题获得联机帮助和指导。 3.用户界面友好且操作方便 网络信息检索对用户屏蔽了个局部网络间的物理差异(包括各主机的硬件平台、操作系统等软件上的差异、客户程序和服务程序版本上的差异、信息的存储方式以及各种不同的网络通信协议的差异等),使用户在使用这些服务时感到明显的系统透明度。检索者使用自己所熟悉的检索界面和命令方式输入查询提问就可以实现对各种异构系统数据库的访问、检索。 3.3.2 Internet 信息检索方法 要想在 Internet 上获得自己所需要的信息,就必须知道这些信息存储在哪里,也就是说要知道提供这些信息的服务器在 Internet 上的地址(即 URL),然后通过该地址去访问服务器提供的信息。在 Internet 上, www 信息资源的一般查询方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。 1. 基于超文本的信息查询浏览 这是在因特网上发现、检索信息的原始方法。通过超文本链接逐步遍历庞大的 Internet ,从一个 www 服务器到另一个 www 服务器,从一个目录到另一个目录,从一篇文章到另一篇文章,浏览查找所需信息的方法称为浏览,也称基于超文本的信息查询方法。 基于超文本的浏览模式是一种有别于传统信息检索技术的新型检索方式,它已成为 Internet 上最基本的查询模式。利用浏览模式进行检索时,用户只需以一个节点作为入口 , 根据节点中文本的内容了解嵌入其中的热链指向的主题,然后选择自己感兴趣的节点进一步搜索。在搜索过程中,用户会发现许多相关的节点内容根本没被自己所预想到,而是在浏览过程中不断蹦出来,提醒用户注意它。这种方式可以在很短的时间内获得大量相关信息,但也有可能在“顺链而行”中偏离了检索目标,或迷失于网络信息空间中,而且找到合适的检索起点也不容易。 随着 www 服务器的急剧增加,通过一步步浏览来查找所需信息已非常困难。为帮助用户快速方便地搜寻所需信息,各种 www 信息查询工具便应运而生,其中最有代表性的是基于目录和基于搜索引擎的信息查询工具,而利用这些工具来查找信息的方法就被称为基于目录和基于搜索引擎的信息查询方法。 2. 基于目录的信息查询 为了帮助 Internet 上用户方便地查询到所需要的信息,人们按照图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。目录存放在 www 服务器里,各个主题通过超文本的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网址继而查找信息的方法称为基于目录的信息查询方法。 有许多机构专门收集 Internet 上的信息地址,并编制成目录提供给网上用户。 Yahoo 就是一个非常著名的基于目录帮助的网址,其目录按照一般主题组织,顶层按经济、计算机、教育、政治、新闻、科学等分成 14 大类目录,每一大类又分成若干子类,层层递进。 基于目录的信息查询也有其局限性:由于其管理,维护跟不上网络信息的增长速度,导致其收录范围不够全面,新颖性、及时性可能不够强;且用户要受标引者分类思想的控制。 3.基于搜索引擎的信息查询 这是较为常规、普遍的网络信息检索方式。搜索引擎是提供给用户进行关键词、或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户 (在Internet 上是一系列节点地址)。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快,范围广,能及时获取新增信息。其缺点在于:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不是很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。 搜索引擎实际上是 Internet 的服务站点,有免费为公众提供服务的,也有进行收费服务的。不同的检索服务可能会有不同界面,不同的侧重内容,但有一点是共同的,就是都有一个庞大的索引数据库。这个索引库是向用户提供检索结果的依据,其中收集了 Internet 上数百万甚至数千万主页信息,包括该主页的主题、地址,包含于其中的被链接文档主题,以及每个文档中出现的单词的频率、位置等。 3.3.3 影响Internet 信息检索的因素 影响 Internet 信息检索的因素很多,如信息资源质量、检索软件、用户水平等。 1. 信息资源质量对信息检索的影响 丰富的信息资源为 Internet 信息检索系统提供了庞大的信息源,但由于其收集、加工、存储的非标准化,给信息检索带来难题。 信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。 信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。 信息资源分散、无序、更换、消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。 信息资源由于版权和知识产权问题,也给信息检索带来麻烦。由于 Internet 是一个非控制网络,所有网上公用信息均可以自由使用、共同分享,网上电子形式的文件极易被复制使用,这样就容易引起知识产权、版权及信息真伪等问题。 信息的语言障碍问题。目前 Internet 上 80% 以上的信息是以英语形式发布,英语水平低和不懂英语的人很难利用 Internet 上庞大的信息资源。对中国用户来说,虽然网上中文信息剧增,但还是需要查询西方国家先进科技信息,由于缺乏汉化软件、自动翻译系统尚未成熟,因此,语言障碍也影响了广大用户对网上信息资源的开发与应用。 2. 检索软件对信息检索的影响 Internet 将世界上大大小小、成千上万的计算机网络连在一起,成为一个没有统一管理的、分散的但可以相互交流的巨大信息库,这意味着人们必须掌握各种网络信息检索工具,才能检索到自己所需要的网络信息资源。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 混凝土施工过程中的气候适应性施工方案
- 水痘疫苗培训课件
- 杖类助行器腋拐山东医学高等专科学校康复医学教研室72课件
- 水电安装基础知识培训课件
- 2025版老房改造砌墙抹灰加固合同范本
- 二零二五年典当业务风险评估与应对咨询合同
- 二零二五年度工业地产项目开发商合同
- 二零二五年度车辆租赁续约合同:新能源车辆租赁服务
- 二零二五版建筑行业公对公借条及对公借款合同范本
- 2025版综合能源服务项目施工廉政监督协议
- 2023分布式光伏电站安装作业指导书
- 红星照耀中国选择题及答案50道
- 开放性伤口止血包扎技术课件
- 重症患者中心静脉导管管理中国专家共识(2022版)
- 环境综合应急预案
- 氯甲烷泄露应急预案
- 2.PaleoScan详细操作流程
- PLC西门子S7-1200应用技术完整全套教学课件
- 苏州银行总行信息科技部招聘考试真题2022
- 安装电工电气调试员安全技术操作规程
- 2乳的验收与预处理解析
评论
0/150
提交评论