


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息检索的小信息检索,是指将信息按一定的方式组织和存储起来,并根 据信息用户的需要找出有关的信息过程。以下是小编整理的信息检索的小,欢迎阅读。信息检索的小1图书情报的信息检索也就是把信息进行整 理、排序、归纳以及存储起来,这样不仅能够展现情报的内在特 征,还能够反应情报的外在形式。众所周知,传统的图书情报搜 索模式已不能够适应现代社会的发展,现在人们更加的追求智能化的信息检索方式,在信息检索的过程中,把高科技的技术以及 方法引入到图书情报管理工作中,确保图书情报更加的真实科 学。一、我国信息检索在图书情报应用中存在的问题1. 信息检索技术不完善目前,信息检索在图书情报中的应用仍然不是很完善,其
2、 中主要包括以下两个方面:一方面是知识的获取和技术的表达存 在一些问题。把复杂多样的专业知识形成一个比较系统的、有规律的模式,往往是比较复杂的。另一方面是由于语言处理方面的 局限,在进行检索工作的时候, 检索者的文化素养以及专业知识 往往直接影响着检索所出现的结果。因此若想使计算机能够准确的把握检索者输入的各种语言方式,将大大提高检索的效率,然而在实际的检索过程中,由于计算机只能够接收一些简单的、规范的语句,大大降低了检索效率。2. 信息检索系统本身的障碍检索者在进行图书情报检索的过程中, 容易出现各种问题, 其中信息检索系统本身就存在一定的局限。首先,信息检索的用户往往来自不同的专业领域,他
3、们知识水平和专业素质都不相 同,这使得计算机很难对其进行一个合理的定位。其次是图书情报不仅存在一定的丰富性, 还存在一定的复杂性,而将那么多综 合复杂的信息整个到一个系统当中,是一件非常困难的事情。 最后是图书情报检索专家系统不易建立,一方面是这些专家的经验和技术不能够准确的表达,另一方面是不同检索专家往往具有不 同的观点,这都对图书情报检索专家系统的建立,带来一定的困难。3我国的情报技术发展落后众所周知,相对于国外的情报技术的发展,我国的情报技 术明显落后,这严重影响了信息检索在图书情报中的应用。同时我国在对于信息检索技术上的人力、财力以及物力的投资也明显没有国外高。总而言之,由于我国对于情
4、报技术的重视程度不高, 在很大程度上影响了信息检索的发展。二、信息检索在图书情报中应用的几点建议1. 建立理论基础,打破传统思维模式任何一项技术都有理论依据,信息检索也不例外,然而目 前大多数负责的图书情报的管理工作人员不能够很好的理解信 息检索在图书情报中的作用, 因此在今后的发展过程中, 要对信 息检索建立一定的理论依据, 并且打破传统的思维模式, 促进信 息检索的发展。信息检索就是要确保图书情报能够进行有组织 的、有规律的分类和归纳,同时也要让工作人员明白其中的复杂 程度,让他们认真对待信息检索在图书情报中的应用,以提高图书情报的发展。2. 图书情报检索专家化在图书情报中推广信息检索,可
5、以尝试成立专门的图书情报检索小组,让信息检索在图书情报中受到重视。众所周知,我 国对于图书情报的检索往往不够重视, 导致了图书情报检索工作 停滞不前,因此,在今后的图书情报检索发展的过程中,要建立 由国家情报信息机构牵头以及各行各业的专家组成,确保我国图书情报信息检索工作在今后的发展过程中能够有组织、有计划, 以此来打破各自为政的发展方式, 确保我国图书情报检索向着统 一化、系统化、智能化的方向发展。3. 加强自身知识建设,提高专业水平加强图书情报教育,要从大学生教育开始。因此在今后的 发展过程中,要全面的提高学生的基本素质, 培养大学生的情报 信息素养,确保他们能够熟练的运用当代的信息检索技
6、术进行图 书情报的获取。在学习的过程中,图书情报信息的识别、归纳综 合处理信息以及传递信息等是基本技能,因此一定要确保大学生能够掌握以上技能。而高水平的检索者能够对图书情报进行一定 分析和判定,善于利用信息检索,确保信息检索在图书情报中能 够得到很好的应用,让我国的信息检索在图书情报中得到更好的 发展。众所周知,未来是一个信息技术发达的社会,谁先掌握了 技术,谁就能够主宰这个社会,因此在今后的发展过程中,要不 断的学习和发展人工智能技术,确保我国图书情报的发展。三、图书情报人员必须接受的教育若想确保我国图书情报的发展,就必须对图书情报人员进 行教育和培训。首先要扩展他们的知识,对图书情报工作人
7、员不 仅要补充他们的知识,还要确保他们知识结构的合理化。同时还要培养他们的计算机以及外语水平, 确保他们能够胜任图书情报 这一工作。其次要对图书情报工作人员的知识进行更新,现在技术和知识都发展很整理快,图书情报工作人员为了能够更好的掌握图书情报工作,就要不断的学习,不断的更新自己的知识。最 后是培养图书情报工作人员的科研能力,图书情报工作人员只有 敢于探索,敢于钻研,才能够推动图书情报工作的发展。总结语综上所述,目前在我国信息检索在图书情报的应用仍然不 够完善,其中不仅由于技术发展的落后, 还由于缺乏专业的图书 情报工作人员。因此在今后的图书情报的发展过程中,相关部门要重视图书情报工作,不惜投
8、入大量的资金和人力, 以促进我国 图书情报的发展。信息检索的小2引言互联网的快速发展和广泛应用,为人们提供了一个广阔的 信息空间,也为信息检索提供了一个广阔的发展平台。互联网的开放性和自由性使得网络信息资源呈现出数量巨大、异构性、分散性和动态性特征。但由于网络信息时效性强以及互联网缺乏必 要的监督和质量控制,使得大量垃圾信息混于高质量信息当中, 增加了有效信息获取的难度,影响检索效率。因此,使用有效的 检索工具才能使得网络信息资源为人们所充分利用。1网络信息资源点与检索工具上世纪90年代中期出现的搜索引擎技术目前已经成为检 索各类网络信息资源最主要的检索工具。搜索引擎一般工作流程是借助于网络自
9、动搜索软件(Robot、Spider等)访问浏览网页 并抓取文件,并通过已浏览的网页中的链接访问更多网页。在抓取网页的同时对页面文件进行分析分解以及索引,建立索引数据库。当用户在搜索引擎界面输入搜索词后,搜索引擎对搜索词进行处理,按照处理后的搜索词在索引数据库中找出所有包含相关 内容的网页,并更具排名算法计算出排名顺序然后按照一定的格式返回到搜索页面。普通的搜索引擎缺点在于返回的检索结果数 量巨大,无关和冗余信息较多,用户必须从中进行筛选。虽然布 尔运算、截词运算、自然语言检索等技术使用大大提高了准确率, 但对用户检索素养要求很高。针对以上问题,学者把研究对象放到对词意的挖掘上,探索实现基于概
10、念匹配的检索技术和方法, 基于本体的语义检索成为研究重点。2语义检索基本要素和原理随着人工智能以及自然语言处理的发展,尤其是语义网技 术的兴起,自上个世纪以来语义检索研究得到了迅猛的发展。虽然对于语义检索在概念上到目前为止没有统一的界定,但是不同的研究都有一个共同之处就是基于对信息资源的语义处理时限 效率更高的检索。本体是语义检索的基础,其主要任务是对信息 资源进行语义表达。本体(Ontology )原本是一个描述客观事物本质的哲学概 念,是对客观存在的一个系统的解释和说明。如今,本体是一种 能在语义和知识层次上描述概念体系的有效工具,用来描述概念以及概念之间的关系,通过概念之间的管理来描述概
11、念的语义。 本体作为一种最先进的知识表示方式能够充分的描述所以的数 据结构,是推理和关系数据库的结合。 概括的讲本体能够在人们 和应用系统之间达成对术语含义的共享和共同理解,通过函数(functions)、关系(relations)、原贝U(axioms)禾口实例(instanceS)、 类(classes这5种元素表达本体中的知识,使其具有逻辑推理 和语义识别功能,帮助检索系统跨越目前基于关键词的检索过程 中的上述问题以实现语义检索。目前实现网络检索的技术主要有两种:第一种,依赖于编码处理,以分类模式来描述信息资源以 实现检索的目的;第二种,是通过全文检索查找文本中包含用户指定的词语的信息源
12、。语义检索的语义信息的提取和处理是基于 语义网方法与技术的查询处理与文档标注及索引。基于本体的查询处理包括:查询消歧和查询扩展,通过消岐,明确查询的确切 所指,准确反映用户的信息意图,继而通过加入与其语义相关的其他概念来实施扩展。在对文档进行语义标注与索引的基础上, 先进行实例检索,再据此返回所有以检出实例标注的文档信息是 语义标注文档检索的一种普遍思路。相对于传统的网络检索,基于本体的语义检索的优势在于体现语义信息,准确表达用户的查询意图。3常见语义检索系统介绍3.1 一体化医学语言系统 (UMLS)UMLS (Unified MedicalLanguage System)作为计算机化的情报
13、检索语言集成系统,是美国国立医学图书馆(NLM )主持的一项长期开发研究计划。它 不仅是自然语言处理、语言规范化以及语言翻译的规范化工具, 更是实现实现跨数据库检测的词汇转换系统并且还可以帮助用 户连接情报源,包括书目数据库、事实数据库、计算机化的病案 记录以及专家系统过程中对于其他的电子式生物医学情报的一 体化检索。UMLS包括情报源图谱(In formation Sources Map )、 语义网络(Semantic Network )、专家词典(SPECIALIST Lexicon)和超级叙词表(Metathesaurus)四部分。其中超级 叙词表是术语、生物医学概念、等级范畴、词汇及
14、其涵义的广泛 集成。1997年第8版的超级叙词表收录了 739439个词汇,这些 词汇来源于30多种生物医学词表和分类表的能表达33万多个概念的,词汇量达到空前规模。而语义网络是为超级叙词表中的所 有概念提供语义类型及相互关系结构的工具, 是为建立概念术语 间相互错综复杂关系而设计的。UMLS的语义网络不仅运用了常规的语义控制手段,如属分、相关关系控制、语义等级,同时在语义规范和语义关系分析、 延伸等多方面有许多创新。3.2语义网(Semantic Web)为了能够在网络环境下也同样实现语义 检索的功能进而开发研究了语义网的W3C项目。W3C项目是将网络上的数据通过一种方式进行连续和定义,通过
15、这种定义和连续可以根据人的不同需求实现计算机将数据自动进行整合以及 再利用,从而达到更有利于人机协作的目的。资源描述框架(Re-source Description Framework,简称 RDF)是语义网的核心 构件。在网络中,一般用元数据对资源进行描述,而RDF则是处理元数据的一个基础。RDF认为一个具体的元数据是由属性 值(Statements)、属性(Properties)和资源(Resources)构成的 三元关系模式,实际上是关于一个特定的资源特定属性的取值声 明。使用RDFS语言,元数据的设计者不仅可以定义所描述资源 的类别、属性以及词汇,还可以定义这些属性或者对象的关系以 及
16、对象与属性之间的相互关系,同时还可以进一步定义这些资源的对象、属性以及属性应用类别和取值条件等, 通过这些定义从 而能以计算机理解的标准方式对元数据进行描述语义内容以及 元数据的结构关系。3.3 WordNet WordNet是一种基于认知语言学的英语词典, 它是由普林斯顿大学的计算机工程师、心理学家和语言学家联合设计的不仅是把单词以字母顺序排列,并且是按单侧的意义组成的一个单词的网络”。WordNet将所有的英语词汇按词性分为功 能词、形容词、动词、名词和副词五类。动词被组成各种推演关 系;名词在词汇记忆中被组成主题的层次;而形容词和副词被组织在N维超空间中。根据 WordNet关系分析最大的优势是能在 他的单词网里通过相关关系消除歧义,因为WordNet分析主要是关系分析。WordNet在名词的语义消歧率可以超过 60
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八大浪费考试试题及答案
- 组织行为与变革管理案例分析试题及答案
- 2025年绿色建材研发中心项目绿色建材市场前景与投资建议报告
- 2025年环保行业环保设备与材料创新应用报告
- 2025年社区心理健康服务社区心理健康服务社区发展模式报告
- 2025至2030年中国3D网上购物行业市场全景调研及投资规划建议报告
- 解析卷-北师大版8年级数学上册期末试卷及答案详解(各地真题)
- 基础强化人教版8年级数学下册《平行四边形》定向攻克试题(含解析)
- 2025财税管理咨询合同范本大全专业服务保障
- 2025版幼儿园外籍教师聘用及教育服务合同
- 危重症患者护理常规及工作流程
- 2025至2030中国汽车空调压缩机行业产业运行态势及投资规划深度研究报告
- 2025年人工流产并发症及其护理试题
- 2025至2030年中国自动化生产线行业市场运行态势及未来发展潜力报告
- 2026版步步高大一轮高考数学复习110练第四章 §4.4 简单的三角恒等变换含答案
- 培训学校上墙管理制度
- 评估业务咨询顾问协议4篇
- 医学影像技术发展介绍
- 2025年中国化学纤维市场现状分析及前景预测报告
- DB65╱T 3953-2016 反恐怖防范设置规范 商业场所
- 《医学文献检索技巧》课件
评论
0/150
提交评论