




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、11第2章 网络学术资源检索的基本原理2.1 信息检索的基本历程2.2 信息检索的途径与方法2.3 检索语言2.4 信息检索技术2.5 信息检索的一般程序2信息检索包括信息存储和信息检索两个相互依存的过程。信息存储过程就是按照检索语言(主题词或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(形成检索图形)的信息集合的过程。具体来说,信息的存储包括对信息的著录、标引以及编排正文和所附索引等。3信息检索过程则是按照同样的主题词表(或分类表)及组配原则分析课题,形成检索提问标识,根据信息存储所提供的检索途径,从信息集合中查找与检索提问标识相符的信息特征标识的过程。简单地
2、讲,就是将用户的检索提问标识与信息集合中存储的信息标引标识进行比较,两者一致或信息标引的标识包括着检索提问标识则检索命中。42.1 信息检索的基本历程1、涵义:信息检索是指将信息按一定的方式组织起来,并根据信息用户的需要查找出有关信息的过程。2、发展时期:手工检索、机械检索和计算机检索三个发展时期。5手工信息检索阶段传统式的手工检索,是指通过手工操作,利用手工检索系统获取文献信息的检索方式,简称手检。从检索原理看,手工检索与自动化检索是基本一致的,而且自动化检索就是在手工检索的基础上发展起来的。所以,目前世界上许多著名的检索工具在出版发行时,印刷型、磁带型和缩微型同时发行,有些还发行光盘型。前
3、者用于手工检索,后者用于自动化检索。6机械信息检索阶段机械检索最初是从简单的穿孔卡片逐步发展起来的,穿孔卡片又分手检穿孔卡片与机检穿孔卡片两种。手检穿孔卡计约出现于1904年,原意图是用来避免卡片在卡片盒中误放。机械信息检索系统是手工检索向现代信息检索的过渡阶段。7机械信息检索主要包括两种基本类型:机电信息检索系统这是用诸如打孔机、验孔机、分类机等机电设备记录二次文献,用电刷作为检索元件的信息检索系统。光电信息检索系统这是用缩微照相记录二次文献,以胶卷或胶片边缘部分若干黑白小方块的不同组合做检索标志,利用光电检索元件查找文献的系统。8优点:机械信息检索系统利用当时先进的机械装置改进了信息的存贮
4、和检索方式,通过控制机械动作,借助机械信息处理机的数据识别功能部分代替人脑,促进了信息检索的自动化。缺点:没有发展信息检索语言,只是采用单一的方法对固定的存贮形式进行检索,而且过分依赖于设备,检索复杂,成本较高,检索效率和质量都不理想。机械信息检索系统很快被迅速发展的计算机信息检索系统取代。9计算机检索阶段计算机信息检索是在计算机技术和通信技术发展的基础上建立起来的。它产生于20世纪50年代,整个发展历程大体上经历了脱机信息检索、联机信息检索、光盘信息检索、网络信息检索4个阶段。101、脱机信息检索阶段:在这一时期使用的计算机检索系统属于脱机检索系统,其主要工作方式是脱机批处理。(1)脱机批处
5、理检索是指用户与机器脱钩,不直接参与检索,不介人与机器的对话,由专职人员把许多用户的检索课题汇总,批处理检索提问要求,然后将检索结果提供给用户。11(2)优点:可同时进行多项检索可处理检索关系相当复杂的检索词汇适用于长期跟踪某专题的信息检索服务12(3)缺点:用户不能参与检索过程,无法实时地修改检索策略,查准率降低用户不能及时浏览结果以及无法快速地获取文献。132、联机信息检索阶段定义:联机检索是指用户利用计算机终端设备,通过通信网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以人机对话、联机会话这样交互的方式(Interactive)直接访问检索系统及数
6、据库,检索是实时(Real Time)、在线(Online)进行的。14优点:检索速度快、检索范围广、检索途径多、检索精度高、检索内容新、检索辅助功能完善。缺点:检索费用高;系统检索指令复杂,多由掌握检索技能、熟悉命令的有经验的人员来操作。153、光盘信息检索阶段光盘是一种用激光记录和读取信息的盘片,具有信息存取密度高、容量大、读取速度快、信息类型多、保存时间长、成本低等优点,倍受人们的青睐。光盘信息检索系统的结构比较简单,任何一台安装了光驱的计算机,只要放上光盘数据库即可进行光盘检索。16优点:光盘存储信息容量大、耐用、复制费用低;光盘检索系统比联机检索系统在设备支持上和通信使用费用方面要求
7、低,尤其适于那些信息服务预算少而且比较偏远地区的单位使用;光盘检索可以提供文本、图形图像、声音及动画等相结合的检索界面,它使用菜单检索方式,比传统的联机检索界面友好。缺点:信息更新只能定期进行,检索时效性差;检索步骤多,需反复操作,检索费时且开销大。174、网络信息检索阶段以网络为平台的计算机检索被称为网络信息检索,这种检索方式下,用户可同时使用网上多个主机,甚至所有主机的某种资源而并不需要预先知道他们的具体地址。这就极大地拓宽了检索的空间和信息量。通过网络检索所需信息,已成为信息检索的主导力量和发展方向。18与其他检索方式相比,网络信息检索的特点是:信息检索范围广,信息量大,信息检索的时效性
8、强,但是其处理的信息类型复杂,信息载体形式多样,尤其是通过搜索引擎进行网络信息检索的结果的检准率较低,信息冗余大。192.2 信息检索的途径与方法信息检索途径定义:检索途径由提取信息源的外部与内部特征形成的,又称为检索点或检索入口。根据文献信息源所具有的物质属性与价值内涵,可将信息源特征分为外表特征和内容特征。信息源的外表特征是从文献信息源的载体、符号系统和记录方式三要素中提取出的特征构成的,如出版时间、出版地、责任者、文献题名及声像与电子类型等,它们分别构成相应的检索途径。20信息源的内容特征是由分析构成文献信息源的信息内容要素的特征与学科属性形成的,主要形成分类、主题两种途径,主题途径中运
9、用较广的有主题词途径和关键词途径两种。文献信息源的外部特征与文献是一一对应的关系,而文献的内容特征与文献源却是多对多的关系。21外部特征的检索途径1、提名途径:用书刊名称或论文篇名编成的索引进行信息检索的一种途径。一般较多用于查找图书、期刊、单篇文献。2、责任者途径根据已知文献源著者直接或间接(利用著者索引实现)查找文献源的途径。著者索引包括个人著者索引和机关团体索引两种。22特点:专业研究人员一般各有所长,尤其是某些领域的知名学者、专家,他们发表的作品具有相当的水平或代表该领域发展的方向,通过作者线索,可以系统地发现和掌握他们研究的进展,可以查找某一作者的最新论著。233、号码途径:指通过各
10、种专用符号代码与专用号码直接或间接(利用代码索引实现)查找文献的方法。专用号码包括报告号、专利号、标准号,专用符号代码如元素符号、分子式、结构式等。244、优点:它的排列与检索方法以字顺或数字为准,比较机械、单纯,不易错检或漏检。因而适用于查找已知篇名(书名、刊名)、作者姓名或序号代码的文献,可直接判断该文献的有或无。25内容特征的检索途径1、分类途径分类法:按照信息内容的学科属性,运用概念划分与归纳的方法形成各级类,从而组织信息形成一种有序化的知识体系,以这种方式组织信息的方法叫分类法。分类途径:用分类法组织的信息为用户提供从学科属性查找的途径就是分类途径。26特点:科学、系统,满足“族性检
11、索”,查全率高。但查找信息的其他属性和查找知识的横向联系时,此途径非常不便,分类途径对用户的要求较高,这些限制了此途径的广泛应用。利用此途径来实现信息的查询有三种情况:一是用户首先通过查找各种分类法的分类详表或类目索引获得相关线索(类目或类号)再进一步检索;二是通过选择数据库提供的输人框的下拉菜单分类限制;三是通过浏览门户网站和搜索引擎的分类类目来选择。272、主题途径定义:以规范化的词汇来表达文献内容的主题,这种词汇叫主题词,主题途径是指用户根据所确定的主题词或关键词,利用主题词表和主题索引实施检索的途径。特点:通过主题途径获得的信息专指性强,但查全率较低,对用户的检索知识要求高。28多媒体
12、信息源的检索途径多媒体信息源既包括数字化的文本信息、图形与图像信息,又包括数字化的视频与音频信息,这些信息具有与文本信息不同的内容特征,从而形成的检索途径也不同。用于图像检索的途径主要包括颜色、纹理、形状和对象。29信息检索方法信息检索在实施过程中要受到很多客观因素的影响,检索方法有助于改善检索,但同一检索方法并非对各种用户、各种检索需求都适用,每一种方法都有其使用的范围与优势。要提高检索的效率与质量,需要不同的检索用户在遵循一些基本检索方法与技巧上养成良好的检索习惯。在手工检索和计算机检索时经常用到的方法有常规法、引文法和综合法等。301、常规法:是指直接利用检索工具检索文献信息的方法,是文
13、献检索中最常用的一种方法,又分为以下几种:顺查法:按照时间的顺序、由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统的文献,适用于较大课题的文献检索。31倒查法:由近及远、从新到旧、逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。抽查法:是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。322、引文法:利用文献后所附的参考文献、相关书目查找相关文献的方法就叫引文法。引文法的使用有两种方式:追溯检索法即从文献信息密度较大的几种期刊的最近两三年论文中查出一
14、批与检索课题有关的文献,再以这批文献所附的参考文献作为线索,找到第二批相关文献,以此类推获得一批与主题相关的文献,这种方法的出发点是从引用论文开始查找。33引文索引法即利用引文索引,从被引论文开始查找引用它的全部论文,通过此方法可得到与来源文献同一主题的一批相关文献。343、综合法:又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附的参考文献进行追溯引文检索,分期分段地交替使用这两种方法。35综合法的好处是能够综合常规法和引文法的优点。其依据主要有两点:其一,任何检索工具书,都有文献收录的范围、主题报道的重点和倾向等,以引文法作为补充,可
15、以扩大文献线索,发现更多有价值的文献信息;其二,文献引用现象有这样的规律,凡是重要的文献,一般在五年之内都会被其他文献所引用。循环法是对常规法和引文法的综合利用,检索效率较高,并可克服检索工具的不齐全的限制,进行连续的检索,获得更多、更切题的文献信息,是实际中使用较多的方法。362.3 检索语言检索语言是根据文献信息检索需要而创造的一种人工语言,是信息检索系统存贮与检索所使用的共同语言。它是专门用来描述文献的内容特征、外表特征和表达信息提问的一种人工语言。371、检索语言的基本要求具有必要的语义和语法规则具有表达概念的单一性具有文献检索标识和提问特征进行比较和识别的方便性另外,检索语言体系应科
16、学合理382、检索语言的类型根据是否规范化,检索语言可以分为规范化语言和非规范化语言。根据所包括的专业范围,可以分为综合性检索语言和专业性检索语言。根据描述文献的特征,可以分为描述文献外部特征的检索语言和描述文献内容特征的检索语言。按标识组配方式,可分为先组式检索语言和后组式检索语言。39分类语言按表述信息的内容特征,可分为分类语言和主题语言。分类语言的概念:是以学科体系为基础,将各种概念按照学科性质进行分类和系统排列,并按分类号编排组织成一个完整的体系。分类语言的特点:以学科为基础的一种信息检索语言,能较好地体现学科的系统性,符合人们认识事物的规律和处理事物的习惯,便于从学科和专业角度检索文
17、献,也便于组织文献信息的排架,因此,容易为人们熟悉和使用。40采用的检索标识,是国际上广泛采用的拉丁字母和阿拉伯数字,通用性强。能较好地反映学科的纵向关系,而不容易反映学科间相互交叉渗透的横向联系,因而不易准确标引和检索交叉学科的文献。是一种先组式的信息检索语言,即在检索之前就已经固定好的标识系统。使用分类语言标引和检索文献信息时必须对学科的分类体系有较深刻的了解。41主题词检索语言1、定义:直接用代表信息主题概念的主题词作为信息的标识的一种检索语言。2、特点:可直接使用描述文献内容特征的名词性术语作为标识来揭示文献的内容特征把这些标识按字母顺序排列成主题词表,以此作为标引、检索文献的工具。4
18、23、主题词语言的分类标题词语言叙词语言关键词语言引文索引语言4、用主题法查找文献,要注意以下几点:注意利用词表选择主题词要把握概念的含义要利用概念之间的属种关系和相关关系增加检索线索432.4 信息检索技术信息检索技术是应用于用户提问与所收集的文献集合之间的匹配比较的技术。它经历了手工检索、脱机检索、联机检索到基于Internet的网络化检索的过程,同时也从开始时基于关键词的检索,发展到基于概念的检索,再到如今基于内容的检索,这一演化过程反映了对某一文献的检索由对内容知识的检索代替了对关键词、概念知识的检索。44布尔逻辑检索技术逻辑检索式一种开发较早、比较成熟、最为流行的经典检索技术,它具有
19、简单、易理解、容易在计算机上实现且检索速度快等优点。布尔检索就是采用布尔表达式来表示用户提问,通过对文本标识与用户给出的检索式进行逻辑比较来检索文档。主要的布尔逻辑关系词有:逻辑“或”(OR),逻辑“与”(AND),逻辑“非”(NOT)。45截词检索截词:是指检索者将检索词在他认为合适的地方截断。截词检索:用所截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。截词方式有多种,按截断位置来分,截词检索有右截断(前方一致)、左截断(后方一致)、左右同时截断(中间一致)、完全一致和指定位数一致5种,其中前方一致、后方一致和中间一致用的较多。前方一致:指将检
20、索词的词尾部分截断,要求比较被检项的前面部分。后方一致:将检索词的词头部分截断,要求比较被检项的后面部分。中间一致:将字根左右词头、词尾部分同是截断。46全文检索所谓全文检索,就是以文本数据为主要对象,实现内容信息存储与检索的技术。全文检索目前主要通过以下方式来实现:对文本内容中的每个检索项进行位置扫描,然后排序,建立以每个检索项的离散码为目标的倒排文档;采用自由指定的检索项直接与全文文本的数据高速对照,进行检索;采用超文本模型建立全文数据库,实现超文本检索。47其他检索技术加权检索限定检索词表检索智能检索48492.5 信息检索的一般程序信息检索工作是一项实践性和经验性很强的工作,对于不同的
21、待查课题,将采用不同的检索程序。信息检索的全过程大致可以分为分析检索课题与确定检索需求、选择检索工具、确定检索途径和方法、优化检索提问与策略、原文获取与 评价五个步骤。分析检索课题与确定检索需求1、在课题分析中,要明确以下几个问题:(1)找出课题所涉及的主要内容和相关内容,从而形成主要概念和次要概念。(2)尽可能多地列出表达检索概念的自然语言词语的同义词和近义词。(3)多了解与检索有关的背景情况,如该主题内容在学科中的发展状况等。(4)明确课题需要的文献类型、语种、出版年代等方面的要求。(5)了解课题对查全、查准、查新方面有无具体要求502、课题分析要从以下几个方面进行:(1)课题的分类(2)分析“已知”和“欲知”信息(3)分析主题内容(4)指定文献类型和年代51选择检索工具选择检索工具应考虑以下四个方面的因素:其一,学科、专业范围其二,信息类型其三,文种其四,课题内容对类型相似
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广西中考地理试题(含答案)
- ××中学法律合规制度
- 2025年新型皮革加脂剂项目提案报告模板
- 2025年水处理阻垢缓蚀剂HEDP项目提案报告模板
- 培训服务协议合同
- 2025年离子敏传感器项目申请报告模板
- 品牌合作授权经营合同协议
- 2025年雅思考试口语全真模拟试卷:环保公益活动策划与实施案例分析提升试题
- 2025年茶艺师中级茶叶加工与储藏技能鉴定理论试卷
- 2025年保育员实操技能试卷:幼儿教育心理学研究方法
- 标本制作合同协议
- 初中生安全用电课件
- 2025年广东省地理初中学业水平模拟练习卷(含答案)
- 心率测定-教学设计-八年级体育健康教育
- 广东省2025年普通高等学校招生全国统一考试模拟测试(一)物理试题及答案
- 2025年ps cs5操作试题及答案
- 2025年太阳能空调系统合同
- 汽车4s店管理制度
- 医院护理人文关怀实践规范专家共识课件
- 电脑常见故障维修与电脑保养课件
- 电商平台商家入驻流程及风险控制标准
评论
0/150
提交评论