计算机检索概论课件_第1页
计算机检索概论课件_第2页
计算机检索概论课件_第3页
计算机检索概论课件_第4页
计算机检索概论课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机检索概论计算机检索概论一、计算机检索的特点检索速度快检索途径多更新快资源共享检索更方便灵活检索结果可以直接输出计算机检索概论二、计算机信息检索系统的构成从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分计算机检索概论三、数据库的结构文档--记录--字段文档(file):数据库中一部分记录的有序集合记录(record):数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。字段(field):比记录更小的单位,是组成记录的数据项目计算机检索概论四、信息资源的类型计算机检索概论参考数据库(Referencedatabase)指包含各种数据、信息或知识的原始来源和属性的数据库主要包括书目数据库、文摘数据库、索引数据库例如:中国生物医学文献数据库(CBMDisc)、中国生物医学期刊文献数据库(CMCC)、MEDLINE数据库计算机检索概论全文数据库(Fulltextdatabase)收录有原始文献全文的数据库以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息为主例如:中国期刊全文数据库、维普中国科技期刊数据库、EBSCO全文数据库和OVID全文数据库计算机检索概论事实数据库(Factualdatabase)指包含大量数据、事实,直接提供原始资料的数据库又分为数值数据库(Numericdatabase)、指南数据库(directorydatabase)、术语数据库(terminologicaldatabase)等计算机检索概论电子图书(electronicbooks)指供在电脑上阅读的一种新型的数字化书籍是多媒体技术和超文本技术发展的产物一般有专用电子图书阅读器计算机检索概论国内的电子图书系统超星数字图书馆中国数字图书馆有限公司的网上图书馆书生之家“中华图书网”方正Apabi电子图书计算机检索概论电子期刊(electronicjournals)简称e-journal指以数字或电子形式出版发行的期刊计算机检索概论电子期刊的类型一、印刷型期刊的电子版Electronicversion例如:《科学》杂志的电子版《科学在线》计算机检索概论二、原生(born-digital)数字资源只在互联网上发行的纯电子期刊Electronic–only《新物理学杂志》Newjournalofphysics计算机检索概论电子报纸(electronicnewspaper)将电子技术应用到涉及报刊出版、发行、利用的全过程计算机检索概论重要电子报纸举例纽约时报()华盛顿邮报(泰晤士报()人民日报()光明日报()中国日报()计算机检索概论搜索引擎、分类指南搜索引擎主要是使用一种计算机自动检索软件,在互联网上检索,将检索到的网页编入到数据库中,并进行一定程度的自动标引,用户使用时输入检索词,搜索引擎将其与数据库中的信息匹配,产生检索结果例如:Yahoo、Hotbot、AltaVista、Google等计算机检索概论分类指南分类指南是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南结合在一起,例如Yahoo、Google等计算机检索概论网络学术资源学科导航将互联网上的信息进行科学整理,按学科组织起来,构成完整的学科导航系统,为教学、科研、技术人员提供各类学术信息计算机检索概论FTP资源FTP:Protocol文件传送协议用户远程登录到远端的计算机上,把文件传回到自己的计算机上,或把自己的文件上传到远端计算机系统上FTP资源,是网上的开放FTP站点,他们允许用户登录上去,从中下载各类数据、资料、软件等天网(),可以专门检索网上的FTP站点计算机检索概论其他如网站、BBS、新闻组等也可以给用户提供一些有用的知识或动态计算机检索概论五、计算机信息检索的基本技术计算机检索概论1、布尔逻辑运算符(Booleansearching)AND:AANDB检出记录中同时含有检索词A和检索词BAB计算机检索概论

OR:AORB检出记录中含有检索词A或检索词B的文献AB计算机检索概论NOT:ANOTB在含检索词A的记录中,去掉含检索词B的记录优先级运算

()>NOT>AND>OR计算机检索概论2、位置算符检索位置算符(positionoperator)表示两个检索词间的位置临近关系,又叫邻接检索(proximity)布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关系计算机检索概论常用位置算符W、W/N、WITH、WITHIN两词相邻,按输入时顺序排列PRE两词相邻,按输入顺序排列N、NEAR、ADJ两词相邻,顺序可以颠倒F两个词在一个标引字段中计算机检索概论3、截词检索Truncationsearching在不同的检索系统里用不同的符号,一般为:*、?、#、$用逻辑OR对词头同、词尾不同的词汇进行检索可以避免漏检,另一方面也避免了多次输入的麻烦计算机检索概论按截词的位置划分前截断:又称左截断,截词符在词的左边,例如:*magnetic中截断:截词符在词的中间,例如:organi?ation,可以检索organisationorganization后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的检索技术,例如:librar*计算机检索概论根据截断的数量不同无限截断:不限制被截断的字符数量有限截断:限制被截断的字符数量,例如educat**,可以检索educator、educated计算机检索概论3、限定检索Limitsearching是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索限制符多为:in、=、[]例如:ChineseinLA计算机检索概论4、加权检索是一种定量检索的技术缩小检索范围提高检索准确率的有效方法计算机检索概论5、聚类检索根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系主题相近、内容相关的文献聚在一起,相异的被区分开来计算机检索概论6、全文检索Fulltextsearching直接对全文进行检索,从而更加深入到语言细节中它扩展了用户查询的自由度,使用户能对原文的所有内容进行检索检索更直接、彻底计算机检索概论7、嵌套检索技术优先算符nesting()用括号将优先检索的检索式括起来,系统首先检索括号中的概念优先级别最高计算机检索概论8、大小写敏感Casesensitive西文检索系统中对用户检索式包含的大小写的处理方法计算机检索概论9、禁用词表在西文数据库中,系统对信息进行标引时,不能做标引词或检索词的语词包括介词、冠词、代词、连接词、某些形容词或副词等如a、and、for、in、she、should、the、well、only计算机检索概论六、计算机检索的类型计算机检索概论联机数据库检索Onlineretrieval用户通过计算机终端设备,通过通讯线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程最大的缺点是检索费用高现在用户量少计算机检索概论光盘数据库检索CD-ROM数据库最初是单机检索,后来逐渐发展出了联机光盘检索联机光盘检索指把单用户系统发展成多用户的局域网系统,通过网络(如校园网)连接多个用户终端,用服务器管理多组光盘数据库及其检索系统计算机检索概论我馆常用的光盘数据库中国生物医学文献数据库(CBMDisc)

MEDLINE数据库

中国生物医

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论