计算机信息检索技术_第1页
计算机信息检索技术_第2页
计算机信息检索技术_第3页
计算机信息检索技术_第4页
计算机信息检索技术_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

英文数据库的松奈与原文的获取

吴贤奇

•文献是我们获取信息的主要来源.

•信息的来源:实践•人・文献

・文献:知识的载体.

•文献:图书,期刊,报纸,专利(文献).标准(文献).

学位论文,科技报告.政府出版物,会议论文.

档案,产品资料.

•数据库是当代管理文献信息,开发文献信息

的最重要最主要的手段和技术.

数据库类型:

・1、文摘型数据库:有文摘

•2、题录型数据库:通常称之为索引型数据库。无文摘c

•3、全文型数据库:摘要(题录)+全文

•4、数据型数据库:数值、事实

•5、图像(多媒体)数据库:图像(多媒体等)

数据库知识

■文摘数据库:

•收集范围广:语种多,文献类型多,地理范围广。

•全文数据库:

•收集范围有限,主要用于某个单位或某个主题的

资料存贮。

•文摘数据库与全文数据库可实现无余逢链接。

号【华南农业大学图书馆电子资逮】-InternetExplorer-|glx|

文件(E)编辑(E)查看(9收藏(⑴工具(D帮助(由文摘索引数据库

IC后退•十一回阊;|搜索收藏夹?|、,

地址(3|<!9/elect/index.htm£输,\天速手直接搜索二]Q转到链接嬷,

上百度搜索]

年月日星期四

2006323922M全文数据库

首页>电子费;好>

[文黄索引数据库】[电子期刊数据库]

介T

Agricola[光盘版][简介]AgricolaPlusTextJ

r简T

Agris【光盘版][简介]BlackwellLJ

r简T

BlosisPreviews(BA)[简介]CellPress]需出国帐号]LJ

r简T

CA(化学文摘)[简介]CESJLJ

r简1

CABI[光盘版][简介]CHSLLJ

tr简u

EiVillage(H)[简介]DOAJL

r简T

LJ

ERIC[简介]EBSCO-ASP

r简T

EBSCO-BSPLJ

FSTA(食品科技文摘)[光盘版1[简介]简

rT

ElsevierSDOS国内[国外]LJ

ISIProceedings[简介]简

r]

EnvironmentalUniverseL

MathSciNet图学评论网络版1[简疗]简

rT

ESAJournalsonlineLJ

PQDDB[简介]简

rT

LJ

维普新闻题录文箍库[简介]INFORMS

中文社会科学引文索引数据库[简介]KluwerOnline

MAlffiY材料学系列期刊[简介]

全国报刊索引[简介]

NationalLibraryofMedicine

Mature(国内)(国外)

•专业性数据库:收集某个学科文献资料的数据库。

•综合性数据库:收集多个学科文献资料的数据库。

•我们必须要知道自己的专业数据库以及与我们学

科相关的其它的专业性数据库和综合性数据库

(即相关性数据库)。可从国内外各大学图书馆

的网站上获取相关信息(资料)。或登录

/support/bluesheets

•三个主要中文数据库提供商:

•清华同方(中国知识网,中国期刊

网):WWW.CNKI.NET

・重庆维普数据有限公

司:WWW.CQVIP.COM

•万方数据有限公

司:WWW.WANFANG.COM.CN

•英文数据库主要提供商:

・国外数据库提供商很多,且专业化较强,规模

大,信息管理水平高(主要体现在字段设置和

检索技术上),数据量大,服务网络化,更新快.

•WWW.THOMSOOCOM

•WWWQCLC.COM

•WWW.EL0RG

•WWW.ISINET.COM

•现阶段,所有中英文数据库的检索

原理与技术基本上都是一样的?!

・计算机检索包含两个过程:

先存贮,后检索

•先存贮:信息管理专业人员将信息存贮在数据库中。

即信息组织过程。

•后检索:信息用户利用数据库进行检索。即信息

检索过程。

•存贮过程:信息组织过程。

•(1)标弓I:将文献的各种信息(对检索有用的信息,通常

称之为特征信息)用自然语言的字、词、句子、符号等按一定的

规则描述出来。

•文献的特征信息:题名、作者、出版社、出版日期、页数、

字数、分类号、主题词、关键词等等

•标引存在翻译上的问题。

•(2)设计字段:一个字段对应文献的一个特征信息。

•(3)将相应的信息标识输入数据库的相应字段

中。

•存贮过程就是一个建库过程。建库有人工和自动

两种方式。

计算机信息组织过程

-一

段TIAUPBPYPDSBSSABLA

字段书名作者出版社出版年出版地主题词分类文摘原文

名称号语种

记录三人民出2002北京中国古代I22三国演义chi

义罗贝

1中版社小说是.•・

记毛泽张三北京大2003北京毛泽东、G25毛泽东chi

录2东届

学出版政治人物是

录3■■■■■■■■■■■■■■■■■■■■■■■■■■■

•数据库的字段及其含义:

­字段名称:

•字段含义:

­字段符:

•字段内容的标弓1(书写)规则:

•对每一个数据库,我们要知道它的字段及字段的

含义以及字段符。

•一般英文数据库在Help中有说明。如无,可查相

关文献资料。或上

www.dialog,com/support/bluesheets

•数据库的建库语种:

・数据库是用何种自然语言建库的。

•数据库检索界面的语种是可变的。但数据

库的建库语种是不可变的。

计算机检索原理

・计算机检索过程:词形匹配

・这是我们永远、时刻要记住的。

•实质上,检索的过程就是一个如何保

证检索词(或符号、句子)与数据库

相应字段中的词(或符号、句子)保

持一致。

字形相同:检索词要

计算机描与数据库的标识词一

致,或包含在句子中

计算机检索原理

•检索内容能用几个关键词来表达吗?

数据库与检索系统

•数据库与检索系统是两个不同的概念。

•数据库是信息的集体体,是一种信息管理的方式。

・检索系统是个软件。检索系统主要用于检索数据

库。

•一个检索系统可以容纳上百个数据库,可同时对

上百个数据库进行检索。

・一个数据库可依存于不同的检索系统。

•检索系统:

•单机检索系统:通常说的单机数据库。

•联机检索系统:通常说的联机数据库。

•网络检索系统:通常说的网络数据库。通过

在网站中嵌入检索系统对数据库进行检索。

•网络检索系统也可以说是联机检索系统的

一种。在现代是最常见的。

•现在说的联机检索系统一般指使用专门的软件实

现本地机与服务器连接的检索系统。

・检索系统按载体形式来分有:

・光盘检索系统:通常说的光盘数据库。

•非光盘检索系统:一般指的是存在于硬盘等

载体的检索系统,也是现代最常用的。

・光盘检索系统有单机形式和联机形式两种。一般

说的单机检索系统就是指光盘单机检索系统。

•光盘联机检索系统:有专门的光盘服务器。

检索方式

•检索系统一般提供了三种检索方式三种:

•裁次札超媒体检索

,莱单式检索

•命令式传息检索

■,什么要提偌三种给我们,都需要我们省握吗7

超文本式、超媒体检索

•在分类的基础上,通过文字或多媒体与相

关知识产生链接,从而达到检索目的的检

索方式。

•操作非常简单,人们只需学会使用鼠标和

认识汉字即可使用。

•主要用于浏览某类文献。

•但是检索结果不够精确。查精率不高。

•一般检索系统都提供了这种检索

菜单式检索

•是一种操作方便,界面友好操作简便的检

索方式。

•用户只需输入检索词,根据菜单的指引,

通过确定适当的选项和功能筵便能完成检

索。

•菜单式检索是现阶段最受欢迎的检索方式。

命令式检索一一专业检索方式

•需要输入检索式来进行检索。

•甚至还需要输入一些操作命令(即系统不可能功

能按钮)。

•命令式检索的优势:

•检索式更能清晰地表达复杂的检索内容和要求。

•检索过程明了,便与检索者判断检索是否满意O

有利于掌握检索过程。

•对于进行课题研究的文献检索,需要使用命令式

检索方式。

些大型的检索系统都使用命令检索方式

计算机信息检索技术

•在计算机检索中,常用的检索技术有:

・1、布尔逻辑检索:

・2、字段限定检索

・3、位置限定检索

・4、啜吧艮定检索:一般用于题名、文摘

全文等字段。

计算机信息检索技术

•5、截词检索:

・6、词表检索:

•7、二次检索:

•8、全文检索:

布尔逻辑检索

•当需要用于多个检索词来表达检索内容时,我们

需要处理这些检索词的逻辑关系。

•对检索词进行布尔逻辑运算

•布尔逻辑运算共有三种:

•逻辑与:AND*

•逻辑或:OR+

•逻辑非:NOT-

•AND、OR、NOT、*、+、称之为逻辑算符

布尔逻辑检索

•逻辑与:

•AND—英文系统

•*—中文系统

•若AANDB:即表示被检索的文献记录中必须

同时含有A和B才算命中,AND两侧的检索词必须同

时出现在同一篇文献记录中,该篇文献才算命中。

•用于交叉要领和限定关系的组配,它可以缩少检

索范围,准确表达检索需求,有利于提高查准率。

布尔逻辑检索

•逻辑或:

•OR—英文系统

•+—中文系统

•若AorB,则表示在一篇文献记录中只

要含有A或者B中的任何一个即算命中。

•用于并列关系的组配,可以扩大检索范围,防止

漏检,有利于提高查全率。

布尔逻辑检索

•逻辑非:

•NOT--英文系统

•---中文系统

•若ANOTB,则表示文献记录中包含A而不

包含B。

•这种组配用于从原来的检索范围中排除不需要的

和影响检索结果的概念,使检索结果更精确。

•如;查找有关能源方面的文献,但不包含包括核能。

A(ENERGY)——78230ENERGY

B(NUCLEAR)--14778NUCLEAR

AnotB--------------63452ENERGYnotEUCLEAR

布尔逻辑检索

・三者运算的优先级一般如下:

・逻辑非>逻辑与>逻辑或

•在不同的系统中,三者的运算优先级可能不同。

布尔逻辑检索

•逻辑运算优先级的限定:

•有时为了让优先级低的逻辑运算先进行,

使用括号来加以限定。

•如:AORBANDC

•(AORB)ANDC

布尔逻辑检索

•逻辑运算的组合:

•当一个表达式中需要出现三种逻辑运算的多个

组合时,可使用括号来限定它们的运算优先顺序。

如:(AORB)ANDC

•有的系统支持双重括号,有的系统只支持单重括。

•一个检索系统对表达式中所包含的逻辑算符一般

是由限度的。如《BA》数据库中,表达式中最多

只能含五十个逻辑算符,即五十个逻辑运算。

字段限定检索

・对检索词的检索途径(出现的检索字段)

进行限定

•即确定检索词在哪一个字段中进行检索。

子段限定检索—字段符

寸:

使

用,

ALJN二限查特定刊名

LA

号PN二限查特定专利

CS二机构名称

字段限定检索--字段符

•DE=限在叙词标引中查

・ID=限在自由标引词中查

・TI=限在题目中查

・AB=限在文摘中查找

・CT=限查受控词

•PA=限查专利

字段限定检索--字段限定表述

•字段限定检索的表述:

•一般为以下几种形式

•1、字段符=检索词(主要用于中文系统)

•2、检索词in字段符(主要用于英文系

统)

•3、检索词within字段符(主要用于英文系统)

■4、检索词wn字段符(主要用于英文系

统)

•5、字段符(检索词)(主要用于英文系

统)

■表示检索词必须出现在指定的字段内

位置限定检索

•为了准确表达检索内容,提高查准率。系

统一般对检索词进行词位的限定。

•限定检索词的位置一般有两种方式:

(1)使用位置算符,

(2)使用引号。

•位夫算符:检索系统一般是采用位置算符

来实现位置检索。

•常用的位置算符有:adjnearwith

withinwn

­不同的系统采用的位置算符不同.用法也不

位置限定检索

•以DIALOG系统为例:

•DIALOG系统常用的位置算符共有四种:

・1、W或O—WKh表示算符两侧的检索

词(或检索项)之间不得有其它字词,而

且顺序不能颠倒。

位置限定检索

•(2)(nW)-nWorld(位置顺序隔词)

•表示算符两侧的检索词(或检索项)之

间允许插入n个实词或者虚词,但顺序不能

颠倒。

位置限定检索

・(3)N(Near)(词位置紧连)

・表示算符两侧的检索词必须紧密相连,中

间不插入其他字符。但两词次序可以颠倒。

位置限定检索

•(4)(nN)一nNear(隔词运算)

•表示算符两侧的检索词(或检索项)之

间允许插入n个单词,且两侧词序可变。

位置限定检索

•引号的用法:

•当需要将两个或两个以上的单词作一个

词组执行检索时,只需用引号将几个词引

起来即可。

•用于提高查准率

词频限定检索

•限定某个检索词在字段或原文中出现的频

次。

•词频符:FREQ

•如:CELL/FREQ=20,将检中那些CELL出现的

次数不少于20的文献。

截词检索

计算机按照检索词的部分片断同索引词进行对比,以提

供族性检索的功能,提高查全率。

­一般有以下六种情况:

•1、右截断:前方一致,后截断

•2、左截断:后方一致,前截断

•3、左右同时截断:中间一致

•4、完

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论