事实和数值型数据库.ppt_第1页
事实和数值型数据库.ppt_第2页
事实和数值型数据库.ppt_第3页
事实和数值型数据库.ppt_第4页
事实和数值型数据库.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国内外常用信息检索工具与检索服务系统介绍,赵玉冬 信息咨询部 ,国内外常用信息检索工具与检索服务系统介绍,机读数据库检索服务系统 1.书目数据库检索系统 2.全文数据库检索系统 3.数值数据库检索系统 4.图象数据库检索系统 联机检索服务系统 1.综合性联机检索服务系统 2.专业性联机检索服务系统 网络搜索引擎服务系统 1.独立搜索引擎 2.元搜索引擎,一、机读数据库检索服务系统 1.书目数据库检索系统,书目数据库检索系统 概念:指存储某些或某一个领域的二次文献(如文摘、题录等)书目数据的一类数据库,属于参考数据库的一种。 特点: 历史悠久,20世纪60年代末开始发展,是机读数据库先驱。 数据量大,连续性与累计性强。 使用上无限制,开放性比较好。 记录结构简单固定,标准化程度高。,机读数据库检索服务系统 1.书目数据库检索系统,美国工程索引数据库(Engineering Index,简称EI) 创刊于1884年,历史悠久,是工程领域现有盛誉的一部综合性检索工具。由位于美国新泽西的“工程信息公司”(Engineering Information,Inc.)出版。 自20世纪60年代末以来,在其手工检索工具书的基础上,陆续增加了Ei的磁带版、光盘版和网络版(Ei Compendex Web)。1998年,美国工程信息公司在清华大学图书馆建立了Ei中国镜像服务站,2002年底又开通了Ei China网站。,机读数据库检索服务系统 1.书目数据库检索系统,EI数据库治疗囊括了世界范围内工程领域的众多分支学科,如:土木工程、能源、环境、地理和生物工程,电气、电子和控制工程、机械、自动化、核能和航空工程,计算机、人工智能和工业机器人,化学,矿业、金属和燃料工程等。 数据来源主要是2600种期刊,、技术报告、会议论文和会议录,22为会议文献。该数据库对检索全世界范围内工程与技术文献、跟踪与评价技术新成果非常有用。系统提供的检索方式有多种,相应的检索功能也非常完备。,机读数据库检索服务系统 1.书目数据库检索系统,美国科学信息服务社的英文索引系列 数据库(SCI/SSCI/A&HCI) 科学引文索引(SCI) 由美国ISI(Institute of Scientific Information)公司出版和提供服务,目前所收录数据的最早回溯年为1945年。 SCI是科学技术领域的综合性检索工具,是了解全世界科技期刊出版信息的最重要的检索工具。 选材来源于世界上40多个国家和地区的3000多种期刊、 l800余种会议录和专题文集,以及大量的专利文献和丛书、图书等。 SCI所涵盖学科超过100个,所收资料每年以60万条新记录及900万条以上引文记录的速度增长 。,机读数据库检索服务系统 1.书目数据库检索系统,社会科学引文索引(SSCI),SocialScience Citation Index 由美国ISI(Institute of Scientific Information)公司出版和提供服务,目前所收录数据的最早回溯年为1956年。 SSCI收录全球1800多种主要的社会科学期刊论文,同时也收录Science Citation Index Expanded所收录的期刊当中涉及社会科学研究的论文有些论文同时被SCI和SSCI收录(如心理学,环境等),涉及50多个领域。,机读数据库检索服务系统 1.书目数据库检索系统,艺术与人文科学引文索引(A&HCI),Arts & Humanities Citation Index 由美国ISI(Institute of Scientific Information)公司出版和提供服务,目前所收录数据的最早回溯年为1975年 A&HCI完整地收录了25个学科的1136种期刊,还包括ISI各个数据库中有关艺术与人文科学方面的的内容。该数据库每年增加10万条新记录。,机读数据库检索服务系统 1.书目数据库检索系统,英国科学文摘数据库(INSPEC) 美国政府报告数据库(NTIS) 美国生物学文摘数据库(BIOSIS Previews) 美国化学文摘数据库(Chemical Abstracts,简称CA) 英国德温特专利数据库(DI),机读数据库检索服务系统 2.全文数据库检索系统,全文数据库检索系统 概念: 指存储文献全文或其中主要部分的一种数据库。,机读数据库检索服务系统 2.全文数据库检索系统,特点: 自足性、直接性,可以直接检索出原始文献并获取全文信息。 详尽性,理论上可以查到原文任何信息。收录求“全”,过“杂”,降低了数据库的学术水平。 资源消耗性,需要占用大量存储空间,一年增加数据量几百个G. 检索方法:除一般检索方法之外,增加全文检索和引文检索。检索语言以自然语言应用较多。 标引:全文自动抽词标引,后处理能力强。 文件格式:多采用PDF文件和文本文件两种格式。,机读数据库检索服务系统 2.全文数据库检索系统,IEEE/IEE Electronic Library (IEL) 数据库提供1988年以来美国电气电子工程师学会和英国电气工程师学会出版的12,000多种IEEE 和 IEE 的出版物包括期刊、会议录和标准的全文信息。,机读数据库检索服务系统 2.全文数据库检索系统,荷兰Elsevier Science公司德期刊全文数据库 清华同方公司的全文数据库 万方数据公司的全文数据库产品(数字化期刊群) UMI公司的ARL(Academic Research Library),荷兰Kluwer公司的Kluwer Online等。,机读数据库检索服务系统 3.数值数据库检索系统,数值数据库检索系统 概念: 专门提供以数值方式表示的数据(或包括其统计处理表示法)的一类数据库。 存储各类数值 ,如科学技术数据、社会资源数据、商业经济、地理环境数据 等。 存储运算公式、图谱、表格 等。,机读数据库检索服务系统 3.数值数据库检索系统,特点: 高度专门化,具有明确学科特性。 一般不对外公开,使用范围受限制。 在使用方法和检索方式上彼此不兼容 通常还兼备数据运算、数据分析、图形处理、报表生成等特殊功能。,机读数据库检索服务系统 3.数值数据库检索系统,英文文科事实型数据库 Gale 集团是全球最大、最权威的参考文献出版商之一。Gale集团以其精确、权威的参考信息(reference)及全文期刊、报纸的智能集成闻名全球;Gale集团创建及维护了600余个在线、纸本及缩微大型数据库。 Gale以人文社会学科参考文献见长。,机读数据库检索服务系统 3.数值数据库检索系统,英文理科事实型数据库 ISI Chemistry是美国科技信息所(ISI)推出的一个事实型的化学数据库 包括Current Chemical Reactions(CCR)和Index Chemicus(IC) 收录世界领先期刊和国际专利中的化学数据、化学反应和化合物信息。,机读数据库检索服务系统 3.数值数据库检索系统,中文事实型数据库 中国资讯行 是香港专门收集、处理及传播中国商业信息的资讯企业,其数据库(中文)建于1995年。 该数据库较为适合经济、工商管理、财经、金融、法律、 政治等专业使用,尤其是其包含有各类报告、统计数据、法律法规、动态信息等内容,数据库内容包含了大量事实性数据、报告、政策法规,弥补了期刊和会议论文数据库的不足。,机读数据库检索服务系统 3.数值数据库检索系统,万方数据库系统 分为科技信息子系统、商务信息子系统和数字化期刊子系统三部分 以理工类文献为特色;涵盖工程、信息科技、电脑、中医药和环境科学等40个与科学技术有关的范畴 还提供很多实用生活方面的信息,如院校信息、医药信息、交通旅游信息、商品和通讯信息等,机读数据库检索服务系统 3.数值数据库检索系统,网上其它事实数据库 搜索引擎 http:/www. yahoo. com/reference 彼得森林指南 http:/www. / 英汉汉英在线字典 www. Chinese lib. com / dic,机读数据库检索服务系统 4.图像数据库检索系统,目前属于信息检索的前沿领域,成熟而实用的图像检索服务系统目前还不多见。,机读数据库检索服务系统 4.图像数据库检索系统,示范或试验系统: IBM公司的QBIC 哥伦比亚大学的Webseek /webseek Virage公司的Virage 波士顿大学的Image Rover /groups/ivc/imagerover,二、联机检索服务系统,1.综合性联机检索系统 DIALOG系统 First Search系统 2.专业性联机检索系统 生物医学(Biomedical) 科学技术(Sci-Tech) 法律法规(Legal & Legislative) 新闻与商业(News and Business),联机检索服务系统 1.综合性联机检索系统,DIALOG系统 始建于1963-1964年间。是世界上规模最大的联机服务系统。目前拥有600多个联机数据库。 数据库种类齐全,包括书目、全文、数值、图像、事实等类型。 内容涉及自然科学、工程技术、商业、经济、新闻、社会科学、人文科学等数十个学科领域。 检索功能丰富多彩,除联机检索外,还有光盘检索、原文订购、电子邮件、通讯软件、商界链接、全文检索、多文档检索、电子商务解决方案、用户培训等形式。,联机检索服务系统 1.综合性联机检索系统,First Search系统 联机计算机中心图书馆(OCLC)1990初创立 世界上使用量最大的联机系统,世界范围内有OCLC近2万个成员图书馆使用。 八十多个主题范围。 信息量大、更新及时、费用低廉。 检索结果包括文摘,馆藏地,可获取全文。,联机检索服务系统 2.专业性联机检索系统,生物医学(Biomedical) MEDLARS系统:美国国家医学图书馆创建PaperChase系统、HealthGate系统 科学技术(Sci-Tech) STN系统、CIS系统 法律法规(Legal & Legislative) LEXIS系统:美国米德公司 WESTLAW系统:美国西方出版公司 新闻与商业(News and Business) NEXIS系统:美国米德公司 DJNRS系统:道琼斯公司,三、网络搜索引擎服务系统,概念 搜索引擎:是指WWW环境中能够进行网络信息的搜集、组织、并能提供查询服务的一种信息服务系统。,网络搜索引擎服务系统,搜索引擎的原理 主要是通过网络搜索软件或多种人工方式将WWW站点上大量网站的页面信息搜集、传输到本地,经过加工处理建成索引数据库或目录指南,从而能够对用户提出的各种查询请求做出响应,并提供用户所需要的信息,即: 抓取网页建立索引数据库搜索排序。,网络搜索引擎服务系统,搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页,建立索引数据库。 搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。,网络搜索引擎服务系统,分类(一) 1.独立搜索引擎 Google () Alta Vista ()数字设备公司1995年建设 NorthernLight( http:/www. NorthernL研究型搜索引擎)除包含网页,还包含2500万篇文献。,网络搜索引擎服务系统,独立搜索引擎 Yahoo!(目录浏览型) Excite(概念检索) 新浪(关键词检索、分类检索) 搜狐(分类查询) 网易(关键词、分类目录) 百度 北大天网(中英文搜索引擎) 悠游。,网络搜索引擎服务系统,2.元搜索引擎 Metacrawler :美国Washington大学开发 Dogpile:隶属于InfoSpace公司 Profusion:美国Kansas大学开发 SavvySearch、Ask Jeeves 万纬搜索:上海万纬公司,第一个中文并行元搜索引擎。,网络搜索引擎服务系统,分类(二) 关键词搜索引擎:著名搜索引擎Alta Vista最初即是关键词搜索引擎,国内的搜索引擎如百度、天网,也属于此类。 主题分类指南(directory search engine):Yahoo 元搜索引擎(meta-search engine):基于搜索引擎的搜索引擎,著名的元搜索引擎如Metacrawler,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎,独立搜索引擎特点: 数据采集搜集WWW站点等资源,存入搜 索引擎临时数据库中。 数据分析或标引对搜集到的网页进行分析,提取查有价值的检索或查询内容,对关键词进行权值计算。 数据组织形成规范的索引数据库或便于浏览的层次型分类目录结构。 数据检索帮助用户用一定的方式检索索引数据库或浏览目录结构,获取符合用户需要的WWW信息。 信息挖掘提取用户相关信息,来提高检索服务质量。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google,Google 第二代搜索引擎最优秀的代表。 于1998年创建。Stanford大学两位博士生。 目前是世界上最大的综合型搜索引擎。搜索约30亿张网页,包括35个国家和地区的语言的资源。 已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额也已突破30%,并且增长速度迅猛,在中文搜索市场有举足轻重的作用。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google,Scholar google . com 学术搜索引擎 Books google . com 搜索图书 News google . com 搜索新闻 Labs google .com google新建、成熟的项目搜索,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google特色,Google特色 支持布尔逻辑:+、-,OR;不支持通配符,如“*”、“?” 如:“神州”和“神州”“飞船” 高级搜索:site、link、intitle、allintitle 、 inurl、allinurl 。如:查相关链接:Link www lib pku edu cn; 限定标题:intitle 周迅 写真;其它查询:天气(或TQ) 北京;股票(GP),邮编(YB),货币转换,数学公式转换,中英文翻译(FY),日历,图片,单词可以限定在“简体中文网页”里查询等。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google特色,查找文件格式 如:“英语四级”filetype:pdf;“报表” filetype:doc or filetype:ppt 智能化的“手气不错”功能,提供可能最符合要求的网站,直接转到所查内容的网站。 如:限定网址,“英语试题”site “网页快照”功能,能从Google服务器里直接取出缓存的网页。 对中文的支持比较好。,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎Alta Vista,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎Yahoo主页,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎Yahoo分类目录,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎Yahoo检索界面,网络搜索引擎服务系统 2.元搜索引擎搜索引擎,概念:是在独立搜索引擎的基础之上建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论