第三讲计算机检索原理与检索系统(计算机科学专业必修课程)_第1页
第三讲计算机检索原理与检索系统(计算机科学专业必修课程)_第2页
第三讲计算机检索原理与检索系统(计算机科学专业必修课程)_第3页
第三讲计算机检索原理与检索系统(计算机科学专业必修课程)_第4页
第三讲计算机检索原理与检索系统(计算机科学专业必修课程)_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三讲第三讲计算机检索原理综合性数字资源检索图书的数字资源检索期刊的数字资源检索特种文献的数字资源一、计算机检索原理1.计算机检索概念计算机检索:利用电子计算机、高速信息网络等信息技术存储和检索信息的过程。人们在计算机检索网络或终端上,使用特定的检索指令、检索提问,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示、下载或打印。优点:(1)检索快捷:处理速度快、运算准确、可靠性高。(2)多元灵活:采用了逻辑运算和限制检索等功能,使检索词之间能够灵活地进行组配。(3)量大面广:可迅速浏览相关领域的所有数据库记录,网络中每台个人计算机都可成为信息源。(4)更新迅速:如美国OCLC网

2、络的First Search检索系统,新刊出版后3天内,即可出现。(5)资源共享:利用本地计算机可以查询、获取网上丰富的信息资源,实现资源共享。(6)方式多样:提供联机回溯检索、定题检索、联机订购、直接获取全文等多种服务,可按要求输出。(百度知道)2.信息检索系统计算机信息检索系统构成: 服务器 通信网络 检索终端 系统软件 数字资源 24券网站声明券网站声明 (1)服务器 服务器是检索系统的核心部分,在检索过程中需要处理大量的指令和数据。 服务器要具有较高的运算速度和处理能力,并且具有相当大的信息存储容量。 服务器决定了系统的检索速度和存储容量。 深圳“华为”的故事 1987年由任正非创建于

3、中国深圳,是全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商。 华为的主要营业范围是交换,传输,无线和数据通信类电信产品,在电信领域为世界各地的客户提供网络设备、服务和解决方案。华为不上市的原因 1、华为的股份结构:为了增强融资渠道和凝聚力,实行全员持股。 2、商业模式创新:华为将自己定位为量产型公司而非技术创新型公司。 3、全系自主研发:华为充分利用中国的研发低成本,大量招聘研发人员。先利用主业务的研发和营销平台去培育新产品。(2)通信网络 通信网络是终端与服务器之间的桥梁,其作用是确保信息传递的畅通。 国际上大型联机检索系统的主机与本地区数据通信网络相联,在网络上有端口,检索

4、用户通过网线和网络设备检索数据库信息。 (3)检索终端 检索终端是用户与检索系统传递信息进行“人机对话”的装置,有电传终端、数传终端和微机终端等。 常用的微机终端,由计算机、打印机以及调制解调器组成。 调制解调器的作用是把终端的信息在传输前加载到一个载波信号上,接受时通过检测收到的信息偏离精确载波信号的程度,分离出原先发送的信号(称之为解调),以解决信息传输过程中的衰减问题。(4)软件 软件的作用是充分发挥硬件的功能,进行信息的存储、处理检索以及整个系统的运行管理。 操作系统软件:Windows2000,WindowsNT等。 数据库管理系统软件:Oracle、Sybase等。 数据库检索软件

5、和阅读软件: ssreader(超星),vip(维普)(5) 数据资源 数据库、电子书刊、网络资源等。 数据库是一系列信息记录的集合,是检索系统中的信息源,它存储在计算机的磁带、磁盘或光盘上,借助于数据库的管理软件技术和检索系统进行利用。 国际上通常将其划分为两大类:参考数据库、源数据库。 参考数据库参考数据库:指引用户到另一信息源以获:指引用户到另一信息源以获得原文或其它细节的一类数据库。包括:得原文或其它细节的一类数据库。包括: 书目数据库书目数据库存储某个领域的二次文献(如文摘、题录、目录等书目数据)。 指南数据库指南数据库存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述

6、,指引用户从其它有关信息源获取更详细的信息。 源数据库:能直接提供原始资料或具体数据源数据库:能直接提供原始资料或具体数据的数据库,用户不必再查阅其它信息源。的数据库,用户不必再查阅其它信息源。 数值数据库数值数据库指专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种。 事实数据库事实数据库指专门提供事物发展过程中产生的事实数据。 全文数据库全文数据库存储文献全文或其中主要部分,简称全文库。 术语数据库术语数据库专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果。 图像数据库图像数据库用来存储各种图像或图形信息及有关文字说明资料。3 .计算机检索的发展(1)脱机检索(脱机检

7、索(Off-Line Retrieval) 脱机检索又称批式检索:用户只需要把检索要求送往检索中心,由专职计算机人员进行检索。往往把一批检索提问集中起来,对提问不立即回答,而是定期成批地在计算机上查找。由于种种缺陷,已于20世纪60年代末、70年代初渐渐停止使用,脱机检索系统逐步转化成联机检索系统。 19541954年,美国海军武器实验站图书馆在一台电子年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。管计算机上建立了世界上第一个计算机检索系统。 ( 2 )联机检索()联机检索(Online Retrieval)使用终端设备,运用一些规定的指令输入检索词和检索策

8、略,通过通讯网络与相关检索系统直接连接进行人机对话,同时通过运行检索软件从信息检索系统的预先储存文献的数据库中查找所需信息的过程。优点:1克服了地理上的障碍;2消除了时间上的延迟现象;3保证检索者获得最新、最及时的文献信息;4检索者可修改检索策略,达到一定的查全率和查准率。缺点:1检索费用较高;2受地区通讯线路质量的影响较大;3检索技术较为复杂,难以普及。 20世纪60年代对联机信息检索进行了研究开发试验;70年代末进入了联机检索地区性应用阶段;90年代以后,藉以高速信息网络以崭新面貌出现。(3)光盘检索(光盘检索(CD-ROM SEARCHING)微机、检索软件、光盘驱动器和光盘数据库即构成

9、光盘检索系统。优点是:使用方便、简单,易于操作;不受机时的限制,可反复修改检索策略,达到很高的检全率与检准率;检索费用低廉,没有通讯费用,一次订购,反复使用。缺点是:数据更新周期较慢,时差长,文献的新颖性不够;同一时间只能一人使用,资源浪费较大。但是,现在的光盘网络技术已经解决了这一问题。(4)网络信息检索)网络信息检索(NETWORK SEARCHING)互联网的发展使人类社会信息的存储、传递、交流和利用发生了革命性的变化,世界变小了,实现了全球通讯和资源共享。互联网上的信息资源呈现爆炸性增长,传统的相对独立的联机检索系统纷纷变成了互联网上的一个站点,计算机检索进入了网络信息检索阶段。二、综

10、合性数字资源1.中国知网(中国知识基础设施,CNKI )国家知识基础设施的概念,由世界银行提出于1998年。CNKI工程由清华大学、清华同方发起,始建于1999年6月。采用自主开发并具有国际领先水平的数字图书馆技术,建成CNKI数字图书馆,并正式启动建设中国知识资源总库及CNKI网格资源共享平台,通过产业化运作,为全社会提供信息资源和数字化学习平台。9000 多种期刊、近1000 种报纸、18 万本博士 / 硕士论文、16 万册会议论文、30 万册图书以及国内外1100 多个专业数据库。(1)资源分布 (2)中国期刊全文数据库)中国期刊全文数据库CNKI系列全文数据库之一,它收入1994年至今

11、国内公开出版的九千多种核心期刊和专业特色期刊的全文, 按学科内容分十大专辑,分别是:理工A(数理化天地生)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学 、电子技术与信息科学。(3)中国优秀硕士中国优秀硕士/博士博士学位论文全学位论文全文数据库文数据库 2.万方数据资源系统 以中国科技信息研究所(万方数据集团公司)全部信息资源为依托建立起来的。1997年8月在国际互联网上投入服务。 1993年注册成为中国第一家数据库专业公司。 网址:http:/ 以科技信息为主,集经济、金融、社会、人文信息为一体。分科技信息系统、数字化期刊、企业服务

12、系统、医药信息系统4部分,拥有100多个数据库。 收录范围涉及期刊、会议、文献、书目、题录、报告、论文、标准、专利、法规等。 可以单库、跨库检索,也可以在所有数据库中检索,还可以按行业检索。3.读秀学术搜索 提供330多万种中文图书搜索(书目数据是国内收录最全、最新的,占建国后所出版图书的95%以上); 提供180多万种(近10亿多页)中文图书文全文检索与阅读; 提供期刊、报纸、学术论文、会议论文的联合检索; 书目检索提供图书试读(书扉页和正文部分页试读),检索结果“提供文献传递服务”。 单次咨询不超过50页,一周咨询总量提供不超过整本图书的20%的传递服务。4.中国高等教育文献保障系统 Ch

13、ina Academic Library & Information System,简称CALIS,是国务院批准的我国高等教育“211工程”中公共服务体系之一。宗旨是把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。 CALIS管理中心设在北京大学,下设了文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心。 985

14、工程来源 1998年5月4日,北京大学原国家主席江泽民在庆祝北京大学建校一百周年大会上向全世界宣告:“为了实现现代化,中国要有若干所具有世界先进水平的一流大学。” 今后连续3年,政府每年拿出中央财政收入的1%,作为中国建设“世界一流大学”的资金。以当年财政收入测算,“985工程”总投入将在300亿以上。211工程来源 后考虑到要形成一批行业带头学校,经过多次研究,确定了到2000年前后,将重点建设的高等学校确定为100所左右,并要求将此事当作面向“21世纪”的大事来抓。 这项发展高等教育的重要措施开始简称为“211计划”,后来确定为“211工程工程”。4.中国高等教育文献保障系统 China

15、Academic Library & Information System,简称CALIS,是国务院批准的我国高等教育“211工程”中公共服务体系之一。宗旨是把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。 CALIS管理中心设在北京大学,下设了文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心。 1998年开始

16、建设以来,CALIS引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库;主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家。 二期建设将“中英文图书数字化国际合作计划”(简称CADAL)列入重要组成部分,。 全国高校图书馆通过CALIS内部信息库,依据程序申请成为CALIS成员馆,可获得CALIS提供的各种服务。 网址:http:/安阳大学图书馆河南大学图书馆河南纺织高等专科学校图书馆河南科技大学图书馆河南科技学院图书馆河南理工学

17、院图书馆河南农业大学图书馆河南师范大学图书馆河南新乡医学院图书馆河南中州大学图书馆华北水利水电学院图书馆洛阳师范学院图书馆郑州大学图书馆河南工业大学图书馆郑州轻工业学院图书馆郑州师范高等专科学校图书馆安阳师范学院图书馆河南财经学院图书馆河南财政税务高等专科学校图书馆河南商业高等专科学校图书馆河南司法警官职业学院图书馆河南职业技术师范学院图书馆河南职业技术学院图书馆河南中医学院图书馆中原工学院图书馆鹤壁职业技术学院图书馆黄河科技学院图书馆黄河水利职业技术学院图书馆河南理工大学图书馆焦作师范高等专科学校图书馆开封大学图书馆洛阳大学图书馆洛阳工业高等专科学校图书馆漯河职业技术学院图书馆民办中原职业技

18、术学院图书馆南阳理工学院图书馆南阳师范学院图书馆5. OCLC检索系统检索系统 OCLC(联机计算机图书馆中心Online Computer Library Center)始建于1967年,总部设在美国俄亥俄州都柏林。它是一个面向图书馆的非赢利组织,以推动更多的人检索信息,实现资源共享。目前,它拥有15个主题范围的80多个数据库,其中30多个数据库可检索到全文,总计包括6000多种期刊的联机全文和2100多种期刊的电子映像,共达600万篇文章的全文。OCLC中最具特色的数据库是联机联合书目库(OCLC Online Union Catalog)和期刊全文数据库,前者集中反映了世界上76个国家和

19、地区的39517个图书馆的馆藏信息;后者收录了2100余种连续出版物的300万篇论文。 三、检索图书的数字资源1.超星数字图书馆超星数字图书馆超星数字图书馆成立于2000年,并于当年发行超星读书卡; 2000年5月超星数字图书馆被列为国家国家863计计划中国数字图书馆示范工程;划中国数字图书馆示范工程; 自2001年以来连年获得“国家优秀文化网站国家优秀文化网站”的荣誉称号。目前是中国最大的网上数字图书馆,收集了国内各公共图书馆和大学图书馆以PDG技术制作的数字图书。超星数字图书馆超星数字图书馆馆藏图书已达50万册以上,以工具类、文献类、资料类、学术类图书为主。网站每天100册新书。1.超星数

20、字图书馆超星数字图书馆2.书生之家“书生之家数字图书馆”是建立在中国信息资源平台基础之上、集数据库应用平台、信息资源电子商务平台与资源数字化加工服务平台三位一体的综合性数字图书馆。资源内容分为书(篇)目、提要、全文三个层次,提供全文、标题、主题词等十种数据库检索功能。收录入网出版社500多家、期刊7000多家、报纸1000多家。每年收录新出版中文图书30000本,期刊文献60万篇,报纸文献90万篇。并根据中国图书馆分类法进行组合,将图书、报纸、期刊、论文等不同种类文献真正融合在一起,可以进行全文检索、文本摘录、四级导航等,便于读者检索利用。3.四库全书电子版四、检索期刊的数字资源1.维普维普全

21、文电子期刊由重庆维普维普资讯公司制作并提供服务的。重庆维普维普资讯公司隶属与中国科技信息所西南信息中心,是我国最早进行数据库加工出版的单位之一。自1999年起,维普维普资讯公司开始进行期刊论文全文的加工制作和服务。收录了9000余种期刊,学科覆盖理、工、农、医、教育、经济、图书情报等多个领域。采用其特有的格式制作及传播,用户使用时必须首先下载并安装其期刊全文阅读器维普维普全文阅读器才可对期刊全文进行浏览和阅读(点击每篇论文的篇名链接即可获取全文)、也可进行打印及下载。河南省联合使用。2. 施普林格(Springer-Link)外文电子期刊数据库德国施普林格(Springer-Verlag)是世

22、界上著名的科技出版集团,LINK是施普林格出版社和它的合作公司推出的科学、技术和医学方面的在线信息资源。图书馆以联合购买的方式,拥有在线阅读的权限,可在线阅读500余种电子期刊。期刊学科范围包括:化学、计算机科学、经济学、工程学、环境科学、地理科学、法学、 生命科学、数学、医学、物理和天文学。 3. EBSCOhostEBSCOhost外文期刊全文数据库外文期刊全文数据库图书馆以联合购买的方式,拥有在线阅读的权限。图书馆以联合购买的方式,拥有在线阅读的权限。Academic Search PremierAcademic Search Premier是当今全世界最大的多是当今全世界最大的多学科学

23、术期刊全文数据库,专为研究机构所设计,学科学术期刊全文数据库,专为研究机构所设计,提供了提供了78767876种期刊的文摘和索引,种期刊的文摘和索引,39903990种学术期刊种学术期刊的全文,其中的全文,其中100100多种全文期刊回溯到多种全文期刊回溯到19751975年或更年或更早。涉及领域:社会科学、人文科学、教育学、计早。涉及领域:社会科学、人文科学、教育学、计算机科学、工程学、物理学、化学、语言学、艺术、算机科学、工程学、物理学、化学、语言学、艺术、文学、医学、种族研究等。文学、医学、种族研究等。Business Source PremierBusiness Source Prem

24、ier收录了收录了30483048种学术性商种学术性商业类全文期刊,文摘和索引的收藏更超过业类全文期刊,文摘和索引的收藏更超过38513851种期种期刊。学科领域包括:管理、市场、经济、金融、会刊。学科领域包括:管理、市场、经济、金融、会计、国际贸易等。计、国际贸易等。Business Source PremierBusiness Source Premier包括包括世界上最著名的商业类期刊。世界上最著名的商业类期刊。 五、检索特种文献的数字资源五、检索特种文献的数字资源 1.1.中国专利信息网中国专利信息网(http:/ 5月,于月,于20022002年年1 1月推出新版。集专利检月推出新版。集专利检索、专利知识、专利法律法规、项目推广、高技术索、专利知识、专利法律法规、项目推广、高技术传播、广告服务等功能为一体。传播、广告服务等功能为一体。 专利检索:实时了解和中国专利相关的任何信息,方专利检索:实时了解和中国专利相关的任何信息,方便查询

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论