




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一篇信息技术与计算机课件1第一篇信息技术与计算机第一篇信息技术与计算机2数字图书馆概述1数字图书馆的应用2超星数字图书馆及其检索3第四章数字图书馆数字图书馆概述1数字图书馆的应用2超星数字图书馆及其检索3第34.1.1数字时代的图书馆所谓数字图书馆,就是利用现代信息技术对有高度价值的图像、文本、语音、音响、影像、影视、软件和科学数据库等多媒体信息进行收集,组织规范性的加工和压缩处理,使其转化为数字信息,然后通过计算机技术进行高质量保存和管理,实施知识增值,并通过网络通讯技术进行高效、经济地传播、接收,使人们可以在任何时间、任何地点,都能从网上得到各种服务,为公民的终身学习机会做出贡献,成为国家的知识基础设施。同时,数字图书馆工程建设还包括知识产权、存取权限、数据安全管理,加强研究机构、商业机构、政府和教育团体之间的联系与合作等内容。“数字图书馆”在概念上存在多种解释,这从一个侧面证明了它是一个新生事物。
4.1.1数字时代的图书馆4
“数字图书馆”一词,源于1993年由美国国家科学基金会(NSF)、美国国防部尖端研究项目机构(DARPA)、国家航空与太空总署(NASA)联合发起的数字图书馆创始工程(DigitalLibraryInitiative)。以后“数字图书馆”一词迅速被全球计算机学界、图书馆界及其他相关领域所使用。通俗地讲,数字图书馆就是数字化的信息资源库(或者叫信息数据库),它应有以下几个特性:可以不断扩展。可以在统一的网络平台上运行;分散的、但在统一的标准下建设;“数字图书馆”一词,源于1993年由美国国家科学基金会(51945年,美国著名科学技术管理学家布什(V.Bush)先生在《大西洋月刊》上发表了《诚如我们想象的那样》(AsWeMayThink)一文。文中,他首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来,构思并描述了他所设想的一种Memex装备机械化的个人文档与图书馆,即台式个人文献工作系统,能存贮书、记录和通讯的装置。1948年,美国数学家维纳(N.Wiener)成为第一个指出电子计算机将能够在图书馆运作中大显身手的学者。1978年,美国著名图书馆学家兰卡斯特(F.W.Laneaster)发表了《走向无纸的时代》和《电子时代的图书馆员》两部论著,第一次向世人详细描述了电子图书馆的前景。1979年,英国不列颠图书馆的哈利(A.J.Harley)提出了“虚拟图书馆”的概念。1988年,美国国家科学基金会(NSF)的伍尔夫(W.Wulf)撰写国际合作白皮书,正式提出了数字图书馆的概念。1945年,美国著名科学技术管理学家布什(V.Bush)先生6与此同时,在一些发达国家,如英国、加拿大、日本等国也引起了极大关注。由于Internet的迅猛发展彻底地改变了传统信息服务的格局,引发了信息采集、加工、传输及获取方式的根本改变,使得从电子图书馆到虚拟图书馆再到数字图书馆应运而生。我国在1999年也将数字图书馆纳入国家、大学和科研机构的三至五年发展重点之列,并先后涌现出了一批重大成果。数字图书馆是运行在高速宽带网络上、分布式超大规模、可跨库检索的海量数字化信息资源库群。数字图书馆最大限度地利用各地已经搭建的软硬件环境,对信息资源进行接收、存储、服务。它需要拥有超大容量的分布式资源数据库群,要为用户提供可靠的信息就需要配置高性能的软、硬件基础设施。通过网络传输的信息资源是按统一标准规范加工整合过的数字化信息资源,它包括:图书、戏曲、音乐、舞蹈、电影、文化旅游、农业科技、科普知识、法律知识、文化新闻等。它超越了人们意识中图书的概念。第一篇信息技术与计算机课件7数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,就是一种拥有多种媒体内容的数字化信息资源,能为用户方便、快捷地提供信息的高水平服务机制。虽然称之为“馆”,但并不是图书馆实体。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。数字图书馆既是完整的知识定位系统,又是面向未来互联网发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播。下图(图4-1数字方舟数字图书馆的主页)是数字方舟信息技术有限公司建立的数字图书馆的主页。数字图书馆是一门全新的科学技术,也是一项全新的社会事业。8第一篇信息技术与计算机课件94.1.2数字阿图书馆的类型1.未来的数字图书馆“当你想重新温习一下《红楼梦》的时候,你只需进入图书馆的网址,找到《红楼梦》并选择下传,这时你就可以在家享受这本书了。而当你想到图书馆借书时,你会发现在图书馆你拿到的会是一张光盘,里面有你需要的图书。把图书变成数字形式,从而最大化地挖掘图书的利用率是数字图书馆建设的原因。”这席话是中国数字图书馆发展战略组组长、数字图书馆国际论坛常委副主席徐文伯在闭幕时说的。徐文伯说:“数字资源是人类社会的共同财富,将成为21世纪人类社会发展最重要的战略资源。数字图书馆国际论坛的宗旨,就是要在中外相关企业界、学术界和政府之间搭建一个相互交流的平台。通过交流和研讨,吸取国外先进科研成果和经验,促进我国数字资源建设的技术创新和体制创新。”有代表性的数字图书馆是考虑到用户使用实体图书馆的习惯或体验来设计其导航系统的,如目录系统、参考咨询台、按主题排列的数字化工具书、阅览室或馆藏资源等。第一篇信息技术与计算机课件102.国外数字图书馆国外数字图书馆大致可有如下类型:(1)以传统期刊的对应电子版为主体。(2)书目服务服务器。(3)联合体结构。(4)电子出版物存储库。上述各种数字图书馆在类型的划分上并不都是单一的,不少数字图书馆实际上采用了程度不等的混合形式,如既采用集中处理电子产品的办法,也提供书目式工具联结各地的资源;或者将NCSTRL式的开放且可扩充的结构与存储库式的集中管理结合起来,使许多地方馆藏得以挖掘和利用。2.国外数字图书馆11美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各国的数字图书馆的建设起到了极大的推动作用。近几年各国数字图书馆的研究开发高潮迭起,通过因特网可以查到的有关项目、课题有数百个之多。数字图书馆领域的研究开发是体现数字图书馆理念最好实例:充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,包括许多会议论文(例如IEEE的早期数字图书馆会议录全文),部分可能要通过付费方式,例如ACM(AssociationforComputingMachinery,实际上的美国计算机协会)的技术报告等。根据我们分析,国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:美国数字图书馆先导研究计划第一期的成功和第二期的实施,对12
类型内容特征举例技术主导型以涉及数字图书馆资源获取、存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境(Testbed)DLI1、DLI2项目资源主导型以资源数字化为目标,借助一定的技术手段(不一定是最先进的),提供因特网浏览和检索可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。“美国记忆”项目,纽约公共图书馆历史收藏项目,UNCOVER等服务主导型以各类型资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。深层次的情报服务,常常是传统图书馆向数字图书馆转型期的必然选择加里福尼亚数字图书馆项目、大英图书馆项目 类型内容特征举例技术主导型以涉及数字图书馆资源获取、存储、13上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努力带来了数字图书馆的繁荣,每一个具体的组织机构都站在它的角度、以它自己的理解进行研究或开发,涓涓细流汇成大海。数字化图书馆从一开始就不局限于一个行业或学科领域,它不仅仅是数字化资源的集合,而是数字化资源与服务,以及一系列工具的有机组成,数字图书馆的建设也不仅仅是技术问题,而是一系列目标与政策的合力。上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努144.1.3数字图书馆的教育特点1.数字图书馆教育的特点(1)数字图书馆教育是一门跨学科的综合性课程,它涉及图书、情报学、计算机、网络、法律、经济、行为学、伦理学等学科和领域。(2)它又是一门理论和实践性紧密结合的课程,课程不仅在理论上涉及面广,而且在实践操作方面对学生提出了较高的要求。(3)数字图书馆教育是一门动态的课程。①它需要根据不同的受教育者施行不同层次的教育内容;②随着数字图书馆理论和实践研究的不断深入而要对课程内容进行更新。
第一篇信息技术与计算机课件152.数字图书馆教育的目的(1)让学生了解和掌握数字图书馆各类知识;(2)让学生掌握通过网络检索各类资源的基本技能;(3)帮助学生选择最合适的信息检索工具;(4)引导学生利用网络重组信息资源和完成相关或非相关的研究任务;(5)指导学生对各类信息进行合理利用和正确评价;(6)提高学生的社会意识、法律意识和心理行为意识。2.数字图书馆教育的目的164.2
数字图书馆的应用4.2.1数字图书馆的应用技术当今科学技术日新月异,以现代信息技术,尤其是以计算机技术、高密度存贮技术、通讯技术、网络技术和多媒体(超媒体)技术为基础的数字图书馆得到飞速发展。数字图书馆的实质是利用计算机网络存储和发布大量数字化的信息系统,面对可管理的数字对象和服务的集合,实现它的存储、发现、检索、保存、获取和传递功能。而诸功能的实现则要依赖应用技术的挖掘与发展。下面就数图资源的应用技术类型及发展趋势进行简单介绍。
1描述类技术数字图书馆提供的信息资源广泛,但信息的精准率却往往达不到要求,主要原因是信息提供者片面重视信息资源内容而忽视了信息资源的描述、组织和管理。数字图书馆的简易性取决于所提供的信息资源的描述型类型和质量。标准的描述技术是实现资源共享的要求,也是数字图书馆发展的迫切需要。在数字图书馆建设中,主要指描述性元数据的建立。元数据又称为“描述数据”,是关于数据的数据,是对数据内容的描述。4.2数字图书馆的应用4.2.1数字图书馆的应用技术172.存储类技术网络存储是目前国际上一个较新的研究课题,而附网存储和存储局域网的研究在网络存储中占有重要地位,技术比较成熟,应用越来越广泛,也是数字图书馆建设的主要支柱技术之一。(1)附网存储(NetworkAttachedStorage,即NAS)NAS实际上是一个带有称之为“瘦”服务器(ThinSever)的存储设备。让服务器脱离文件处理任务,从而提高网络性能。在NAS存储结构中,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络相连,允许客户机与存储设备间进行直接的数据访问,使用TCP/IP等网络协议,通过LAN实现数据交换和存储管理。其主要特征是把存储设备与网络接口集成在一起,直接通过网络存取数据。
(2)存储局域网(StorageAreaNetwork,即SAN)它是独立于服务器网络系统之外几乎拥有无限存储的高速存储网络,它以光纤通道作为传输媒体,以光纤通道和SCSI的应用协议作为存储访问协议,将存储子系统网络化。2.存储类技术183.检索类技术(1)全文检索技术全文检索(Full-TextRetrieval)是以文本数据为主要处理对象,根据数据资料的内容而不是外在特征来实现的信息检索手段。全文检索技术是信息检索的一个分支,它的出现导致了信息检索领域的一场革命。与以前的情报检索相比,全文检索提供了全新的、强大的检索功能。全文检索系统主要包括两方面的核心技术,一个是如何建立和维护全文检索的索引数据库,另一个是如何提供快速有效的检索机制。其中索引数据库是一个全文检索系统实现的基础,它的体系结构和组织方式直接决定了检索算法和检索效率。全文检索是一个很成熟的技术,它能够解决对网页细节的检索问题。从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹配把该网页查出来,因而它是网络资源深度开发、虚拟馆藏信息资源建设的有效技术。
(2)信息定制技术信息定制技术的本质就数字图书馆而言,就是采用自有的软件技术优势,按照使用者的特定需求,包括使用者自己提交的检索策略,形成使用者自己的描述文件,为其制作出个性化的使用界面,动态即时地为使用者搜集和组织数字化信息。3.检索类技术19(3)信息抽取技术信息抽取作为一项日渐成熟的技术,在信息处理自动化中具有重要地位。在数字图书馆中,运用信息抽取技术,可以对数字信息标引、知识获取、数值库建设带来巨大的推动。
(4)三维模型检索多媒体信息资源是数字图书馆中独具特色的信息资源,随着计算机图形学以及相关软硬件技术的发展,三维模型在许多应用领域扮演着重要的角色,如机械CAD、计算机视觉、虚拟现实、游戏、分子生物学和电子商务等。主要是因为:①数字像机、数字摄像机以及扫描工具等获取三维信息和建立三维模型的技术手段不断进步和成熟,三维信息获取和表达变得越来越容易;②三维图形处理硬件和CPU的速度已足够快而价格便宜,使得三维数据能在微机上快速处理和显示;③网络的普及使人们易于应用三维数据模型。常用的几种立体视觉技术有:双像合成法;莫尔条纹法;傅里叶交换轮廓法;位相测量法;主动三角形法;几何光学聚焦法;飞行时间法等等。(3)信息抽取技术204.集成类技术数字图书馆的集成不同于一般的系统集成,它有自己的特点。首先,数字图书馆是一个海量多媒体数据库系统,信息的年增长量呈指数级增长,而且这些信息是分布式的、跨库的、多种媒体形式的,同时数字图书馆在理论上可以允许使用者无限量地访问;其次,信息源的模式和数据是不断变化的,集成系统需要适应这些改变。最后,系统需要迎合不同水平、特点、喜好的使用者。数字图书馆将硬件平台、软件平台、数据库平台等高效地集成在一起,在技术上需要遵循开放性和先进性的标准。(1)软件集成软件集成的根本是操作系统的集成,其它的应用软件可以方便地在操作系统平台上实现兼容。Windows系列平台提供了非常全面的功能,应用非常广泛。既可以满足日常办公的要求,又可满足大型复杂应用程序的要求,还可在敏感数据行业提供有效保护和自动恢复功能。Windows系列应该是当前数字图书馆集成的可行的平台策略。(2)网络集成网络集成对一个数字图书馆来说,其网络平台的建设,除一般信息系统的要求外,它在带宽、安全性和可扩充性方面有更高的要求。数字图书馆的网络集成,从技术和管理的角度主要包括传输、交换、接入和布线等方面。4.集成类技术21(3)数据集成由于数字图书馆的信息源中存在异构数据库,数据集成就是采用合适的技术手段将数字图书馆系统中的异构数据按一定的规则组织在一起,方便客户的有效访问。数据仓库是解决数据集成问题的关键技术。(4)应用集成数字图书馆系统需要解决异构系统间的交互操作问题,实现在异构环境下信息的交互,就需要解决在应用层上的集成。当前的主流集成技术大多采用面向对象的多层客户机/服务器(C/S)模型,该模型将分布在网络上的全部资源都按对象的概念组织,每个对象都有明确的访问接口,创建和维护对象实体的应用称为服务器,通过对象接口访问对象的应用称为客户机。C/S模型具有良好的开放性,易于扩展,因此基于该模型的技术表现出强大的生命力。总之,Windows系列功能强大、易于使用,在操作系统方面占主流位置,但它在稳定性和安全性方面存在一定的缺陷,网络技术发展得很快,数字图书馆在带宽安全性方面有更高的要求,数据集成是最终实现数据共享的基础,它的发展有待于做更深入的研究,比如应用集成的几种分布式计算各有优缺点,将两种或多种技术融合成比较理想的集成模式,获取技术支持在现实中是完全可行的。(3)数据集成224.2.2数字图书馆的结构不论计算机技术怎样发展,网络结构多么复杂,图书馆信息服务的基本模型始终如一,这就是“信息源—图书馆—读者”构成的三角架构,图书馆充当一个知识整理的中间人的角色。计算机与网络的出现使图书馆的信息服务能够更为全面、及时、准确、高效,数字图书馆技术在各个环节上加固了这种模型,使信息社会中图书馆得到的作用和效益发挥到极限。数字图书馆的基本结构图示如右图4-2:第一篇信息技术与计算机课件23图4-2中图书馆服务器的作用是负责管理目录数据的索引和查询,对象服务器负责管理数字化数据,是信息源,可以由图书馆设立,也可以由任何社会信息部门设立。它们与读者构成三角形架构。读者通过广域网或图书馆内部的局域网(电子阅览室)发出查询请求,经Web服务器处理后传递给图书馆服务器(类似于查询目录卡片),图书馆服务器将查询结果通知对象服务器并有对象服务器取出最终结果送达读者,这就实现了数字图书馆对象数据的发布。第一篇信息技术与计算机课件24下面介绍国内外的一些知名的数字图书馆建设计划:1.美国“数字图书馆首倡计划”
由美国科学基金会(NSF)、美国国防部高级研究计划署(DARPA)、美国宇航局(NASA)发起资助的包含6个项目的数字图书馆计划,于1994到1998财年施行,平均每个项目的资助金额为4百万美元。这个计划的任务是共同研究和发展一个用于创立、操作、利用与评价一个大跨度的不断发展的数字图书馆的试验平台,该数字图书馆的内容主要为有关地球与空间技术的科学资料。该计划的重点是偏重于进行一些试验研究,偏重于如何来测试与评价利用因特网技术面对广泛的用户群体(包括在大学校园中的学生,本地高中以及公共图书馆用户)提供服务的一个系统模型。下面介绍国内外的一些知名的数字图书馆建设计划:25“数字图书馆首倡计划”包括以下六个计划:"密西根大学数字图书馆研究计划",密西根大学"建立交互空间—为大学工程社团服务的数字图书馆结构",伊利诺斯大学"环境电子图书馆:一个可扩展的、智能的、分布式电子图书馆模型"加州大学伯克利分校"在创建与利用时集成声音、图象及语言识别能力的数字视频图书馆(Informedia)",卡内基·梅隆大学"斯坦福集成数字图书馆计划",斯坦福大学“亚历山大计划:建立一个提供大量图象及天文学信息的分步式数字图书馆”,加州大学圣巴巴拉分校目前“数字图书馆首倡计划”进入了第二阶段,新增加了几家赞助机构,它们是国家医学图书馆、美国国会图书馆、国家人文捐赠协会。这一计划的内容更为宽泛,但主要重点仍是测重于应用研究与测试平台的建立。“数字图书馆首倡计划”包括以下六个计划:262.中国国家试验型数字图书馆计划
该项计划由北京图书馆、上海图书馆、深圳图书馆、中山图书馆、南京图书馆、辽宁图书馆参与,模仿美国数字图书馆首倡计划,侧重技术方案的实现,兼顾资源的数字化,并设立了一项软课题研究。计划完成后将在网上建立多馆合作的数字图书馆网页。然而限于经费,该计划主张尽量采用免费软件。原定计划于2000年完成,目前进度有些拖后。近年来,随着计算机及网络技术在图书馆的广泛应用,图书馆自动化建设已取得了很大发展。多数大中型图书馆和部分小型图书馆已经实现了自动化管理,建立了本馆的馆藏书目数据库。但如何能使这些数据库资源发挥更有效的作用,实现本馆读者及更广泛用户的远程检索,达成真正意义上的资源共享,是许多图书馆自动化发展面临的新问题。2.中国国家试验型数字图书馆计划274.2.2国内外图书馆网络1.国内外的图书馆网络(1)国内数字图书馆清华大学图书馆北京高校网络图书馆中国期刊网北京市公共图书馆信息服务网络国家图书馆中国科学院文献情报中心超星数字图书馆北京大学图书馆中国教育与科研技术网中国高等教育文献保障系统书生之家西安交通大学数字图书馆园地上海交通大学数字图书馆上海数字图书馆4.2.2国内外图书馆网络北京大学图书馆28(2)国外数字图书馆
美国数字图书馆电子杂志
美国数字图书馆联盟
国际图书馆协会联合会
数字信息杂志
图书馆杂志
万维网联盟
美国联机图书馆中心美国国会图书馆
澳大利亚数字图书馆计划
美国加州大学伯克利分校数字图书馆
都柏林核心元数据计划
信息科学与技术数字图书馆
英国国家图书馆(2)国外数字图书馆美国国会图书馆291.国内外知名的国家图书馆下面我们来介绍国内外知名图书馆的一些具体情况。(1)中国国家图书馆中国国家图书馆是中国的国家图书馆,中国国家图书馆旧称北京图书馆,一般简称“国图”。中国国家图书馆馆藏宏富,品类齐全,古今中外,集精撷萃。作为国家藏书机构,中国国家图书馆依法接收中国大陆各出版社送缴收藏的出版样书,此外还收藏中国大陆的非正式出版物,例如各高校的博士学位论文均在中国国家图书馆的收藏之列。是图书馆学专业资料集中收藏地和全国年鉴资料收藏中心。从藏书量和图书馆员的数量看,中国国家图书馆(即北京图书馆)是亚洲规模最大的图书馆,世界上最大的国家图书馆之一,是世界著名的国家图书馆。1.国内外知名的国家图书馆30中国国家图书馆的藏书可上溯到700多年前的南宋皇家缉熙殿藏书,最早的典藏可以远溯到3000多年前的殷墟甲骨。国家图书馆的馆藏文献中珍品特藏包括善本古籍、甲骨金石拓片、中国古旧舆图、敦煌遗书、少数民族图籍、名人手稿、中国少数民族文献、革命历史文献、家谱、地方志和普通古籍等260多万册(件)。外文善本中最早的版本为1473-1477年间印刷的欧洲“摇篮本”。这部分藏品极为珍贵,闻名遐迩,世界瞩目。截至到2005年,中国国家图书馆的藏书容量达2500多万册,其中价值连城的古籍善本就有200余万册,著名的《永乐大典》、《四库全书》等举不胜举。其中尤以“四大专藏”即“敦煌遗书”、“赵城金藏”、“永乐大典”和“文津阁四库全书”最受瞩目。2007年6月8日,中国国家图书馆获得国家文化部颁布的首届文化遗产日奖。中国国家图书馆的藏书可上溯到700多年前的南宋皇家缉熙殿31目前中国国家图书馆服务的读者对象主要为年满18周岁的中华人民共和国公民和持有有效证件的其他国家公民,依照读者的受教育程度、专业技术职称和行政级别不同为读者办理不同层次水平的借书证或阅览证,如年满18周岁的中国公民可以办理最低档次的中文第二外借库借书证;在读的硕士研究生可以办理中文第二外借库借书证;在读博士研究生可以办理外文图书借书证;具有高级职称的人员凭单位证明可以办理善本库阅览证。中国国家图书馆实行年度注册制。读者办理借阅证分长期证与临时证两种。下面是中国国家图书馆的主页:
图4-3中国国家图书馆的主页目前中国国家图书馆服务的读者对象主要为年满18周岁的中华32第一篇信息技术与计算机课件334.2.3图书全文检索全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点,在此不做详述。4.2.3图书全文检索34第一篇信息技术与计算机课件354.2.4搜索引擎搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。1.搜索引擎的工作原理搜索引擎的工作原理大致可以分为:
(1)搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。4.2.4搜索引擎36(2)整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。(3)接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。(2)整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索37搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些38第一篇信息技术与计算机课件39第一篇信息技术与计算机课件40第一篇信息技术与计算机课件414.3超星数字图书馆及其检索4.3.1概况及特点北京世纪超星信息技术发展有限责任公司成立于1993年,长期致力于纸张图文资料数字化技术及相关应用与推广,是国内外数字图书馆和档案自动化方面最重要的整体解决方案提供商和图文资料数字化加工服务商,是国内数字图书资源最丰富的商业化数字图书馆和加工能力最强的纸张资料数字化加工中心。2000年1月,超星数字图书馆正式开通,标志着世纪超星全面转向基于互联网的数字图书业务。4.3超星数字图书馆及其检索4.3.1概况及特点42超星数字图书馆是国家"863"计划中国数字图书馆示范工程项目,由北京世纪超星信息技术发展有限责任公司投资兴建,以公益数字图书馆的方式对数字图书馆技术进行推广和示范。图书馆设文学、历史、法律、军事、经济、科学、医药、工程、建筑、交通、计算机和环保等几十个分馆,目前拥有数字图书十多万种。每一位读者下载了超星阅览器(SSReader)后,即可通过互联网阅读超星数字图书馆中的图书资料。凭超星读书卡可将馆内图书下载到用户本地计算机上进行离线阅读。专用阅读软件超星图书阅览器(SSReader)是阅读超星数字图书馆藏图书的必备工具,可从超星数字图书馆网站免费下载,也可以从世纪超星公司发行的任何一张数字图书光盘上获得。由北京世纪超星信息技术发展有限责任公司倡导的图文资料数字化技术以及超星读书卡等相关的一整套数字图书馆技术解决方案和商务应用方案已成功应用于广东省中山图书馆、国家知识产权局、美国加州大学圣地亚哥分校等国内外500多家单位,成为中国乃至全世界数字图书馆建设的基本模式之一。超星数字图书馆是国家"863"计划中国数字图书馆示范工程43超星经过多年的研发,已经拥有了成熟的整套图书馆数字化解决方案,不仅占据了国内图书馆市场的理想份额,也开始跻身于世界图书馆数字化进程的领跑者行列。美国加州大学图书馆管理专家评价说:“就技术和规模而言,超星数字图书馆系统已在全世界居于领先地位,与之相比,美国至少要落后五年。”短短一年的时间,超星图书馆数字化方案已在国内外500多家单位获得应用,成为中国乃至世界数字图书馆建设的基本模式之一。
数字图书馆使图书馆离我们如此之近;而超星图书馆数字化技术又使数字图书馆离我们如此之近。会有那么一天,通过鼠标和键盘,记载人类文明成果的图书资料会方便地进入人们的生活,为文化创新注入动力,而不是被束之高阁、落满灰尘。超星经过多年的研发,已经拥有了成熟的整套图书馆数字化解决444.3.2超星数字图书馆的功能及超星阅览器1.超星数字图书馆的功能超星图书馆具有丰富的电子图书资源提供阅读,其中包括文学、经济、计算机等五十余大类,四十多万册电子图书,全文数据总量15000GB,大量免费电子图书。专为数字图书馆设计的PDG电子图书格式,具有很好的显示效果、适合在互联网上使用等优点。“超星阅览器”是国内目前技术最为成熟、创新点最多的专业阅览器,具有电子图书阅读、资源整理、网页采集、电子图书制作等一系列功能。图书不仅可以直接在线阅读,还提供下载(借阅)和打印。多种图书浏览方式、强大的检索功能与在线找书专家的共同引导,帮助你及时准确查找阅读到书籍。书签、交互式标注、全文检索等实用功能,让你充分体验到数字化阅读的乐趣。24小时在线服务永不闭馆,只要上网你可随时随地进入超星数字图书馆阅读到图书,不受地域时间限制。4.3.2超星数字图书馆的功能及超星阅览器452.超星阅览器(SuperstarReader)超星阅览器(SSReader)是超星公司拥有自主知识产权的图书阅览器,是专门针对数字图书的阅览、下载、打印、版权保护和下载计费而研究开发的。可以阅读网上由全国各大图书馆提供的、总量超过30万册的PDG格式数字图书,并可阅读其它多种格式的数字图书。超星阅览器具有文字识别、个人扫描功能;经过多年不断改进,SSReader现已发展到4.0版本,是国内外用户数量最多的专用图书阅览器之一。2.超星阅览器(SuperstarReader)464.3.3检索方法及检索实例1.单条件检索利用单条件检索能够实现图书的书名、作者、出版社和出版日期的单项模糊查询。对于一些目的范围较大的查询,建议使用该检索方案。查询实例:读者查询计算机学科中关于asp语言类图书。操作步骤如下:第1步:在“简单检索”的“检索内容”话框中敲入“asp”,在检索范围下拉菜单中选择想要查询的大类,点击“查询”图标。第2步:查询结果显示出来后,从中选择感兴趣的图书,双击“阅读”按钮进入即可阅读。4.3.3检索方法及检索实例472、高级检索利用高级检索可以实现图书的多条件查询。对于目的性较强的读者建议使用该查询。查询实例:读者查询计算机学科中书名含有“c”,作者为“谭浩强”,索书号含有“I”,出版日期在2001年的图书。操作步骤如下:第1步:点击“高级检索”,出现“高级检索”对话框。第2步:“高级检索”对话框书名一栏中敲入“c”,在检索范围下拉菜单中选择想要查询的大类,在“作者”对话框中敲入“谭浩强”,在索书号中敲入“I”,在出版日期中敲入“2001”,点击“检索”图标。第3步:查询结果显示出来后,从中选择感兴趣的图书,双击“阅读”按钮进入即可阅读。2、高级检索48第一篇信息技术与计算机课件49第2步:下载并安装超星图书阅览器超星数字图书馆必须使用超星图书阅览器阅读和下载。由于超星全文采用PDF格式,要阅读超星电子图书的全文,必须首先下载浏览器。如果系统已有该浏览器,就不必重复下载。其下载方法是:
(1)点击镜像站点“浏览器”。(2)在弹出的文件下载窗口中选择"在当前位置运行该程序",然后点击“确定”。(3)在弹出的“安全警告对话框”中选择“是”。(4)系统会提示您是否继续安装超星阅览器,请选择“是”。(5)这时会出现超星阅览器安装向导,请根据向导安装阅览器。
安装完浏览器后,就可以进行数据库的检索和阅览了。第2步:下载并安装超星图书阅览器50第3步:用户注册登陆:(1)注册成为登陆用户。初次使用者可点击“需建立书签用户在此注册”进行注册。进入注册页面,按照提示填入您的个人信息,填写完成后,点击“提交”按钮。此时,如果填写的个人信息合法,系统将提示您“注册成功,点击返回”回到主页。(2)回到主页后,在用户登陆栏中填入您注册成功的用户名和密码。点击“登陆”,成为注册用户。第3步:用户注册登陆:51第一篇信息技术与计算机课件52第2步:点击[资源]耳朵总目录前的[+]号,列表分类展开,选择类目逐层点击前面的加号[+];第3步点击图标,窗口右面的[题名]栏目出现书名,浏览书名,选择所要阅读的图书双击书名,阅览器自动跳转到新窗口并显示图书信息。例如,点击[数字图书馆]总目录前的[+]号,列表分类展开,共列有52个类目(如右图图4-6资源目录窗口所示)第2步:点击[资源]耳朵总目录前的[+]号,列表分类展开,选53第4步:依次点击[社会科学总论图书馆]前面的加号[+]和带有图标的[社会科学现状及发展]目录,窗口右面的[题名]栏目显示书名,与此同时,图标由关闭状态变为打开状态,该类图书全部集中到这个栏目中(如右图4-7资源目录窗口所示),选择一个图书点击书名,阅览器自动跳转到新窗口并显示该书信息。第4步:依次点击[社会科学总论图书馆]前面的加号[+]和带有543.使用超星浏览器阅读图书通过图书检索查找:
点击“图书搜索”按书名的关键词查找您需要的相关图书。从资源中选择图书阅读。操作步骤如下:第1步:点击“资源”耳朵,您就可以从左侧的“数字图书馆“中查看到网上最新的图书馆分类,并且分类的更新与超星数字图书馆同步。
第2步:点击图书馆分类前的"+",列表分类展开,将看到中间书名窗口显示的书名。3.使用超星浏览器阅读图书55第3步:双击书名或超星阅览器自动跳转到新窗口并显示图书信息页面。我们查询到的书目可以点击书名下面的“阅读”字样来打开该书。如下图:
图4-9超星阅览器的“阅读”窗口第3步:双击书名或超星阅览器自动跳转到新窗口并显示图书信56我们在阅读时可以通过悬浮在页面上的黄色箭头向前或向后翻页,在同一页中可以通过单击上下左右的滚动条移动页面。如果觉得字体大小不合适,则可以通过点击浏览器底部显示百分比来调节字体大小。如果需要把电子书中的某段文字引用到自己的文章中,则可以进行如下操作:(1)单击工具条上“T”按钮,然后在所需文字上用按住鼠标左键拖拉出一个虚框,如图-10所示。(2)松开鼠标左键,系统弹出如右图4-10超星阅览器的“阅读”窗口所示对话框:我们在阅读时可以通过悬浮在页面上的黄色箭头向前或向后翻页57(3)通过选择、复制和粘贴就可以将这段文字插入到自己文章中。
图4-11超星阅览器的识别文字窗口(3)通过选择、复制和粘贴就可以将这段文字插入到自己文章中。58练习41.如何查找专利或标准文献?2.如何查找学位论文?3.如何查找会议报道文献?4.读者遇到问题可以通过哪些途径咨询?5.查引文检索怎么办?6.网上有百科全书、字典、辞典等工具书吗?7.Dialog国际联机检索有哪些数据库?8.图书馆提供哪些定题服务?9.试用超星阅览器阅览自己的专业书籍。练习459第一篇信息技术与计算机课件60第一篇信息技术与计算机课件61第一篇信息技术与计算机第一篇信息技术与计算机62数字图书馆概述1数字图书馆的应用2超星数字图书馆及其检索3第四章数字图书馆数字图书馆概述1数字图书馆的应用2超星数字图书馆及其检索3第634.1.1数字时代的图书馆所谓数字图书馆,就是利用现代信息技术对有高度价值的图像、文本、语音、音响、影像、影视、软件和科学数据库等多媒体信息进行收集,组织规范性的加工和压缩处理,使其转化为数字信息,然后通过计算机技术进行高质量保存和管理,实施知识增值,并通过网络通讯技术进行高效、经济地传播、接收,使人们可以在任何时间、任何地点,都能从网上得到各种服务,为公民的终身学习机会做出贡献,成为国家的知识基础设施。同时,数字图书馆工程建设还包括知识产权、存取权限、数据安全管理,加强研究机构、商业机构、政府和教育团体之间的联系与合作等内容。“数字图书馆”在概念上存在多种解释,这从一个侧面证明了它是一个新生事物。
4.1.1数字时代的图书馆64
“数字图书馆”一词,源于1993年由美国国家科学基金会(NSF)、美国国防部尖端研究项目机构(DARPA)、国家航空与太空总署(NASA)联合发起的数字图书馆创始工程(DigitalLibraryInitiative)。以后“数字图书馆”一词迅速被全球计算机学界、图书馆界及其他相关领域所使用。通俗地讲,数字图书馆就是数字化的信息资源库(或者叫信息数据库),它应有以下几个特性:可以不断扩展。可以在统一的网络平台上运行;分散的、但在统一的标准下建设;“数字图书馆”一词,源于1993年由美国国家科学基金会(651945年,美国著名科学技术管理学家布什(V.Bush)先生在《大西洋月刊》上发表了《诚如我们想象的那样》(AsWeMayThink)一文。文中,他首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来,构思并描述了他所设想的一种Memex装备机械化的个人文档与图书馆,即台式个人文献工作系统,能存贮书、记录和通讯的装置。1948年,美国数学家维纳(N.Wiener)成为第一个指出电子计算机将能够在图书馆运作中大显身手的学者。1978年,美国著名图书馆学家兰卡斯特(F.W.Laneaster)发表了《走向无纸的时代》和《电子时代的图书馆员》两部论著,第一次向世人详细描述了电子图书馆的前景。1979年,英国不列颠图书馆的哈利(A.J.Harley)提出了“虚拟图书馆”的概念。1988年,美国国家科学基金会(NSF)的伍尔夫(W.Wulf)撰写国际合作白皮书,正式提出了数字图书馆的概念。1945年,美国著名科学技术管理学家布什(V.Bush)先生66与此同时,在一些发达国家,如英国、加拿大、日本等国也引起了极大关注。由于Internet的迅猛发展彻底地改变了传统信息服务的格局,引发了信息采集、加工、传输及获取方式的根本改变,使得从电子图书馆到虚拟图书馆再到数字图书馆应运而生。我国在1999年也将数字图书馆纳入国家、大学和科研机构的三至五年发展重点之列,并先后涌现出了一批重大成果。数字图书馆是运行在高速宽带网络上、分布式超大规模、可跨库检索的海量数字化信息资源库群。数字图书馆最大限度地利用各地已经搭建的软硬件环境,对信息资源进行接收、存储、服务。它需要拥有超大容量的分布式资源数据库群,要为用户提供可靠的信息就需要配置高性能的软、硬件基础设施。通过网络传输的信息资源是按统一标准规范加工整合过的数字化信息资源,它包括:图书、戏曲、音乐、舞蹈、电影、文化旅游、农业科技、科普知识、法律知识、文化新闻等。它超越了人们意识中图书的概念。第一篇信息技术与计算机课件67数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,就是一种拥有多种媒体内容的数字化信息资源,能为用户方便、快捷地提供信息的高水平服务机制。虽然称之为“馆”,但并不是图书馆实体。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。数字图书馆既是完整的知识定位系统,又是面向未来互联网发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播。下图(图4-1数字方舟数字图书馆的主页)是数字方舟信息技术有限公司建立的数字图书馆的主页。数字图书馆是一门全新的科学技术,也是一项全新的社会事业。68第一篇信息技术与计算机课件694.1.2数字阿图书馆的类型1.未来的数字图书馆“当你想重新温习一下《红楼梦》的时候,你只需进入图书馆的网址,找到《红楼梦》并选择下传,这时你就可以在家享受这本书了。而当你想到图书馆借书时,你会发现在图书馆你拿到的会是一张光盘,里面有你需要的图书。把图书变成数字形式,从而最大化地挖掘图书的利用率是数字图书馆建设的原因。”这席话是中国数字图书馆发展战略组组长、数字图书馆国际论坛常委副主席徐文伯在闭幕时说的。徐文伯说:“数字资源是人类社会的共同财富,将成为21世纪人类社会发展最重要的战略资源。数字图书馆国际论坛的宗旨,就是要在中外相关企业界、学术界和政府之间搭建一个相互交流的平台。通过交流和研讨,吸取国外先进科研成果和经验,促进我国数字资源建设的技术创新和体制创新。”有代表性的数字图书馆是考虑到用户使用实体图书馆的习惯或体验来设计其导航系统的,如目录系统、参考咨询台、按主题排列的数字化工具书、阅览室或馆藏资源等。第一篇信息技术与计算机课件702.国外数字图书馆国外数字图书馆大致可有如下类型:(1)以传统期刊的对应电子版为主体。(2)书目服务服务器。(3)联合体结构。(4)电子出版物存储库。上述各种数字图书馆在类型的划分上并不都是单一的,不少数字图书馆实际上采用了程度不等的混合形式,如既采用集中处理电子产品的办法,也提供书目式工具联结各地的资源;或者将NCSTRL式的开放且可扩充的结构与存储库式的集中管理结合起来,使许多地方馆藏得以挖掘和利用。2.国外数字图书馆71美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各国的数字图书馆的建设起到了极大的推动作用。近几年各国数字图书馆的研究开发高潮迭起,通过因特网可以查到的有关项目、课题有数百个之多。数字图书馆领域的研究开发是体现数字图书馆理念最好实例:充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,包括许多会议论文(例如IEEE的早期数字图书馆会议录全文),部分可能要通过付费方式,例如ACM(AssociationforComputingMachinery,实际上的美国计算机协会)的技术报告等。根据我们分析,国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:美国数字图书馆先导研究计划第一期的成功和第二期的实施,对72
类型内容特征举例技术主导型以涉及数字图书馆资源获取、存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境(Testbed)DLI1、DLI2项目资源主导型以资源数字化为目标,借助一定的技术手段(不一定是最先进的),提供因特网浏览和检索可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。“美国记忆”项目,纽约公共图书馆历史收藏项目,UNCOVER等服务主导型以各类型资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。深层次的情报服务,常常是传统图书馆向数字图书馆转型期的必然选择加里福尼亚数字图书馆项目、大英图书馆项目 类型内容特征举例技术主导型以涉及数字图书馆资源获取、存储、73上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努力带来了数字图书馆的繁荣,每一个具体的组织机构都站在它的角度、以它自己的理解进行研究或开发,涓涓细流汇成大海。数字化图书馆从一开始就不局限于一个行业或学科领域,它不仅仅是数字化资源的集合,而是数字化资源与服务,以及一系列工具的有机组成,数字图书馆的建设也不仅仅是技术问题,而是一系列目标与政策的合力。上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努744.1.3数字图书馆的教育特点1.数字图书馆教育的特点(1)数字图书馆教育是一门跨学科的综合性课程,它涉及图书、情报学、计算机、网络、法律、经济、行为学、伦理学等学科和领域。(2)它又是一门理论和实践性紧密结合的课程,课程不仅在理论上涉及面广,而且在实践操作方面对学生提出了较高的要求。(3)数字图书馆教育是一门动态的课程。①它需要根据不同的受教育者施行不同层次的教育内容;②随着数字图书馆理论和实践研究的不断深入而要对课程内容进行更新。
第一篇信息技术与计算机课件752.数字图书馆教育的目的(1)让学生了解和掌握数字图书馆各类知识;(2)让学生掌握通过网络检索各类资源的基本技能;(3)帮助学生选择最合适的信息检索工具;(4)引导学生利用网络重组信息资源和完成相关或非相关的研究任务;(5)指导学生对各类信息进行合理利用和正确评价;(6)提高学生的社会意识、法律意识和心理行为意识。2.数字图书馆教育的目的764.2
数字图书馆的应用4.2.1数字图书馆的应用技术当今科学技术日新月异,以现代信息技术,尤其是以计算机技术、高密度存贮技术、通讯技术、网络技术和多媒体(超媒体)技术为基础的数字图书馆得到飞速发展。数字图书馆的实质是利用计算机网络存储和发布大量数字化的信息系统,面对可管理的数字对象和服务的集合,实现它的存储、发现、检索、保存、获取和传递功能。而诸功能的实现则要依赖应用技术的挖掘与发展。下面就数图资源的应用技术类型及发展趋势进行简单介绍。
1描述类技术数字图书馆提供的信息资源广泛,但信息的精准率却往往达不到要求,主要原因是信息提供者片面重视信息资源内容而忽视了信息资源的描述、组织和管理。数字图书馆的简易性取决于所提供的信息资源的描述型类型和质量。标准的描述技术是实现资源共享的要求,也是数字图书馆发展的迫切需要。在数字图书馆建设中,主要指描述性元数据的建立。元数据又称为“描述数据”,是关于数据的数据,是对数据内容的描述。4.2数字图书馆的应用4.2.1数字图书馆的应用技术772.存储类技术网络存储是目前国际上一个较新的研究课题,而附网存储和存储局域网的研究在网络存储中占有重要地位,技术比较成熟,应用越来越广泛,也是数字图书馆建设的主要支柱技术之一。(1)附网存储(NetworkAttachedStorage,即NAS)NAS实际上是一个带有称之为“瘦”服务器(ThinSever)的存储设备。让服务器脱离文件处理任务,从而提高网络性能。在NAS存储结构中,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络相连,允许客户机与存储设备间进行直接的数据访问,使用TCP/IP等网络协议,通过LAN实现数据交换和存储管理。其主要特征是把存储设备与网络接口集成在一起,直接通过网络存取数据。
(2)存储局域网(StorageAreaNetwork,即SAN)它是独立于服务器网络系统之外几乎拥有无限存储的高速存储网络,它以光纤通道作为传输媒体,以光纤通道和SCSI的应用协议作为存储访问协议,将存储子系统网络化。2.存储类技术783.检索类技术(1)全文检索技术全文检索(Full-TextRetrieval)是以文本数据为主要处理对象,根据数据资料的内容而不是外在特征来实现的信息检索手段。全文检索技术是信息检索的一个分支,它的出现导致了信息检索领域的一场革命。与以前的情报检索相比,全文检索提供了全新的、强大的检索功能。全文检索系统主要包括两方面的核心技术,一个是如何建立和维护全文检索的索引数据库,另一个是如何提供快速有效的检索机制。其中索引数据库是一个全文检索系统实现的基础,它的体系结构和组织方式直接决定了检索算法和检索效率。全文检索是一个很成熟的技术,它能够解决对网页细节的检索问题。从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹配把该网页查出来,因而它是网络资源深度开发、虚拟馆藏信息资源建设的有效技术。
(2)信息定制技术信息定制技术的本质就数字图书馆而言,就是采用自有的软件技术优势,按照使用者的特定需求,包括使用者自己提交的检索策略,形成使用者自己的描述文件,为其制作出个性化的使用界面,动态即时地为使用者搜集和组织数字化信息。3.检索类技术79(3)信息抽取技术信息抽取作为一项日渐成熟的技术,在信息处理自动化中具有重要地位。在数字图书馆中,运用信息抽取技术,可以对数字信息标引、知识获取、数值库建设带来巨大的推动。
(4)三维模型检索多媒体信息资源是数字图书馆中独具特色的信息资源,随着计算机图形学以及相关软硬件技术的发展,三维模型在许多应用领域扮演着重要的角色,如机械CAD、计算机视觉、虚拟现实、游戏、分子生物学和电子商务等。主要是因为:①数字像机、数字摄像机以及扫描工具等获取三维信息和建立三维模型的技术手段不断进步和成熟,三维信息获取和表达变得越来越容易;②三维图形处理硬件和CPU的速度已足够快而价格便宜,使得三维数据能在微机上快速处理和显示;③网络的普及使人们易于应用三维数据模型。常用的几种立体视觉技术有:双像合成法;莫尔条纹法;傅里叶交换轮廓法;位相测量法;主动三角形法;几何光学聚焦法;飞行时间法等等。(3)信息抽取技术804.集成类技术数字图书馆的集成不同于一般的系统集成,它有自己的特点。首先,数字图书馆是一个海量多媒体数据库系统,信息的年增长量呈指数级增长,而且这些信息是分布式的、跨库的、多种媒体形式的,同时数字图书馆在理论上可以允许使用者无限量地访问;其次,信息源的模式和数据是不断变化的,集成系统需要适应这些改变。最后,系统需要迎合不同水平、特点、喜好的使用者。数字图书馆将硬件平台、软件平台、数据库平台等高效地集成在一起,在技术上需要遵循开放性和先进性的标准。(1)软件集成软件集成的根本是操作系统的集成,其它的应用软件可以方便地在操作系统平台上实现兼容。Windows系列平台提供了非常全面的功能,应用非常广泛。既可以满足日常办公的要求,又可满足大型复杂应用程序的要求,还可在敏感数据行业提供有效保护和自动恢复功能。Windows系列应该是当前数字图书馆集成的可行的平台策略。(2)网络集成网络集成对一个数字图书馆来说,其网络平台的建设,除一般信息系统的要求外,它在带宽、安全性和可扩充性方面有更高的要求。数字图书馆的网络集成,从技术和管理的角度主要包括传输、交换、接入和布线等方面。4.集成类技术81(3)数据集成由于数字图书馆的信息源中存在异构数据库,数据集成就是采用合适的技术手段将数字图书馆系统中的异构数据按一定的规则组织在一起,方便客户的有效访问。数据仓库是解决数据集成问题的关键技术。(4)应用集成数字图书馆系统需要解决异构系统间的交互操作问题,实现在异构环境下信息的交互,就需要解决在应用层上的集成。当前的主流集成技术大多采用面向对象的多层客户机/服务器(C/S)模型,该模型将分布在网络上的全部资源都按对象的概念组织,每个对象都有明确的访问接口,创建和维护对象实体的应用称为服务器,通过对象接口访问对象的应用称为客户机。C/S模型具有良好的开放性,易于扩展,因此基于该模型的技术表现出强大的生命力。总之,Windows系列功能强大、易于使用,在操作系统方面占主流位置,但它在稳定性和安全性方面存在一定的缺陷,网络技术发展得很快,数字图书馆在带宽安全性方面有更高的要求,数据集成是最终实现数据共享的基础,它的发展有待于做更深入的研究,比如应用集成的几种分布式计算各有优缺点,将两种或多种技术融合成比较理想的集成模式,获取技术支持在现实中是完全可行的。(3)数据集成824.2.2数字图书馆的结构不论计算机技术怎样发展,网络结构多么复杂,图书馆信息服务的基本模型始终如一,这就是“信息源—图书馆—读者”构成的三角架构,图书馆充当一个知识整理的中间人的角色。计算机与网络的出现使图书馆的信息服务能够更为全面、及时、准确、高效,数字图书馆技术在各个环节上加固了这种模型,使信息社会中图书馆得到的作用和效益发挥到极限。数字图书馆的基本结构图示如右图4-2:第一篇信息技术与计算机课件83图4-2中图书馆服务器的作用是负责管理目录数据的索引和查询,对象服务器负责管理数字化数据,是信息源,可以由图书馆设立,也可以由任何社会信息部门设立。它们与读者构成三角形架构。读者通过广域网或图书馆内部的局域网(电子阅览室)发出查询请求,经Web服务器处理后传递给图书馆服务器(类似于查询目录卡片),图书馆服务器将查询结果通知对象服务器并有对象服务器取出最终结果送达读者,这就实现了数字图书馆对象数据的发布。第一篇信息技术与计算机课件84下面介绍国内外的一些知名的数字图书馆建设计划:1.美国“数字图书馆首倡计划”
由美国科学基金会(NSF)、美国国防部高级研究计划署(DARPA)、美国宇航局(NASA)发起资助的包含6个项目的数字图书馆计划,于1994到1998财年施行,平均每个项目的资助金额为4百万美元。这个计划的任务是共同研究和发展一个用于创立、操作、利用与评价一个大跨度的不断发展的数字图书馆的试验平台,该数字图书馆的内容主要为有关地球与空间技术的科学资料。该计划的重点是偏重于进行一些试验研究,偏重于如何来测试与评价利用因特网技术面对广泛的用户群体(包括在大学校园中的学生,本地高中以及公共图书馆用户)提供服务的一个系统模型。下面介绍国内外的一些知名的数字图书馆建设计划:85“数字图书馆首倡计划”包括以下六个计划:"密西根大学数字图书馆研究计划",密西根大学"建立交互空间—为大学工程社团服务的数字图书馆结构",伊利诺斯大学"环境电子图书馆:一个可扩展的、智能的、分布式电子图书馆模型"加州大学伯克利分校"在创建与利用时集成声音、图象及语言识别能力的数字视频图书馆(Informedia)",卡内基·梅隆大学"斯坦福集成数字图书馆计划",斯坦福大学“亚历山大计划:建立一个提供大量图象及天文学信息的分步式数字图书馆”,加州大学圣巴巴拉分校目前“数字图书馆首倡计划”进入了第二阶段,新增加了几家赞助机构,它们是国家医学图书馆、美国国会图书馆、国家人文捐赠协会。这一计划的内容更为宽泛,但主要重点仍是测重于应用研究与测试平台的建立。“数字图书馆首倡计划”包括以下六个计划:862.中国国家试验型数字图书馆计划
该项计划由北京图书馆、上海图书馆、深圳图书馆、中山图书馆、南京图书馆、辽宁图书馆参与,模仿美国数字图书馆首倡计划,侧重技术方案的实现,兼顾资源的数字化,并设立了一项软课题研究。计划完成后将在网上建立多馆合作的数字图书馆网页。然而限于经费,该计划主张尽量采用免费软件。原定计划于2000年完成,目前进度有些拖后。近年来,随着计算机及网络技术在图书馆的广泛应用,图书馆自动化建设已取得了很大发展。多数大中型图书馆和部分小型图书馆已经实现了自动化管理,建立了本馆的馆藏书目数据库。但如何能使这些数据库资源发挥更有效的作用,实现本馆读者及更广泛用户的远程检索,达成真正意义上的资源共享,是许多图书馆自动化发展面临的新问题。2.中国国家试验型数字图书馆计划874.2.2国内外图书馆网络1.国内外的图书馆网络(1)国内数字图书馆清华大学图书馆北京高校网络图书馆中国期刊网北京市公共图书馆信息服务网络国家图书馆中国科学院文献情报中心超星数字图书馆北京大学图书馆中国教育与科研技术网中国高等教育文献保障系统书生之家西安交通大学数字图书馆园地上海交通大学数字图书馆上海数字图书馆4.2.2国内外图书馆网络北京大学图书馆88(2)国外数字图书馆
美国数字图书馆电子杂志
美国数字图书馆联盟
国际图书馆协会联合会
数字信息杂志
图书馆杂志
万维网联盟
美国联机图书馆中心美国国会图书馆
澳大利亚数字图书馆计划
美国加州大学伯克利分校数字图书馆
都柏林核心元数据计划
信息科学与技术数字图书馆
英国国家图书馆(2)国外数字图书馆美国国会图书馆891.国内外知名的国家图书馆下面我们来介绍国内外知名图书馆的一些具体情况。(1)中国国家图书馆中国国家图书馆是中国的国家图书馆,中国国家图书馆旧称北京图书馆,一般简称“国图”。中国国家图书馆馆藏宏富,品类齐全,古今中外,集精撷萃。作为国家藏书机构,中国国家图书馆依法接收中国大陆各出版社送缴收藏的出版样书,此外还收藏中国大陆的非正式出版物,例如各高校的博士学位论文均在中国国家图书馆的收藏之列。是图书馆学专业资料集中收藏地和全国年鉴资料收藏中心。从藏书量和图书馆员的数量看,中国国家图书馆(即北京图书馆)是亚洲规模最大的图书馆,世界上最大的国家图书馆之一,是世界著名的国家图书馆。1.国内外知名的国家图书馆90中国国家图书馆的藏书可上溯到700多年前的南宋皇家缉熙殿藏书,最早的典藏可以远溯到3000多年前的殷墟甲骨。国家图书馆的馆藏文献中珍品特藏包括善本古籍、甲骨金石拓片、中国古旧舆图、敦煌遗书、少数民族图籍、名人手稿、中国少数民族文献、革命历史文献、家谱、地方志和普通古籍等260多万册(件)。外文善本中最早的版本为1473-1477年间印刷的欧洲“摇篮本”。这部分藏品极为珍贵,闻名遐迩,世界瞩目。截至到2005年,中国国家图书馆的藏书容量达2500多万册,其中价值连城的古籍善本就有200余万册,著名的《永乐大典》、《四库全书》等举不胜举。其中尤以“四大专藏”即“敦煌遗书”、“赵城金藏”、“永乐大典”和“文津阁四库全书”最受瞩目。2007年6月8日,中国国家图书馆获得国家文化部颁布的首届文化遗产日奖。中国国家图书馆的藏书可上溯到700多年前的南宋皇家缉熙殿91目前中国国家图书馆服务的读者对象主要为年满18周岁的中华人民共和国公民和持有有效证件的其他国家公民,依照读者的受教育程度、专业技术职称和行政级别不同为读者办理不同层次水平的借书证或阅览证,如年满18周岁的中国公民可以办理最低档次的中文第二外借库借书证;在读的硕士研究生可以办理中文第二外借库借书证;在读博士研究生可以办理外文图书借书证;具有高级职称的人员凭单位证明可以办理善本库阅览证。中国国家图书馆实行年度注册制。读者办理借阅证分长期证与临时证两种。下面是中国国家图书馆的主页:
图4-3中国国家图书馆的主页目前中国国家图书馆服务的读者对象主要为年满18周岁的中华92第一篇信息技术与计算机课件934.2.3图书全文检索全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点,在此不做详述。4.2.3图书全文检索94第一篇信息技术与计算机课件954.2.4搜索引擎搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。1.搜索引擎的工作原理搜索引擎的工作原理大致可以分为:
(1)搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。4.2.4搜索引擎96(2)整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。(3)接受查询:用户向搜索引擎发出查询,搜索引擎接受查询
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 景荷中学七年级上学期科学期中试卷(到第3章)
- 新概念英语第一册教材分析与计划
- 职业教育减负改革的心得体会
- 教师与家长沟通技巧培训心得体会
- 茶艺师实习基地建设计划
- 苏教版二年级下册数学家校沟通计划
- 广西壮族自治区2024-2025学年高二下学期4月期中考试英语试题(解析版)
- 某年度功能性电刺激仪系列产业分析报告
- 改性BiOI复合材料的制备及其光催化性能研究
- 2025-2030中国戏曲音乐文化行业市场发展分析及发展趋势与投资前景研究报告
- 外科手术护士术前准备
- TBNCY002-2023 西双版纳红茶 晒红茶
- 护理健康教育的重要性
- 妊娠纹的预防与治疗
- 生物技术制药-基因工程病毒疫苗
- 表观遗传学与肿瘤课件
- 《可靠性工程基础》课件
- 建筑材料损耗率定额
- 【2023《上汽集团公司营运能力现状及问题探析》8300字(论文)】
- 我是小小讲解员博物馆演讲稿
- 粮安工程粮库智能化升级改造 投标方案(技术标)
评论
0/150
提交评论