已阅读5页,还剩59页未读, 继续免费阅读
(计算机应用技术专业论文)基于web的数字图书馆信息查询系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东北大学硕士学位论文摘要 基于w e b 的数字图书馆信息查询系统的研究与实现 摘要 随着i n t e r n e t 的发展,网络信息化服务日益成为人们获得信息的重要途径。而传统 上作为知识传播重要媒体的图书馆,也开始步入了数字图书馆时代。数字图书馆的所有 载体的信息均能以数字化的形式获得,并且利用网络连接到全球各个角落,让人们很方 便地共享资源。 w e b 数据库技术是w e b 技术和数据库技术的结合,不仅把w e b 和数据库的优点集 中在了一起,而且充分利用了大量现有的数据库信息资源,使用户可以方便的在w e b 浏览器上查询和浏览数据库内容。 基于这种w e b 数据库技术,本文着重研究了数字图书馆的信息查询系统,对其关 键技术一w e b 数据库连接技术和w e b 数据库查询优化算法,进行了具体的分析和比较, 提出了采用a d o 和a s p 技术的w e b 数据库连接技术和基于遗传算法的w e b 数据库查 询优化算法。并以东北大学图书馆为应用背景,设计并实现了基于b s 结构的东北大学 数字图书馆o p a c ( o n l i n ep u b l i c a c c e s sc a t a l o g ) 系统。该系统采用w e b 数据库技术, 实现了对东北大学馆藏数据库的网上信息查询功能。o p a c 系统一共包括七个模块,分 别为:书籍信息查询模块、新书通报模块、读者信息模块、留言与公告模块、催还通知 模块、预约通知模块、期刊篇目查询模块。针对书籍信息查询模块中参与查询的数据源 多,数据量较大以及各种数据源的查询处理能力差别较大等特点,本系统采用了结合数 据源查询处理能力的遗传算法来求解多数据源连接查询优化问题,并设计了与问题相适 应的交叉变异概率、编码方法、交叉算子和变异算子。最后通过实验测试,书籍信息查 询模块在使用遗传算法后查询效率获得了一定的提高。 关键词:数字图书馆;w e b 数据库;b s 结构;遗传算法;a s p ;a d o i l 东北大学硕士学位论文a b s t r a c t r e s e a r c ha n d i m p l e m e n t a t i o no f a n i n f o r m a t i o nq u e r y s y s t e mf o rd i g i t a ll i b r a r y o n 何名b a b s t r a c t w i t ht h ed e v e l o p m e n to fi n t e m e t ,t h ew e bi n f o r m a t i o ns e r v i c eh a si n c r e a s i n g l yb e c o m e a ni m p o r t a n tw a yt h a tp e o p l eg e ti n f o r m a t i o n l i b r a r y , a so n eo ft h em o s ti m p o r t a n t t r a d i t i o n a lm e d i at os p r e a dk n o w l e d g e ,a l s ob e g i n st os t e pi n t ot h ed i g i t a ll i b r a r yt i m e a l lt h e i n f o r m a t i o nf o rt h ec a r r i e r so ft h ed i g i t a ll i b r a r yc o u l db ea c q u i r e di nad i g i t a lw a y ;a tt h e s a m et i m e ,i te a r lb ec o n n e c t e d 、v i 1t h ew h o l ew o r l db ym e a n so fi n t e m e t ,s ot h a tp e o p l e c o u l ds h a r et h ed i g i t a lr e s o u r c e sv e r yc o n v e n i e n t l y w 曲d a t a b a s et e c h n o l o g yc o m b i n e st h ew e bt e c h n o l o g yw i t ht h ed a t a b a s et e c h n o l o g y n o to n l yd o e si tp u tt h ea d v a n t a g e so fb o t ht h ew e ba n dt h ed a t a b a s et o g e t h e r , b u ta l s ot a k e f u l lu s eo ft h ea b u n d a n te x i s t i n gd a t a b a s ei n f o r m a t i o nr e s o u r c e sf o rt h ec o n v e n i e n c eo ft h e u s e r st os e a r c ho nw e bb r o w s e ra n df o rt h ed a t a b a s ec o n t e n t o nt h eb a s i so ft h i sw e bd a t a b a s et e c h n o l o g y , t h i sp a p e re m p h a s i z e st os t u d yt h e i n f o r m a t i o nq u e r ys y s t e mo ft h ed i g i t a ll i b r a r y , c o n c r e t e l ya n a l y z e sa n dc o m p a r e si t sk e y t e c h n o l o g y - w e bd a t a b a s ec o n n e c t i n gt e c h n o l o g ya n dw e bd a t a b a s eq u e r yo p t i m i z a t i o n a l g o r i t h m s ,a n dp u tf o r w a r dt h ew e bd a t a b a s ec o n n e c t i n gt e c h n o l o g yb ym e a n so fa d oa n d a s pa sw e l la st h ew e bd a t a b a s eq u e r yo p t i m i z a t i o na l g o r i t h m sb a s e do ng e n e t i ca l g o r i t h m w i t ht h ea p p l i c a t i o nb a c k g r o u n do fn e ul i b r a r y , t h ep a p e rd e s i g n sa n dr e a l i z e st h eo p a c ( o n l i n ep u b l i ca c c e s sc a t a l o g ) s y s t e mo f n e ud i g i t a ll i b r a r yo nt h eb a s i so fb ss t r u c t u r e ,a s y s t e ma d o p t i n gt h ew e bd a t a b a s et e c h n o l o g ya n dr a l i z i n gt h en e t b a s e di n f o r m a t i o nq u e r y f u n c t i o no fn e u d i g i t a ll i b r a r yd a t a b a s e + o p a cs y s t e mc o n t a i n sa l lt o g e t h e rs e v e nm o d u l e s , t h e ya r eb o o ki n f o r m a t i o nq u e r ym o d u l e ,n e wb o o k a v i s om o d u l e ,r e a d e ri n f o r m a t i o nm o d u l e , l e f tw o r da n db u l l e t i nm o d u l e ,b o o kr e t u r nn o t i c em o d u l e ,b o o k i n gn o t i c em o d u l e ,a n d m a g a z i n eq u e r ym o d u l e t or e s o l v et h ek i n do fp r o b l e m sl i k et h e r ea r em o r eq u e r yd a t a r e s o u r c e sa n dl a r g ea m o u n to fd a t a si nb o o ki n f o r m a t i o nq u e r ym o d u l e ,e v e nt h ep r o b l e ml i k e t h ed e f f e r e n tq u e r ym a n a g e m e n ta b i l i t i e si nd i f f e r e n td a t ar e s o u r c e s ,t h i ss y s t e ma d o p t sg a ,a m e t h o dj o i n e dw i t ht h ed a t ar e s o u r c eq u e r ym a n a g e m e n ta b i l i t y , t od e a lw i t l l q u e r y o p t i m i z a t i o np r o b l e mc o n n e c t i n gw i t hm u l t i - d a t ar e s o u r c e s ;m o r e o v e r , i td e s i g n se n c o d e 东北大学硕士学位论文 a b s t r a c t m e t h o d ,c r o s s o v e ra n dm u t a t i o no p e r a t o rm a t c h i n gt h ep r o b l e m f i n a l l y , v i ae x p e r i m e mt e s t , b o o ki n f o r m a t i o nq u e r ym o d u l eh a si m p r o v e di t s q u e r ye f f i c i e n c yt os o m ee x t e n ta f t e r d o p t i n gg a k e yw o r d s :d i g i t a ll i b r a r y ;w e bd a t a b a s e ;b ss t r u c t u r e ;g e n e t i ca l g o r i t h m ;a s p ;a d o 东北大学硕士学位论文 独创声明 独创声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加 以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为 获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论 文中作了明确的说明并表示诚挚的谢意。 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即 学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交 流。 ( 如作者和导师同意网上交流,请在下方签名:否则视为不同意) 学位论文作者签名:导师签名 签字日期:签字日期 弘 易乃翻 厶义年 覆酌咱一细 签 融 懿 期 文 z 够 字 东北大学硕士学位论文 第一章引言 第一章引言弟一早ji 甬 伴随着现代高新技术的飞速发展,以计算机技术、网络通信技术为代表的因特网迅 速崛起,推动人类社会在经历了农业社会和工业社会后,开始进入信息社会。与此相适 应,图书馆在走过传统图书馆阶段、自动化图书馆阶段后,也开始步入数字图书馆阶段。 这将是图书馆历史上的一次革命。 1 1 数字图书馆 1 1 1 数字图书馆的概念 数字图书馆( d i g i t a ll i b r a r y ,缩写为d l ) ,是进入9 0 年代以后产生的一个全新的 概念。随着计算机技术的迅猛发展,特别是网络技术、数码存储与传输技术等的全面普 及,使得人们对文献信息的加工、存储、查询、利用等方面有了新的要求。因此,数字 图书馆也就应运而生。它是一个新生事物,目前,在图书馆界甚至整个学术界还没有一 个被广为接受有定义。从众多的定义表述中,其中认为数字图书馆是以组织数字化信息 及其技术进入图书馆并提供有效服务【l 】。几乎图书馆的所有载体的信息均能以数字化的 形式获得,包括所有联机采购,编目,公共查询;对各种信息资源的检索,通过网络组 织读者访问外界数字图书馆和文献信息数据库系统,如电子杂志、电子图书、声像资料 、动画片、影视片、多媒体资料等:用计算机系统管理图书、期刊等的读者服务;图书 馆利用网络连接到全球各个角落,让人们很方便地共享资源。通俗地说,数字图书馆是 没有时空限制的、便于使用的、超大规模的知识中心。 数字图书馆的特征如下: ( 1 ) 文献内容数字化 文献内容数字化包括:馆藏文献、外部电子信息资源、网上资源和非网上资源的数 字化和技术处理。即采用数字图书馆有关数据存储和标识技术,对数字文本、图像、视 频、音频资料分级存储,用调度系统把它们有机地集成在一起。 ( 2 ) 利用计算机技术管理己数字化的各种文献信息资源 利用计算机来管理多媒体文献信息资源,管理的内容包括多媒体信息数字化、数字 化信息的标识与描述、组织规范性加工与存储、存取服务的管理、知识产权、存取权限、 数据安全管理等。最终利用计算机技术、通信技术、网络技术、高密度存储技术建成具 东北大学硕士学位论文第一章引言 有管理功能的数字图书馆。 ( 3 ) 文献信息传递网络化 网络连接着数字图书馆的计算机和用户桌面上的个人计算机,用户通过网络提交查 询请求或者进行浏览,服务器将查询到的结果或者相应的数字化馆藏信息通过网络返回 给用户。通过网络,数字图书馆可以服务的用户将不再受地域的限制。 ( 4 ) 异构性 数字图书馆是庞大的海量分布式数据库系统,它是由多个异构的成员数据库系统组 成,其中包括馆藏书目数据库、电子图书数据库以及多种方式加工的图书期刊数据库等。 这些数据库的异构性体现为各个成员数据库之间在硬件平台、操作系统或数据库管理系 统等方面的不同。 1 1 2 数字图书馆的起源和发展 数字图书馆的原形规划与试验始于1 9 9 3 年,美国国家科学基金会( n s f ) 、国家宇 航局( n a s a ) 和国防部高级项目局( a r p a ) 联合公布“数字图书馆倡议”。到1 9 9 4 年,三方正式决定投资2 4 0 0 万美元,在斯坦福等六所大学进行数字图书馆的分项研究, 其中影响最大的是美国国会图书馆的“美利坚记忆”计划( a m e r i c a nm e m o r y ) 1 2 1 。其 它国家如英国的不列颠图书馆、法国国家图书馆、臼本关西图书馆也都制定出类似研究 计划并着手实现。 我国数字图书馆建设工作始于1 9 9 5 年,目前仍属起步建设阶段。1 9 9 6 年7 月至1 9 9 9 年1 2 月。我国由北京图书馆、中山图书馆、上海图书馆、深圳图书馆、辽宁图书馆、 南京图书馆、文化部文化科技开发中心共同承担实施中国试验型数字图书馆( c p d l p ) 项目 3 1 。该项目实施包括分两大部分:首先,研制一套初步成形的数字式图书馆的实现 技术,它应具有与国际接轨的特点,同时要适合在中国推广。其次,逐步建设一个规范 化的分布式数字资源库。 数字图书馆的研究方向是最终建立一个智能化、个性化和自动化的服务平台,完成 对多种格式数据的搜集、整理和再加工,通过网络提供高速的多媒体信息服务。并且, 还要充分考虑满足当前需要、适应资源共享和可持续发展的目标,实现远程、快速、全 面、有序、智能、特色等数字化服务优势。 1 1 ,3 数字图书馆与w e b 数据库技术 图书馆发展到今天已经经历了以下几个阶段:以藏为主的传统型图书馆,引进了一 东北大学硕士学位论文 第一章引 言 有管理功能的数字图书馆。 ( 3 ) 文献信息传递网络化 网络连接着数字图书馆的计算机和用户桌面上的个人计算机,用户通过网络提交查 询请求或者进行浏览,服务器将查询到的结果或者相应的数字化馆藏信息通过网络返回 给用户。通过网络,数字图书馆可以服务的用户将不再受地域的限制。 ( 4 ) 异构性 数字图书馆是庞人的海量分布式数据库系统,它是由多个异构的成员数据库系统组 成,其中包括馆藏书目数据库、电子图书数据库以及多种方式加工的图书期刊数据库等。 这些数据库的异构性体现为各个成员数据库之间在硬件平台、操作系统或数据库管理系 统等方面的不同。 1 1 2 数宇图书馆的起源和发展 数字图书馆的原形规划与试验始于1 9 9 3 年,美国国家科学基金会( n s f ) 、困家宇 航局( n a s a ) 和国防部高级项目局( a r p a ) 联合公柑“数字图书馆倡议”。到1 9 9 4 年,三方诈式决定投资2 4 0 0 万美元,在斯坦福等六所大学进行数宁图书馆的分项研究, 其中影响最大的是美圜国会图书馆的“美利坚记忆”计划( a m e r i c a nm e m o r y ) f ”。其 它国家如英国的不列颠图书馆、法国国家图书馆、日本关西图书馆也都制定出类似研究 计划并着手实现。 我国数字图书馆建设工作始丁1 9 9 5 年,目前仍属起步建设阶段。1 9 9 6 年7 月至1 9 9 9 年1 2 月。我国由北京图书馆、中山图书馆、上海图书馆、深圳图书馆、辽宁图书馆、 南京图书馆、文化部文化科技开发中心共同承担实施中国试验埤 数字图书馆( c p d l p ) 项目1 3 1o 该项目实施包括分两大部分:首先,研制套初步成形的数字式图书馆的实现 技术,它应具有与国际接轨的特点,同时要适合在中国推广。其次,逐步建设一个规范 化的分布式数宁资源库。 数字图书馆的研究方向足最终建立一个智能化个性化和自动化的服务平台,完成 对多种格式数据的搜集、整理和再加t ,通过网络提供高速的多媒体信息服务。并且, 还要允分考虑满足当前需要、适应资源共享和町持续发展的目标,实现远程、快速、牟 面、有序、智能、特色等数字化服务优势。 1 1 3 数字图书t 官与w e b 数据库技术 图书馆发展到今天已经经历了以下几个阶段:以藏为丰的传统型图书馆,引进了一 图仁馆发展到今天已经经历了以下几个阶段:以藏为主的传统型图书馆,引进_ 厂一 一7 东北大学硕士学位论文第一章引 言 些如传真、胶片等新技术手段,开始强调满足读者要求的近代图书馆;引进了计算机化 管理系统,以开放为特征的自动化图书馆。随着i n t e r n e t 的迅猛发展,引进了由以往单 一的文本方式转变为以图形、声音、动画、视频等多媒体信息为主的数字图书馆。而且 随着数字图书馆建设的不断发展,用户访问图书馆无须跑到图书馆,而是直接将自己的 计算机联网,登陆i n t e r n e t 即可。离开了w e b ,数字图书馆将无法发挥其功能,所以说 w e b 是建立数字图书馆的基础。 数字图书馆是一座巨大的信息资源宝库。通过网络,数字图书馆间可以实现数字馆 藏资源的共享。所以说数字图书馆存储的数据是海量的。如何管理这些海量的数据,如 何在这其中完成信息查询,如何同时为大量并发的用户提供流畅的服务都是数字图书馆 开发中面临并需要解决的现实问题。 异构性是数字图书馆的开发和实施中不可回避的一个问题。从计算机技术的角度来 看,数字图书馆面临的许多困难可以归结为一个问题:怎样达到互操作性。也就是说, 怎样协调各式各样的计算机系统共同工作也是一个复杂的问题。 总之,在数字图书馆的实际开发和建设中,必须充分认识到数字图书馆的以上特点, 采用合适的技术来解决问题。而w e b 数据库技术的跨平台、跨语占的特点,无疑使其 在数字图书馆的开发和建设中起到十分重要的作用。 1 2 本文研究内容与论文结构 本文研究内容:基于w e b 数据库技术,着重研究了数字图书馆的信息查询系统, 对其关键技术一w e b 数据库连接技术和w e b 数据库的查询优化算法进行了详细的分析 和比较,提出了a d o 和a s p 技术的w e b 数据库连接技术和基于遗传算法的w e b 数据 库查询优化算法。然后以东北大学数字图书馆为应用背景,设计并实现了基于w e b 方 式的o p a c ( o n l i n ep u b l i c a c c e s sc a t a l o g ) 系统的信息查询。o p a c 系统采用了w e b 数 据库技术,实现了对东北大学馆藏数据库的网上信息查询功能。此系统共有七个模块, 即书籍信息查询模块、新书通报模块、读者信息模块、留言与公告模块、催还通知模块、 预约通知模块、期刊篇目查询模块等。最后以书籍信息查询为背景,采用遗传算法来实 现多数据源的w e b 数据库查询优化。本文共分七章。其中, 第一章主要论述了数字图书馆的概念、起源和发展,并且对数字图书馆与w e b 数 据库技术之问的联系进行了分析。最后,对作者在基于w e b 的数字图书馆信息查询系 东北大学硕士学位论文第一章引言 统的研究与实现过程中韵主要研究内容进行了叙述。 第二章首先论述了w e b 数据库起源、发展,然后对w e b 数据库的连接技术、查询 优化技术进行了相关的介绍。 第三章首先对两种流行的体系结构进行了比较,确定了数字图书馆信息查询系统韵 三层b s 模式;然后研究了基于w e b 的数字图书馆的体系结构。 第四章重点研究了几种w e b 数据库连接技术,并进行了详细的分析和比较。 第五章研究了w e b 数据库查询优化算法。重点对遗传算法在数据库查询优化中的 运用进行了详细的研究。 第六章首先介绍东北大学数字图书馆o p a c 系统的系统架构和功能模块,然后介绍 了此系统中w e b 数据库连接技术的实现,最后重点研究了在书籍信息查询模块中用遗 传算法实现了多数据源w e b 数据库的查询优化,并且给出了实验测试结果。 第七章作为全文的总结。 东北大学硕士学位论文第二章w e b 数据库技术综述 第二章w e b 数据库技术综述 2 1w - e b 技术 2 1 1w e b 的起源与发展 w o r l d 、i d ew e b ( w w w ) 也称w e b ,中文翻译成万维网,简称w e b 。首先要着重 指出的是,w o r l dw i d ew e b 并不等于i n t e m e t 。从字面意义上看,i n t e m e t 是一个网络, 而w e b 则不仅仅是个网络,而是一组分布式通信应用程序和系统软件。在w e b 之前 i n t e m e t 上的信息只有文本形式。w e b 将图形、音频、视频信息集合于一体。 随着i n t e m e t 的普及和发展,w e b 也迅速繁荣起来。1 9 9 2 年之前,w e b 还没有什么 影响力,但是到了1 9 9 6 年,它己经占据i n t e r n e t 传送总量的2 5 ,遥遥领先于其他各项 i n t e m e t 服务,曾经是i n t e r n e t 龙头的f t p 己退居第二,传统的文件传送服务正在逐渐萎 缩。其他的i n t e m e t 服务除e m a i l 外均处于下降趋势。随着越来越多的公司、网络以及 国家进入i n t e m e t ,越来越多的用户会通过浏览器浏览w e b ,它的地位还会变得越来越 重要。 w e b 的迅速增长的根本原因在于:w e b 以简单的操作方式统一了i n t e m e t 和技术领 域,甚至可以涵盖其他的i n t e m e t 服务。i n t r a n e t 的崛起也推动了w e b 的进一步发展。 i n t r a n e t 利用i n t e m e t 特别是w e b 的相关技术建立企业内部网,使w e b 飞速进入商业领 域,成为最重要的信息发布工具之一。 作为一组软件和协议组成的开放式信息系统,w e b 具有以下特征: 它通常驻留在i n t e m e t 主机和客户机上; 它能理解h t m l 语言; 它采用客户柳服务器的双向通信、信息收集和资源服务模式; 允许客户程序使用h t t p 、f t p 、t e l n e t 和g o p h e r 等各种协议来访问服务器; 通过统资源定位器( u r l ) 进行文档和资源访问; 允许客户程序访问由各种多媒体类型如文本、音频和视频数据组成的信息。 2 1 2 标记语言 标记语言是w e b 页面的描述语言,不管是在w e b 上发布信息,还是编写可供用户 交互的程序,都需要通过标记语言来实现。标记语言主要有三种:s g m l ,h t m l ,x m l 。 东北大学硕士学位论文第二章w e b 数据库技术综述 s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ) ,即标准通用标记语言。s g m l 是 一种用标记来描述文档资料的通用语言,它包含了一系列的文档类型定义( 简称d t d ) , d t d 中定义了标记的含义,因而s g m l 的语法是可以扩展的。s g m l 十分庞大,既 不容易学,又不容易使用,在计算机上实现也十分困难。鉴于这些因素,w e b 的发明者 一欧洲核子物理研究中心的研究人员根据当时( 1 9 8 9 年) 计算机技术的能力,提出了 h t m l 语言。 h t m l ( h y p e rt e x tm a r k u pl a n g u a g e ) 只使用s g m l 中很小一部分标记,例如h t m l 3 2 定义了7 0 种标记。为了便于在计算机上实现,h t m l 规定的标记是固定的,即h t m l 语法是不可扩展的,它不需包含d t d 。h t m l 这种固定的语法使它易学易用,在计算 机上开发h t m l 的浏览器也十分容易。f 是由于h 刚l 的简单性,使w e b 技术从计 算机界走向全社会,走向千家万户,w e b 的发展如同中天。但是h t m l 过于简单的语 法严重地阻碍了用它来表现复杂的形式。 x m l ( e x t e n s i b t em a r k u pl a n g u a g e ) 是一个精简的s g m l ,它将s g m l 的丰富功 能与h t m l 的易用性结合到w e b 的应用中。x m l 保留了s g m l 的可扩展功能,这使 x m l 从根本上有别于h t m l 。x m l 要比h t m l 强大得多,它不再是固定的标记,而 是允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构。h t m l 只是 w e b 显示数据的通用方法,而x m l 提供了一个直接处理w e b 数据的通用方法。h t m l 着重描述w e b 页面的显示格式,而x m l 着重描述的是w e b 页面的内容。 2 1 3 脚本语言 所有的w e b 页面都是由脚本语言来编写实现的。w e b 脚本语言有多种,主要包括 a s p 、p h p 、j s p 等。 a s p 【5 ( a c t i v es e r v e rp a g e ) 是一种服务器端的指令环境,用来建立并执行交互式 w e b 服务器端程序。a s p 可以结合服务器端指令、h t m l 网页,以及c o m 组件,建 立动态交互且高效的w e b 服务器应用程序。a s p 使w e b 开发者可以用各种脚本语言编 写程序而不用担心浏览器是否支持。实际上,在一个a s p 文件中就可以使用多种脚本语 言,只要你在每段脚本程序开始处用h t m l 标签标明所用的脚本语言。a s p 脚本语言 包括v b s c r i p t 和j a v a s c r i p t ,可以根据需要灵活选择,也可以混合使用。 p h p 是最流行的w e b 脚本语言之一,并且作为首选的l i n u xw e b 脚本语言迅速发 展出来。它也是运行在w e b 服务器端,根据用户请求或服务器端的数据产生动态网页。 东北大学硕士学位论文第二章w e b 数据库技术综述 p h p 是几种强大功能的混和物,包括p e r l 、c 、j a v a 、甚至某些a s p ,并且支持未定义 变量,并且非常易于扩展。p h p 和h t m l 脚本融合在一起,并内建访问数据库的能力。 它能够作为a 口a c h ew e b 服务器的模块执行,也使得它的执行效率要高于普通的c g i 程 序。 j s p ( j a v as e r v e rp a g e s ) 作为w e b 脚本语言之一,相对来说还是一个新技术,但是 已经有了明确的市场方向。与其他脚本语言相比,j s p 实现了动态页面与静态页面的分 离,脱离了硬件平台的束缚,以及编译后运行等方式大大提高了其执行效率。j s p 基于 j a v a ( 并且几乎能做到j a v a 可以做的任何事情,这就开放了一个巨大的a p i 库以及类库) 而且由于被称为标记库的j s p 扩展使j s p 能模仿c o l d f u s i o n 的标记类型a p i ,因此我们 有理由认为,在未来几年中,j s p 将成为w e b 脚本语言的核心。 2 2 数据库技术 2 2 1 数据库技术的发展与现状 数据库技术【6 的萌芽出现于6 0 年代中期。当时计算机开始广泛地应用于数据管理, 对数据的共享提出了越来越高的要求。传统的文件系统已经不能满足人们的需要,能够 统一管理和共享数据的数据库管理系统( d b m s ) 应运而生。数据库技术自产生起,已 经从第一代的网状、层次数据库,第二代的关系数据库系统,发展到第三代以面向对象 模型为主要特征的数据库系统。数据库技术与网络通信技术、人工智能技术、面向对象 程序设计技术、并行计算技术等互相渗透,互相结合,成为当前数据库技术发展的主要 特征。 数据模型是数据库系统的核心和基础,通常由数据结构、数据操作和完整性约束三 部分组成。因此,数据库发展阶段的划分是以数据模型的进展作为主要的依据和标志的。 第一代数据库以网状数据库系统和层次数据库系统为代表,它们分别为层次模型和 网状模型。网状数据库是最早出现的,网状模型中以记录为数据的存储单位。记录包含 若干数据项。网状数据库的数据项可以是多值的和复合的数据。网状数据库是导航式 ( n a v i g a t i o n ) 数据库,用户在操作数据库时不但说明要做什么,还要说明怎么做。网 状数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在关系数据库出现之 前网状d b m s 要比层次d b m s 用得普遍。层次数据库管理系统是紧随网状数据库而出 现的,用来模拟层次组织起来的事物。层次数据库也是按记录来存取数据的。层次数据 模型中最基本的数据关系是基本层次关系,它代表两个记录型之间一对多的关系,也叫 东北大学硕士学位论文第二章w e b 数据库技术综述 做双亲子女关系( p c r ) 。层次数据模型对应于有根定向有序树,网状模型对应的是有 向图,所以统称为格式化数据模型。 网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独 立性和抽象级别上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明确数 据的存储结构,指出存取路径,关系数据库较好地解决了这些问题。 第二代数据库就是以关系数据库系统为代表,它支持关系模型。关系数据模型是以 集合论中的关系概念为基础发展起来的。关系模型中无论是实体还是实体间的联系均由 单一的结构类型一关系来表示。在实际的关系数据库中的关系也称表。一个关系数据库 就是由若干个表组成。关系模型不仅简单、清晰,而且有关系代数作为语言模型,有关 系数据理论作为理论基础。因此关系数据库系统具有形式基础好、数据独立性强、数据 库语言非过程化等特色。据统计,7 0 年代以来新发展的d b m s 系统中,近百分之九十 是采用关系数据模型,其中涌现出了许多性能优良的商品化关系数据库管理系统。例如, 小型数据库系统f o x p r o 、a c c e s s 、p a r a d o x 等,大型数据库系统d b 2 、i n g r e s 、o r a c l e 、 s y b a s e 、i n f o r m i x 、s q ls e r v e r 等。 关系数据库系统的数据模型虽然描述了现实世界数据的结构和一些重要的相互联 系,但是仍不能捕捉和表达数据对象所具有的丰富而重要的语义,因此只能属于语法模 型。 第三代的数据库系统将是以更加丰富的数据模型和更强大的数据管理功能为特征, 以满足传统数据库系统难以支持的新的应用要求。从8 0 年代以来,数据库技术在商业 领域的巨大成功刺激了其他领域对数据技术需求的迅速增长。这些新的领域为数据库应 用开辟了新的天地,并在应用中提出的一些新的数据管理的需求,直接推动了数据库技 术的研究与发展,尤其是面向对象数据库系统( o b j e c to r i e n t e dd a t a b a s es y s t e m 简称 o o d b s ) 的研究与发展。第三代数据库模型是数据库技术发展的方向,而且随着与其 它学科的结合,出现了许多新型数据库,如分布式数据库、并行数据库、演绎数据库、 知识和主动数据库、多媒体数据库、模糊数据库。这些形成数据库领域的众多分支,极 大丰富和发展了数据库技术。 2 2 2 分布式数据库 由上节所知,分布式数据库属于第三代的新型数据库。分布式数据库【7j 兴起于7 0 年代中期,推动其发展来自两方面:一方面是应用需求,另一方面是硬件环境的发展。 一8 东北大学硕士学位论文;g z - 章w e b 数据库技术综述 如:全球及全国范围内的航空铁路旅游订票系统、银行通存通兑系统、连锁配送管理 系统等等。这些应用都涉及地理上分布的团体、组织的局部业务管理和系统全局管理, 采用成熟的集中式数据库管理系统已无法实现应用需求。在硬件环境上提供了功能强大 的计算机和成熟的广域范围公用数据网及局域范围局域网的硬件环境支持。 分布式数据库系统( d i s t r i b u t e dd a t a b a s em a n a g e m e n ts y s t e m ,d d b m s ) 是地理上 分散而逻辑上集中的数据库系统。即通过计算机网络将地理上分散的各局域结点连接起 来共同组成一个逻辑上统一的大数据库系统。因此可以说:分布式数据库系统是计算机 网络技术和数据库技术的结合的产物。分布式数据库系统可以有以下两种模式:一种是 一个新的总体设计的系统。这种系统一切从全局做起,在各个结点上应采用相同的操作 系统、相同的数据库管理系统软件,甚至相同的硬件。这种系统在处理和通信上都有很 大的方便,成为同构的分布式数据库系统。另一种是以前有了各个子系统,它们所采用 的操作系统、数据库管理系统等软件、机器硬件等都可以是不相同的。这些由不同数据 库系统联接所构造的系统称作异构的分布式数据库系统。 分布式数据库系统与集中数据库系统一样,包含两个重要部分:分布式数据库管理 系统和分布式数据库。分布式数据库系统是地理上分散而逻辑上集中的数据库系统。管 理分布式数据库的软件称分布式数据库管理系统。分布式系统通常是由计算机网络将各 地理上分散的逻辑单位连接起来。被连接的逻辑单位称为节点( n o d e ) 或场地( s i t e ) 。 节点场地可以是单独一台计算机也可以是局域网组成。 2 2 3s o l 语言 s q l 8 1 ( s t r u c t u r e dq u e r yl a n g u a g e ) ,最早的是i b m 的圣约瑟研究实验室为其关系 数据库管理系统s y s t e m r 开发的一种查询语言,它的前身是s q u a r e 语言。s q l 语 言结构简洁,功能强大,简单易学,所以自从i b m 公司1 9 8 1 年推出以来,s q l 语言, 得到了广泛的应用。如今,无论是像o r a c l e 、s y b a s e 、i n f o r m i x 、s q ls e r v e r 这些大型的 数据库管理系统,还是像v i s u a lf o x p r o 、p o w e r b u i l d e r 这些微机上常用的数据库开发系 统,都支持s q l 语言作为查询语言。 s q l 的优点: ( 1 ) 非过程化语言 s q l 是一个非过程化的语言,因为它一次处理一个记录,对数据提供自动导航。s q l 允许用户在高层的数据结构上工作,而不对单个记录进行操作,可操作记录集。所有 东北大学硕士学位论文第二章w e b 数据库技术综述 s q l 语句接受集合作为输入,返回集合作为输出。s q l 的集合特性允许一条s q l 语句 的结果作为另一条s q l 语句的输入。s q l 不要求用户指定对数据的存放方法。这种特 性使用户更易集中精力于要得到的结果。所有s q l 语句使用查询优化器,它是r d b m s 的一部分,由它决定对指定数据存取的最快速度的手段。查询优化器知道存在什么索引、 哪儿使用合适,而用户从不需要知道表是否有索引、表有什么样类型的索引。 f 2 1 统一的语言 s q l 可用于所有用户的d b 活动模型,包括系统管理员、数据库管理员、应用程 序员、决策支持系统人员及许多其它类型的终端用户。基本的s q l 命令只需很少时间 就能学会,最高级的命令在几天内便可掌握。s q l 为许多任务提供了命令,包括: 查询数据 在表中插入、修改和删除记录 建立、修改和删除数据对象 控制对数据和数据对象的存取 保证数据库一致性和完整性 以前的数据库管理系统为上述各类操作提供单独的语言,而s q l 将全部任务统一 在一种语言中。 由于国际标准化组织指定了s q l 标准,具有可移植性,s q l 又提供了灵活而强大 的查询功能方便复杂的查询操作,使s q l 为广大用户所采用。 2 3w 曲数据库技术 2 3 1w e b 数据库 随着w e b 中信息量的不断增加,以文件的形式进行存储的系统的速度受到越来越 大的影响。同时因为w e b 的应用领域的不断扩展,静态的w e b 页面越来越不能满足人 们对w e b 上信息服务的动态性、实时性和交互性的要求。另一方面,数据库技术经过 几卜年的发展,已经非常成熟和完善。为了进行网络上数据的高效存取,实现交互式动 态w e b 页面,就必须以大量数据资源为基础,因此必然要在w e b 中引入数据库技术。 w e b 技术和数据库技术的结合不仅把w e b 和数据库的优点集中在了一起,而且充分利 用了大量先有的数据库信息资源,使用户可以方便的在w e b 浏览器上检索和浏览数据 库内容。 w e b 数据库是指将w e b 和数据库互相融合的系统,用户可以使用与平台无关的w e b 东北大学硕士学位论文第二章w e b 数据库技术综述 浏览器通过该系统获得在线信息。w e b 数据库集合了w e b 技术和数据库技术的优点, 使二者都发生了质的变化:w e b 网页从静态网页发展成了由数据库驱动的动态网页,而 数据库实现了开发环境和应用环境的分离。 w e b 数据库是采用b s 模式,所谓”b s ”是指b r o w s e r s e r v e r ( 浏览器服务器) ,即 客户端是标准的浏览器( 如i n t e m e te x p l o r e ,n e t s e a p en a v i g a t o r 等) ,服务器端为标准 的w e b 服务器协同应用服务器响应测览器的请求。传统方式将服务器端分成应用层和 数据层两层结构,即“w e b 数据库数据库服务器”模式。目前,最新的模式是将应用 层进一步划分成表示层和功能层,与数据层一起构成三层结构,即“w e b 服务器应用 服务器数据库服务器”模式。 一般w e b 数据库系统,对数据库访问技术的性能有许多要求。 ( 1 ) 高效性 数据库的访问速度要快,以适应对大量数据的大量访问。 ( 2 ) 安全性 ( 3 ) 客户端的简洁性 因为是应用于w e b 的,客户端一般是利用浏览器来使用系统的。这就不能要求用 户柬配置客户端的数据源,否则,系统的可用性和简洁性就会降低。w e b 数据库应用应 尽量做到客户端的零配置, ( 4 ) 开放性( 异构性) 在w e b 应用中,由于存在大量的网络互连,可能会涉及到异构网络,客户端和服 务端也可能存在异构平台。 ( 5 ) 可扩展性 在w e b 数据应用系统中,会涉及到大量的业务逻辑,而且随着时间的发展,业务 逻辑很可能会发生变化,还可能产生新的业务逻辑。 鉴于以上原因,w e b 数据库系统应该着重于两方面的技术,一个是w e b 数据库连 接技术,另一个是w e b 数据库查询优化技术。 2 3 2w e b 数据库连接技术 w e b 数据库是通过其他w e b 应用程序、用标准化的h t m l 标记或某些特定的扩展 标记
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文化系统事业单位面试试题及参考答案
- 2026年山西经贸职业学院单招职业适应性测试题库必考题
- 2026年江苏省徐州市单招职业适应性测试题库必考题
- 2026年阳泉职业技术学院单招职业技能测试题库新版
- 2026年成都航空职业技术学院单招职业适应性考试必刷测试卷及答案1套
- 2026年长江工程职业技术学院单招职业技能考试题库必考题
- 2026年河南农业职业学院单招职业倾向性测试必刷测试卷附答案
- 2026年安徽矿业职业技术学院单招职业适应性考试题库必考题
- 2026年天津电子信息职业技术学院单招职业倾向性测试题库附答案
- 2026年深圳信息职业技术学院单招职业适应性考试题库附答案
- 洁净煤发电技术
- 月子会所食品安全应急预案
- 骨科新进展课件
- 警察抓捕战术课件
- 2025年江苏省农垦集团有限公司人员招聘笔试备考及答案详解(各地真题)
- 电子厂安全生产知识培训课件
- 加油站监理实施细则
- 知道智慧树商业伦理与企业社会责任(太原科技大学)满分测试答案
- PE管道工程质量监理细则与验收标准
- 绵竹市属国有企业招聘考试真题2024
- 药物制剂新技术研发与应用
评论
0/150
提交评论