(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf_第1页
(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf_第2页
(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf_第3页
(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf_第4页
(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(科学技术史专业论文)数据库技术的发展及其中药数据库的设计实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库技术的发展及其中药数据库的设计实现前l日数据库技术自从2 0 世纪6 0 年代出现以来一直是计算机技术中发展最快的一个分支,虽然至今只有4 0 多年的历史,但是却经历了两次大的飞跃,形成了现今以关系型数据库为主导的结构,并为下一次技术火发展孕育了契机。在研究技术的同时,研究数据库产业在国外的发展历史有助于我们从中找山规律,以期对我国将来数据库产业的发展提出有益的建议。数据库从7 0 年代进入我国,也得到了各方的重视,得到了长足的发展,也已进入一个相对稳定发展的阶段。人们也越来越发现数据库对于处理人量复杂资料具有极大的优势。但是由于观念上的差异,国内的数据库仍然处在初级阶段,主要应用于科学研究方面,商品化的数据库份额较少,也没有象国外那样形成一个具有较高经济效益的产业。长此以往必然延缓数据库发展速度。因此建立完善、良好的市场机制将有助于促进我国数据库产业的发展。此外,中药作为中华民族的宝贵财富,在人类与疾病对抗中表现了自身的独特特点。中华传统药物,不仅在占代,而且在科技日益发达的今天。同样具有重要的地位。甚至在治疗各种顽疾,包括癌症、艾滋病方面,也取得了某些独到的特殊效果。如何发掘中华医药的深层潜力,发挥其自身优势,达到对传统医药的再认识和再发展目的,是留给我们迫切解决的问题。中药本身包含了大量的已知与未知信息,研究中药的方法之一就是掌握利用分析这些大量的数据信息。计算机技术,尤其是数据库技术在各领域的广泛应t l ;i 为中药复杂系统的研究带来了曙光。利用数据库强大的信息处理功能,不但可以大大提高相关信息的检索速度、效率以及准确性,而且通过自定信息统计结果还可获取大量极具研究价值的量化信息,为进一步揭示中药药理实质、研制创新药物奠定一个具有现实意义与历史意义的基础。但是由于现有的中药数据库没能从根本上解决对海量文本信息的自动分类存储的问题,这样建立的数据库就存在查询功能不全面或者是涵盖数据量有限的缺点。鉴丁以上儿点,本文的研究j :作主要集中在四个方面:其一,对数据库在国外整体发展的脉络做了较为详细的阐述,并提出了国外数据库产业发展的特点和经验:其二,介绍了国内数据库产业整体发展情况,分析了其特点和存在的问题;其二,对数据库在国内中医药领域的应用做了同顾,并提山了自己的一些观点;其四,通过对已有中药数据库存在的问题分析,提山了建立一个新的中药数据库的必要性和可行性,首次将x m l 语言实现对人量文本的计算机自动分类存储的方法引入中药数据库的建设之中。由丁本人所学有限,文中难免存在不妥之外,敬请各位专家、老师和同学指正为盼。数据库技术的发展及其中药数据库的设计实现摘要f 自从计算机发明以来,便在人们生活的各个方面起着日益重要的作用。而在数据库技术、产生以前,计算机只被用于科学计算,而且所涉及到的数据都是面向程序的,程序用到的时候通过打孔机输入计算机,程序结束,数据就被自动删除。这是由当时的存储介质、存储技术所决定的。这样就严重影响了计算机技术的深入发展。一直到磁带式和磁盘式驱动器产生之后才给计算机发展带来了飞跃,也使得数据的存储和处理成为可能。出现了专门面向数据管理的软1 ,| :系统一一数据库系统。寸本论文的主要研究成果包括:一、对国外数据库的发展进行了较为系统地总结。将数据库发展历程归纳为两次人的飞跃,即文件系统的产生和数据库系统的产生。详述了数据库系统产生的技术背景和发展的三厂个阶段。( 通过对几位代表人物,说明了数据库产生及演变的过程;通过对几种具有代表性产品特点的介绍,说明了这种演变的成因。同时通过对欧美日数据库产业发展特点的介绍,说、明了数据库发展的必要条件和发展动力来源。最后对数据库技术未来发展的趋势做了预测j二、较为详尽的介绍了国内数据库产业的发展的现状,分析了我国现阶段数据库产业发,展的特点和不足。卜是仍处于数据库发展的初级阶段,类型以科技数据库为主;二是产品化。1 。1 一和市场化程度仍显不足;三是数据库存在不规范、质量差、利用率低的问题;四是宏观调控和布局不够;五是技术教育与实际工作存在严重脱节,造成从业人员技术素质偏低。一,三、对数据库技术引入中国以后,在中医药领域的应用现状进行了总结分析讨论,认为数据库在中医药领域的应用可分为四个阶段,解个阶段又具有其特性:( 一) 第一阶段( 从1 9 7 9 1 9 8 3 年) :特征:文件系统数据库雏形,数据存储处理是人二i :处理( 分类、录入) ,瑚专门的文r f :系统统一管理。( 二) 第二阶段( 从1 9 8 3 1 9 8 9 年) 。特征:数据库系统开始被使用,而麻_ j 也发展到中医药文献检索等方面。( 三) 第三阶段( 1 9 9 0 1 9 9 7 年)特征:建成了事实型数据库,进一步完善文献检索数据库。( 四) 第四阶段( 1 9 9 7 年至今)特征:人刑网络事实数据库出现,新一代数据库技术开始应用于中医药领域。同时也分别对国内国外现有的土要中医药数据库产品做了介绍,指山了数据库在中医药2数据库技术的发展及其中药数据库的设计实现领域应用存在内容单一、网络支持性不好、数据库扩展性差等问题,并指出建立新的中药数、据库的必要。i i 。土四、通过对已有中药数据库产品的介绍,分析了现有中药事实数据库存在的两大极端现象,一方面是药物数据库虽然涵盖面比较广,药物种类繁多,但是所提供的查询方式却非常有限,一般只能提供通过中药的中文名、英文名、拉丁名等儿种有限的方式查询,比如北京中医药研究院研制的中药数据库:另一方面是虽然提供了较为全面的查询方式,但是只能覆盖非常有限的几百味中药,远远不能满足查询的需要,比如中国科学院开发的中药数据库。厂、,。j( 究其原p l 就是无法做到对大量文本信息的智能化分类和存储,这样就大大增加了建库人员的工作强度降低了工作效率。为此,我们提出了采用最新的瑚l 语言( 可扩展置标语言) 建立数据库的模式,由于x m l 语言是一种数据定义语言,能根据我们对于中药性质、特点的归纳总结将中药信息规范化,形成特定的模式。在通过开发的软件程序实现大量中药信息的自动分类存储功能,这样做大大简化了录入人员的工作量。并且由丁x m l 语言具有很强的可扩展性,使得我们的中药信息数据库在扩展性方面有很大提高。同时通过这种方式也为研究海量文本数据提出了一个崭新的研究模式。j 数据库技术的发展及其中药数据库的设计实现a b s t r a c ts i n c et h ec o m p u t e rw a si n v e n t e d ,i ta c t sm o r ea n dm o r ei m p o r t a n tr o l e si no u rl i f e b u tb e f o r ed a t a b a s et e c h n o l o g yc a m ei n t or e a ll i f e ,t h ec o m p u t e rh a db e e nu s et od os c i e n t i f i cc a l c u l a t i o n a n dt h ed a t a , w h i c hw a si n v o l v e d ,l o o k e do nt h ep r o g r a m ,w h i c hm e a n st h ed a t aw a sn o ts a v e du pi nt h ec o m p u t e r a f t e rt h ep r o g r a mf i n i s h e d ,t h ed a t aw a sv a n i s h e da l s o o n l ya f t e rt h em a g n e t i cd i s kd r i v ec a m et r u e ,w a ss a v i n gd a t ab e c o m er e a l i t y a n di ti sa l s ot h eb a s i so f d a t a b a s et e c h n o l o g y t h em a i nk e yp o i n t so f t h i st h e s i sa r e f i r s t l y , w es u m m a r i z e dt h ed e v e l o p m e n to fd a t a b a s ei nt h ew o r l d ,r e d u c e dt h ed e v e l o p m e n tt ot w or u s h e s ,w h i c ha r ef i l es y s t e ma n dd a t a b a s es y s t e m w ei n t r o d u c e dt h et e c h n o l o g yb a c k g r o u n da n dt h et h r e ek e yp e r i o d so fd e v e l o p m e n to fd a t a b a s es y s t e m b ym e n t i o n i n gs e v e r a lk e yp e r s o n s ,w ee x p l a i n e dt h ep r o c e d u r eo ft h ed e v e l o p m e n t a tt h es a m et i m e ,t h r o u g hc o m p a r i n ga m e r i c a ne u r o p e a na n dj a p a n e s ec h a r a c t e r so fd a t a b a s e sd e v e l o p m e n t ,w ei l l u s t r a t e dt h en e c e s s a r yc o n d i t i o n sa n dp o w e ro f i m p r o v i n gd e v e l o p m e n to f d a t a b a s e s e c o n d l y , w ei n t r o d u c e dt h ei n t e r n a ls i t u a t i o no fd a t a b a s ea n da n a l y z e dt h ec h a r a c t e r i s t i c sa n ds h o r t c o m i n g so ft h a t 1 w ea r es t i l la tt h ep r i m a r yp e r i o d t h em o s to ft h ed a t a b a s e sa r es t i l ls c i e n t i f i ca n dt e c h n i c ;2 t h ed a t a b a s e sn o w a d a y sa r en o tb e e nw e l lc o m m e r c i a l i z e d ;3 s o m eo ft h ed a t a b a s e sn o w a d a y sa r en o ts t a n d a r da n di n e f f i c i e n t 4 l a c ko f m a c r o s c o p i cc o n t r o l l i n ga n da r r a n g e m e n t ;5 t h ee d u c a t i o no ft e c h n o l o g yf a l l sb e h i n dt h ep r a c t i c e s ,s ot h eq u a l i t yo fr e s e a r c h e r si sm u c hl o w e rt h a nw h oa r ea b r o a d t h i r d l y , w es u m m a r i z e da n da n a l y z e dt h es i t u a t i o na b o u ta p p l i c a t i o no fd a t a b a s eo nt h ec h i n e s et r a d i t i o n a lm e d i c i n e ,a n dd i v i d et h ep r o c e s so ft h ea p p l i c a t i o ni n t of o u rp e r i o d s t h ef i r s tp e r i o di sf r o my e a r1 9 7 9t o1 9 8 3 t h a t sf i l es y s t e me p o c h t h es e c o n dp e r i o di sf i o my e a r19 8 3t o19 8 9 ,d u r i n gw h i c h ,d a t a b a s es y s t e mb e g a nt ob eu s e d a n dt h e r ew a ss o m eb i b l i o g r a p h yd a t a b a s e t h et h i r dp e r i o di sf r o my e a r1 9 9 0t o1 9 9 7 i nt h i sp e r i o d ,f a c td a t a b a s eh a dc o m ei n t oo u rl i f e t h ef o u r t hp e r i o di sf r o my e a r1 9 9 8t i l ln o w f r o mt h a tt i m e ,c h i n e s et r a d i t i o n a lm e d i c i n e ( c t m )4数据库技术的发展及其中药数据库的设计实现d a t a b a s ec o u l db ef o u n di nt h ei n t e m e t a n di nt h i sp a r a g r a p h ,w ea l s oi n t r o d u c et h es e v e r a lm a i nc t md a t a b a s ea n dp o i n to u tt h es h o r t c o m i n g so f t h o s ed a t a b a s e s f o u r t h l y , t h r o u g he x p l a i n i n gt h es h o r t c o m i n g so fn o w a d a y sd a t a b a s es y s t e m s ,w ea n a l y z et h ek e yr e f l s o n ,w h i c hl e a d st ot h i ss h o r t c o m i n g t h a t sb e c a u s et h e r ei sn o tag o o dw a yt oc l a s s i f ya n ds a v et h o u s a n d so ft e x ti n f o r m a t i o na u t o m a t i c a l l y s ow eb d n gu pan e wm e t h o dt os o l v et h i sp r o b l e m t h a ti sx m ll a n g u a g e w ep r o g r a mt h ed a t a b a s es o f t w a r ei nx m ll a n g u a g e ,a n di tc a na c h i e v et oc l a s s i 匆a n ds a v et h ed a t ai n t e l l i g e n t l y , w h i c hw i l ld e d u c et h ew o r k l o a do f t h ep r o g r a m m er t h i sk i n do f m e t h o dc a na l s ob eu s e dt os o l v e o t h e rd i g i t i z a t i o no f h u g et e x ti n f o r m a t i o np r o b l e m 5数据库技术的发展及其中药数据库的设计实现第一章国内外数据库技术的发展第一节数据库简介白1 9 4 6 年2 月1 4 日美国宾夕法尼弧火学的 :程师和科学家发明了第一台电子计算机e n i a c ( t h e e l e c t m n i c n u m e r i c a l i n t e g r a t o r a n d c o m p u t e r ) 并在费城公布于世1 以来,就开始将一些客观事物用特定的符号表示并存放于计算机内,并对这些特殊的符号进行运算。这些特定的符号通常称为数据( 在计算机科学中我们通常把所有能输入到计算机中,并能被计算机处理的符号总称为数据) ,它们是计算机程序加i :的重要原料。由于数据的存储组织管理是计算机技术所需解决的最基本问题之一,因而伴随着数据处理的发展,计算机数据库技术的产生与发展也势在必然。什么是数据库呢? 由于人们观察理解的角度不同而产生多种定义。例如,有人从强调数据库是若干记录的集合的角度称数据库是个“记录保存系统”。也有人从侧重数据组织的角度称数据库是“人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合”。还有人认为数据库就是“一个数据仓库”。上述种种对于数据库的描述都是比较形象的,但笔者更认同数据库是“按照数据结构来组织、存储和管理数据的仓库”的说法,即数据库应该是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,能为多种应用服务:这些数据的存储独立于使坩它的程序;对数据库插入新数据、修改和检索原有数据均能按一种公用的乖1 可控制的方式进行:当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。使用数据库可以带来许多好处:如减少了数据的冗余度,从而大大地节省了数据的存储空间;实现数据资源的充分共享等等。此外,数据库技术还为用户提供了非常简便的使用手段使用户易于编写有关数据库应_ i j 聪序。比如微软推出的微型计算机关系数据库管理系统d b a s ei l l ,操作直观,使用灵活,编程方便,环境适应广泛( 一般的十六位机,如i b m p c x t ,国产长城0 5 2 0 等均可运行种软什) ,数据处理能力极强。数据库在我国正得到愈米愈广泛的应用,必将成为经济管理的有力:j :具。数据库系统主要由数据库( d a t a b a s e ) 年数据库管理系统组成。数据库是通过数据库管理系统( d b m s d a t ab a s em a n a g e m e n ts y s t e m ) 软仆来实现数据的存储、管理与使_ 【 j的。比如常川的d b a s e 就是一种数据库管理系统软仆。1h t t p :w w wl i b r a r y u p e n n ed 1 1 s p e c i a l g a l l e r y m a u c h l y j w m i n t r o h t m 寅夕法尼弧人学幽书馆土负6数据库技术的发展及其中药数据库的设计实现第二节国外数据库技术的发展一、两次飞跃白1 9 4 6 年2 月1 4 日美国宾夕法尼亚大学的j i :程师和科学家发明了第一台电子计算机e n l a c ( t h ee l e c t r o n i cn u m e r i c a li n t e g r a t o r a n dc o m p u t e r ) 并在费城公布于世1 以来,就开始将一些客观事物用特定的符号表示并存放于计算机内,并对这些特殊的符号进行运算。这些特定的符号通常称为数据( 在计算机科学中我们通常把所有能输入到计算机中,并能被计算机处理的符号总称为数据) ,它们是计算机程序加1 :的重要原料。由于数据的存储组织管理是计算机技术所需解决的最基本问题之一,因而伴随着数据处理的发展,计算机数据库技术的产生与发展也势在必然。从现己掌握的资料来看,国外数据库技术的发展过程大致可以分为两个阶段,本文将其称之为两大飞跃。在5 0 年代中期以前,计算机主要用于科学计算,数据虽然可以输入计算机内并进行运算,但数据却不能保存在计算机里,一个科学计算结束后,数据必然撤走。产生这种现象的主要原因是当时没有合适的系统软件对这些数据进行管理,每项科学计算所用的数据都需要程序员单独编制,其中包括数据元素、数据结构2 、数据存储位置等等。在这个阶段中数据处理的特点是:( 1 ) 数据处理时,数据随程序一道送入内存,用完后全部撤出计算机而不能保留。( 2 ) 数据大量重复,不能共享。( 3 ) 文件系统尚未出现,程序员必须白行设计数据的组织方式。( 4 ) 修改数据必须修改程序。l 应用程序2,i 数据组2r i| l煳1 手 处理数据示意图总之,当时的数据处理的基本的特征一是无数据管理,二是完全分散的手j i :方式。它的1h t t p :w w wl i b r a r y u p e n ne d u s p e c i a l g a l l e r y m a u c h l y j w m i n t r o h t m l 宾夕法尼弧人学幽书馆土负2 数据结构就足相互之问1 竽n :一种或多种特定关系的数据兀索的集合。7数据库技术的发展及其中药数据库的设计实现主要表现是:( 1 ) 无外存或只有磁带外存,输入输出设备简单( 2 ) 无文件管理系统,无管理数据的软件( 3 ) 数据是程序的组成部分,数据不独立1 第一次飞跃第一次飞跃出现的时间在5 0 年代后期,产生这次飞跃的软件背景是文件系统的山现硬件背景是计算机存储设备发生了两次重要变革。软件背景:由丁当时的计算机已不弭局限- 丁单纯的科学计算,管理方面对计算机的要求越来越高,要求专门用于管理数据软件的需求也日益强烈。这此大环境下,计算机界出现了专门管理数据的软件,即所谓的“文件系统”。文件系统也称信息管理模块,它的出现给编程带来很人的方便。由于有软件对数据进行管理。程序与数据之间有存取方法进行转换,文什的逻辑结构与存储结构有一定区别,即数据与程序相对独立,这样可以使程序人员集中精力于算法1 ,而不必过多地考虑数据的物理存储地址,这样也就大大节省了编程和维护的工作量。文件系统示意图如下:图2 文件系统示意幽硬件背景:计算机存储设备的两次重要变革。第一次重要变革是在u n i v a c 大型机上首次使用磁带驱动器以代替打孔卡作为数据存储介质2 ,实现了机器存取:第二次重要变革是i b m 公司在其3 0 5r a m a c 模型机上首次应用了磁式硬盘,实现了随机存取数据。虽然当1 算法足枉有限步骤内求解某一问题所使用的一纽定义明确的规则。即计算机解题的过程。在这个过程中,无论足形成解题思路还足编q 程序,都足托实施某种算法。前者是推理实现的算法,后者是操作实现的算法( 笔者滓) 。2u n is y sh i s t o r yn e w s l e t t e rv o l u m e1n u m b e r1s e p le m b e r1 9 5 48数据库技术的发展及其中药数据库的设计实现时这个可存储5 m 数据的磁式研盘是由5 0 个直径为2 英寸的磁碟压缩组成1 ,但却为文件系统的产生奠定了非常重要的物理介质基础。图31 9 5 1 年产生的磁带驱动器图41 9 5 6 年i b m 公司的磁盘驱动器这个阶段的基本特征是有了面向应用的数据管理功能,1 :作方式是分散而1 f 手j :的,其表现为:( 1 ) 外存有了很人的发展,除磁带机外,还出现了大容量的硬盘和灵活的软磁盘。输入、输出能力大大加强。( 2 ) 系统软1 , :方面出现了操作系统、文件管理系统和多用户的分时系统,出现了专用于商业事务管理的高级语言c o b o l 。它主要用丁文件处理,也可以进行非数值处理。( 3 ) 数据管理方面实现了数据对程序的一定的独立性,数据不再是程序的组成部分修改数据不必修改科序。数据有结构地被组织到文件内,存储在磁带、磁盘上,可以反复使h 和保存。文什逻辑结构向存储结构的转换由软件系统自动完成,系统开发平维护1 作得到减轻。( 4 ) 文件类型出现多样化。由于直接存取设备的出现,索引文什、链接文件、直接存取文1 ,l :等也随之产生。( 5 ) 数据存取以记录为单位。然而,这一阶段并非十分完美,在数据的管理仍然存在不足之处。主要缺陷有:( 1 ) 数据冗余度2 人。文t 1 系统中的文件基本上是对廊丁某个麻州程序,数据仍是面向府州的,不同应_ 【f j 程序所需数据有部分相同时,仍需建立各自的数据文件而不能共享,另外数据维护凼难,一致性难以保证。l 祸布斯杂忠, 9 5 8 年1 几期2 冗余度就足数据几索蕈复;f 现的程度( 笔_ 肯沣)9数据库技术的发展及其中药数据库的设计实现( 2 ) 数据与程序独立性仍然不高。文件是为某一特定应用服务的,系统不易扩充。一旦数据逻辑结构改变,就必须修改文件结构的定义及应用程序;应用程序的变化也将影响文件的结构,因而文件仍不能反映现实世界事物之间的联系。虽然已经采用了某些方法,如用主记录与明细记录或主元与辅元相联系的方法来增加数据结构的灵活性,但这仍然难以改变数据与程序独立性仍然不高的问题。2 第二次飞跃随着计算机在管理领域内应用的发展,同时由于数据管理规模逐渐增大,数据量急剧增加,数据冗余度较大以及数据与程序独立性不高的弊端越来越突出,数据管理模式的第二次飞跃便随之诞生。这一阶段是数据库技术发展最为迅猛的时期,先后出现了三种数据库模型,即层次型、网状型和关系型数据库模型,成为第二次飞跃中三个闪光的亮点。数据库管理系统的雏形是1 9 6 1 年g e 公司c h a r l e sb a c h m a n 开发的第一个数据库管理系统i d s ( i n t e g r a t e dd a t as t o r e ) 1 。c h a r l e sb a c h m a n ,1 9 2 4 年1 1 月1 1 日生于美国堪萨斯州2 ,是数据库技术的奠基人之一。虽然该数据库存在两大缺陷,一是它只能运行于g e 公司的大型机上;二是它用单个文件作为数据库存储数据,所有数据表的产生必须通过手【:编码。但这个数据库管理系统的出现为后来数据库技术的发展奠定了非常重要的基础。由于c h a r l e sb a c h m a n 本人在数据库领域的突出贡献,1 9 7 3 年他获得了美国计算机学会的“图灵奖”3 ,成为第一个在数据库领域获此世界计算机届晟高奖项之人4 。c h a r l e sb a c h m a n 曾对数据库管理系统做过如下解释:“程序员好比领航( n a v i g a t o r ) 。在错综复杂的数据库中航行时,一是需要熟悉数据库中的各种路径( 相当于地图) ,二是要有较高的应_ 【 数据库的技巧( 相当于领航本领) 。”5到了6 0 年代后期,由于数据不再单纯用于一个程序,因而出现同样的数据可被多个程序调用,机器内存储数据的日益增多,数据重复的问题越来越突出,资源与人力的浪费的现象也越来越严重。为了改变这种缺陷,计算机界开始尝试将数据集中存储统一管理,为数据库管理系统的演变与进步提供了需求,为第二次飞跃的山现提供了发展空间。第二次飞跃中的第一个亮点是i b m 公司1 9 6 8 年推出的第一个商品化的层次( h i e r a r c h i c a l )li n t e g r a t e ds y s t e m sp r o j e c tr e p o r t sb yc w b a n dw b w i l ll a s s 1 9 6 2 2c h a r e ls b a c h m a na u t o b i o g r a p h y3 幽灵奖足为,纪念英周著名的数学家及汁算机之父爱伦幽灵j 设口的,从1 9 6 6 年起每年评选一次,是世界计算机领域的最高奖项。4c o m m u n i c a ti o nt u r i n g ,a c m ,1 9 7 35t h ep i o g l a m m e l a san a y i g a t o f c a c m1 6 :1n o v e m b e r1 9 7 31 0数据库技术的发展及其中药数据库的设计实现数据库管理系统i m s ( i n f o r m a t i o nm a n g e m e n ts y s t e m ) 。在i m s 的这个应用系统中,所有数据由d b m s ( d a t a b a s e m a n a g e m e n t s y s t e m ) 数据库管理系统统一管理,实现数据资源的整体管理。在数据资源的管理上提出新的理念,对促进数据库技术的发展起到了功不可没的作用。但是,由于i m s 系统是以层次数据模型为基础,对非层次数据使用了虚拟记录,大量指针的使朋降低了效率。同时d b m s 给用户提供的数据模型及数据库语言比较低级,数据独立性也较差,从而束缚了其应用前景。层次型数据模型示意图如下:图5 层次型数据模型示意图( 其中字母代表不同的字段)第二次飞跃中的第二个亮点是网状数据模型的出现。为了克服层次数据库的缺陷,1 9 6 9年d b t g ( d a t ab a s et a s kg r o u p 数据库任务组) 美国c o d a s y l 2 ( c o n f e r e n c eo nd a t as y s t e ml a n g u a g e 数据系统语言协商会) 下属的一个组织提出另一个数据模型网状数据模型。该模型对丁层次s t l - l = 层次数据模型都能比较自然地模拟。经过2 次修改,最终于1 9 7 8 年确定下来。虽然它并不是网状系统的唯一标准,但却最有代表性的。其后,c h a r l e sb a c h m a n 发展了网状数据库模型,他在担任c u l l i n a n ed a t a b a s es y s t e m s ( 后米被称为c u l l i n e t ) 公司技术副总裁期间主持开发了一种基丁- 网状模型的数据库系统l d m s 系统3 。层次乖i 网状数据库描述数据的模型,是从过去应用程序处理数据时所用的数据结构概括而来的,尽管有一定的通h j 性,但其中仍保留了不少文件系统的特点,例如指针等。集中和共享这一基本目标在层次和网状数据库中已经达到,但数据独立性还不够好,数据库的使用也不够方便。层次和网状数据库是六十年代技术条件- 卜的合理产物,它们为数据库技术奠定了基础、搭起了框架、打开了应用局面。随着网状模型理论的成熟,7 0 年代以后,出现了人量的基于层次或者网状数据模型的d b m s 产品,如h p 公司的i m a g e 4 等等。以上两种数据模型就其实质而言没有根本的区别,如共同存在数据对丁应川程序相对独1 萨帅煊、l :珊,数据库系统概论,1 9 9 1 年第1 版( 0 【自i b m 公t d l 9 6 4 年t 作报告)2 数据库系统堆础教程( 0 i 自c o d a s y ld a t a b a s e t a s kg r o u pa p r i l1 9 7 1r e p o r t ,a c m ,n e w y o r k )3 ag e n e r a lp u r p o s ep r o g r a m m i n gs y s t e mf o rr a n d o m a c c e s sm e m o r i e s a f i p s ,2 6 ,1 9 6 4 1i4i m a g e 足h p 公- d 十7 0 年代末期开发米的一种经典的嘲状数据库产品,影响力较人。1 l数据审技术的发艟及其中药数据库的设计宴现立、大量的数据冗余造成了系统运行缓慢、编程量增加、维护和再开发困难等问题。为此,数据库技术还需进一步变革,以开发出适用性更强的模型。1 9 7 0 年c o d d 的工作使第二次飞跃出现了第三个亮点关系数据模型。c o d d 在1 9 7 0年提出了关系数据模型( r e l a t i o n a ld a t a m o d e l ) 1 ,以关n ( r e l a t i o n ) 或称表( t a b l e ) 作为描述数据的基础。在其后的几年中,c o d d 发表了系列文章,提出了关系代数和关系演算的概念,并于1 9 7 2 年提出了关系的第一、第二、第三范式,1 9 7 4 年提出b c ( b o y c e - c o d d ) 范式,奠定了关系数据库的理论基础。关系数据模型有严格的数学基础,抽象级别比较高,而且简单清晰,便于理解和使用。它的观点提出之后立即受到数据库界的高度重视。ee c o d d1 9 2 3 年8 月1 9 日出生于美国俄勒冈州,是著名计算机专家。由于他在数据库方面的杰出贡献建立了关系型数据模型,于1 9 8 1 年获得美国计算机学会的“图灵奖”,是继b a c h m a n 之后第二个获得这一殊荣的数据库专家2 。但是,当时以b a c h m a n 为首的一些学者认为关系数据模型仅仅是理想化的数据模型,用来实现d b m s 是不现实的,尤其担心关系数据库的性能难以被用户接受。1 9 7 4 年,数据库界开展了一场分别以c o d d 和b a c h m a n 为首的支持和反对关系数据库的大辩论3 。辩论促使不少企业和学术单位投入了关系d b m s 原型的研制,大大促进了数据库技术的发展。这场辩论最终以火量实用型关系d b m s 系统的成功开发而告终,从实践上证明了关系数据库模型的合理性和可行性。在众多的关系d b m s 原型中,功能最全面、技术上最有代表性的要算美国i b m 公司的s y s t e mr 和加州大学b e r k e l e y 分校的i n g r e s 4 。这两个原型系统差不多都在1 9 7 7 年前后开始运行,它们不但证实了人们所期望的关系数据库的许多优势,例如离级的非过程语言接v l5 好的数据独立性等,而且也消除了人们对关系数据库性能的担心。这两个原型系统全面地提供了比较成熟的关系d b m s 技术,为研制商品化的关系d b m s系统完成了技术上的准备。虽然关系型数据库的理论是由i b m 公司e fc o d d 最先提出的,但是由于i b m 公司朱能对此技术予以应有的重视,加之仅注重技术的权威性,而忽视市场因素的决策火误,至使i b m 公司火去了走向成功的极好机遇。相反,诸如e l l i s o n ( o r a c l e 公司总裁) 等人i :关系理论产生之初就已经预见到了它潜在的巨人市场,积极将该技术付诸 “实践,开创了o r a c l e 数1c o d defar e l a t i o n a lm o d e lf o rl a r g es h a r e dd a t ab a n k s ,c o m ma c m ,1 3 :6 p p3 7 7 3 7 82 ef c o d da u t o b i o g r a p h y3as u r v e ) o f g e n e r a l i z e dd a t ab a s em a n a g e m e n ts y s t e mc o d a s y ls y s t e mc o m m i t t e et e c h n i c a lr e p o r t m a y l 9 6 94 王能斌,数据库系统,电子工业出版社( 北京) 2 0 0 0 年版第4 负5 返啦的i l 过程话苫拉l 】是指刈数掘库盘i 柚谣苦s q l ( s t r u c t u r e d q u e r y l a i l g a a g c 结构比盘啪话苦) 的支持1 2数据库技术的发展及其中药数券章的设计实现据库。虽然开始的o r a c l e 数据库版本有极大的缺陷,但e l l i s o n 并没有就此放弃,而是跟微软一样走市场路线,走p c 机路线,使得o r a c l e 在几年里得到了迅速发展。当i b m 发现问题的严重性后,为了弥补失误,在s y s t e mr 的基础上先后推出了s q l d s 和d b 2 两个商品化的关系d b m s ( 数据库管理系统) 但为时已晚。此时o r a c l e 公司已经占有了大部分市场份额,发展成为一个市值2 8 0 亿美元的大公司了。通过以上分析可见,数据库的发展固然需要大型机、服务器等企业级产品的推动,但个人电酗的普及、计算机的个人化也给数据库的发展带来了极大的空间。也许市场因素永远是推动技术发展的真正动力,数据库技术的发展也不例外,因为数据库技术的发展途径也显示出市场需求对技术发展的影响与促动。到了八十年代,关系数据库己成为数据库技术发展的主流,几乎所有新推出的d b m s产品都是关系型的。数据库不但在大型机和小型机上广泛使用,在微机的应用上已日益受到人们的关注。在产品上,除了上述的关系d b m s 产品外,市场上又陆续出现了一系列产品,其中发行量比较大且在我国用得比较多的有s y b a s e ( 美国赛贝斯软件公司的著名数据库系统) 、i n f o r m i x ( 美国i n f o r m i x 公司的大型数据库产品) 、f o x p r o 、s q ls e v e r ( 美国微软公司出品的数据库系统) 等。图6 数据库管理数据示意图综上所述,数据】牵技术发展的动力不单来自丁计算机专家的理论研究的深入发展,更主要的动因米自于市场需求。在开始的阶段,人们所需要计算机做的仅仅是完成某项计算,只要得出结果,不需要数据存储,所以在那个时期虽然有数据的使川却没能产生真正的数据库系统。随着人们不再满足1 :简单的计算、需要将原始数据多次使刖、要求数据被多个 g 序共享的需求日益强烈,文件系统应运而生。文件系统的产生,满足了人们对数据重复使_ l = | 、共享的需求,但随着数据量的剧增,文件系统提供的数据的简单共享不但不能满足人们进一步的需求,还增大了程序的冗余,这样就为层次、网状数据库系统的产生带来了市场需求。同一:丽平、焦t 挚,关系数据库产品发展概况,郴郸大学学报,1 9 9 9 年第3 期1 3数据库技术的发展及其中药数据库的设计实现样关系型数据库的产生,也是在层次、网状数据库无法对复杂数据关系进行描述,市场需求呼唤一种新的技术解决方案的前提下应运而生的。有关国外数据库技术的发展历史,笔者根据文献列出一个附表,以供参考。附表1 :国外数据库技术发展时间表1 9 4 5 芷磁带的应用,这是第一种允许查找的介质;它代替了纸带和卡片:1 9 5 7 笠建立第一个商业计算机;1 9 5 9i b m 建立了r a m a c 系统;以非顺序方式读入数据,访问文件成为可能1 9 6 1 年第一个一般的d b m s 产生:g e 的i d s :1 9 6 5 1 9 7 0 年由许多零售商开发了i b m 的i m s 的通用层次性的文件管理系统;1 9 7 0 钜由c o d d 和他在i b m 同事开发出了关系数据库理论;8 0 年代开发了第一个由p c 机使用的d b m s :d b a s e ;a n s i s p a r c 的报告指出,已经有多于百种的开始出现商用关系的关系数据库实现;d b m s :提出了第四代语言的概念开始高层管理语言接口的开发9 0 年代以后随着多媒体功能的发展,要求数据库支持多媒体;出现了商j l 的面向对象数据库系统:要求在硬件上开发夫规模并行处理器;数据库技术的发展及其中药数据库的设计实现二、发展趋势自8 0 年代以来,数据库技术一直是计算机科学技术中发展最快、应用最广泛的重要分支之一,已成为计算机信息系统和计算机应用系统的重要技术基础和支柱,也是科学数据库及其信息系统建设的重要技术基础和支柱。从2 0 世纪9 0 年代至今,随着i n t e r n e t 的迅猛发展,新的数据库不断产生,如万维网、计算机集成制造、电子商务等等。以关系数据库为代表的传统数据库系统,主要应用于商务领域,如财务管理、人事管理等,其管理的数据往往是结构化数据,应用的环境主要是可控的封闭系统。很显然,在当今的社会信息化进程中,这种以关系数据库为代表的传统数据库系统的局限性越来越明显。如何克服传统数据库技术的不足并适应新的信息处理需求呢? 归纳起来主要有两种思路:一是对关系数据库进行改造,如并行数据库技术1 、分布式数据库系统等2 ;二是采用新的数据模型,如面向对象数据模型、演绎数据库技术3 等。根据这两种思路衍生出的新一代的数据库管理系统主要有:扩展关系数据库系统、面向对象的数据库系统4 、分布式数据库系统、并行数据库系统、专家数据库系统、数据仓库等。随着这些数据库系统技术支持的日益进步和管理功能的日趋完善,已影响和渗透到包括商业事务处理在内的多个领域。事实证明,这些新兴的数据库技术将在计算机应用的发展中为人类做出更大的贡献。当前,人们正盼望着“后关系数据库”( p o s t r e l a t i o n a l d a t a b a s e ) 时代的到来。所谓后关系数据库,实质上是在关系数据库的基础上融合了面向对象技术和i n t e m e t 网络应用开发背景,结合了传统数据库如网状、层次和关系数据库的一些特点,以及x m l 语言j a v a 、d e l p h i 、a c t i v e x 等新的编程工具环境,适应于新的以i n t e m e tw e b 为基础的应用。伴随着新兴关系数据库的发展,所谓的后关系型数据库时代6 即将到来。三、发展特点( 1 ) 美国从美国的数据库产业发展情况来看,首先是具有很浓的商业色彩。由于人财团、人企业1 并行数据库系统是指利用多处理器平台的能力,叫时运行多个事务处理,具有支持分布式操作、多线程处理、联机事务处理和决策处理等能力,从而提高数据库系统的响应时问和事务吞吐量。2 李霖阁兴锦,分布式数据库研究新趋势,计算机工程与科学,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论