已阅读5页,还剩55页未读, 继续免费阅读
(计算机科学与技术专业论文)基于XML的森林资源管理系统的异构数据整合.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着计算机、数据库、网络等技术迅猛发展以及在林业中的广泛应用,林业行业从国 家到地方,从生产管理部i - j n 研究机构构建了很多应用系统。森林资源信息管理系统是“数 字林业平台技术研究与应用”中数字林业公共技术平台的一部分,下级部门向上级数字林 业平台提交标准化的数据,为国家重大林业决策分析提供依据。这些系统大多是地方自行 开发的,采用的数据库管理系统不相同,数据库的结构也不一致,造成各应用系统之间不 能互通互联,无法实现共享,形成了一个个信息孤岛,导致信息不及时、不一致、利用率 低下。因此,如何对异构数据格式进行有效的转换和整合已成为森林资源管理信息系统的 必然选择。 本论文以森林资源二类调查数据为基础,根据源数据格式与上级数字林业平台对上报 数据的实际需求,提出了基于】( m l 的异构数据整合的模型,为上一级森林资源管理部门进 一步的信息化管理奠定了基础。 论文首先研究了异构数据交换相关技术数据库访问技术、数据交换技术和x m l 技 术,然后详细分析了异构数据交换子系统中的数据异构类型和数据交换的主要方式,并针 对原有技术缺乏统一标准,平台依赖性强,系统间耦合度大等缺陷,提出了基于x m l 实现 异构环境下的数据整合的解决方案。论文对基于x m l 的异构数据交换模型的功能结构、交 换流程与实现过程进行了详细分析,结合本系统中的数据交换模型,重点对j d b c 数据库 访问接口、数据转换过程的类型转换、大对象的处理及参照完整性等问题进行了讨论,主 要突破点是大对象的处理技术b a s e 6 4 编码及参照完整性在森林资源管理信息系统中 的初步研究。 关键词;森林资源管理信息系统,异构数据库,数据整合,x m l 首都师范大学t 学硕十学位论文 a b s t r a e t w i t ht h er a p i dd e v e l o p m e n to ft h ec o m p u t e r ,d a t a b a s e ,n e t w o r kt e c h n o l o g ya n dt h e b r o a da p p l i c a t i o ni nt h ef o r e s t r y ,l o t so fa p p l i c a t i o ns y s t e m sh a db e e ne s t a b l i s h e db yt h e f o r e s t r y , f r o mn a t i o nt or e g i o n ,f r o mm a n u f a e t u r a la n dm a n a g i n go r g a n i z a t i o nt or e s e a r c h i n s t i t u t e s f o r e s tr e s o u r c e sm a n a g e m e n ti n f o r m a t i o ns y s t e mi so n ep a r to ft h ed i g i t a lf o r e s t r y c o m m o nt e c h n o l o g yp l a t f o r mi n t h e d i g i t a lf o r e s t r yp l a t f o r mt e c h n o l o g yr e s e a r c ha n d a p p l i c a t i o n ”,t h es u b o r d i n a t ed e p a r t m e n th a n d e di nt h es t a n d a r dd a t at ot h es u p e r i o rd i g i t a l f o r e s t r yp l a t f o r m ,a n dp r o v i d e dt h eg i s tf o rt h ei m p o r t a n tf o r e s t r yd e c i s i o na n da n a l y s i s t h e s e s y s t e m sa r ed e v e l o p e dm o s t l yb yt h el o c a ld e p a r t m e n t ,b u t t h ei n t e r c o m m u n i c a t i o na n d r e s o u r c e ss h a r i n gc a n n o tb ep r o c e s s e da m o n gt h ea p p l i c a t i o ns y s t e m sw h i c ha r ed i f f e r e n ti n d b m sa n dd a t a b a s es t r u c t u r e s s ot h ei s o l a t e di s l a n d so f i n f o r m a t i o nh a db ef o r m e d ,w h i c hl e d t ol a t e n e s sa n dd i s a g r e e m e n ta n dt h el o wu s i n gr a t e t h e r e f o r e ,i ti sa n e c e s s a r yc h o i c ef o rt h e f o r e s tr e s o u r c e sm a n a g e m e n ti n f o r m a t i o ns y s t e mt oe f f e c t i v e l ye x c h a n g ea n di n t e g r a t et h ed a t a f o r m a t t h et h e s i sb a s e do i lt h es e c o n d a r yc a t e g o r ys u r v e yd a t a , a c c o r d i n gt ot h es o u r c ed a t af o r m a t a n dt h ed e m a n do ft h es u b m i t t e dd a t aw h i c ht h es u p e r i o rd i g i t a lf o r e s t r yp l a t f o r md e m a n d e d f a c t u a l l y , i tp r e s e n t st h em o d e lo f t h eh e t e r o g e n e o u sd a t ae x c h a n g eb a s e do nx m l i te s t a b l i s h e s t h ef o u n d a t i o nf o rt h ei n f o r m a t i o n i z a t i o nm a n a g e m e n ti n f o r m a t i o ns u p e r v i s i o no ft h eh i g h e r - u p f o r e s tr e s o u r c em a n a g e m e n td e p a r t m e n t t h et h e s i s f i r s t l ys t u d i e st h er e l a t e dt e c h n o l o g yo fd a t a b a s e a c c e s st e c h n o l o g y , d a t a e x c h a n g et e c h n o l o g y a n dx m lt e c h n o l o g y , a n dt h e n a n a l y s e s t h em a i nt y p e so ft h e h e t e r o g e n e o u sd a t aa n dm a i nm o d e so f d a t ae x c h a n g ei nt h es u b s y s t e mo f d a t ae x c h a n g e a i m i n g a tt h el i m i t a t i o n sw h a ti st h es h o r to fu n i t i v es t a n d a r do ft h eq u o n d a mt e c h n o l o g y , d e p e n d e n c e o nt h ep l a t f o r m ,a n dt h eg r e a tc o u p l i n ga m o n gt h ed i f f e r e n ts y s t e m i tp r o v i d e sas o l v i n g s c h e m et h a th e t e r o u g e n e o u sd a t ai n t e g r a t i o nb a s e do nx m l t h et h e s i sa n a l y s e st h es t r u c t u r eo f t h eh e t e r o g e n e o u sd a t ae x c h a n g eb a s e do nt h ex m l ,t h ee x c h a n g ef l o wa n dt h ei m p l e m e n t e d p r o c e s s ,c o n t r a p o s e dt h ed a t ae x c h a n g em o d eo f t h i ss y s t e m ,d i s c u s s e st h et e c h n o l o g i e s ,s u c ha s j d b cd a t a b a s ea c r o s si n t e r f a c e ,t h ec h a n g eo ft h ed a t at y p e ,t h ep r o c e s s i n go ft h eb i n a r yl a r g e o b j e c t s ,t h e r e f e r e n t i a li n t e g r a l i t y , a n ds oo i lt h em a i nb r e a k t h r o u g hi st h es t u d yo nt h e a p p l i c a t i o no fp r o c e s s i n gt h eb i n a r yl a r g eo b j e c t s - - b a s e 6 4e n c o d i n ga n dt h er e f e r e n c e i n t e g r a l i t yi nt h ef o r e s tr e s o u r c e sm a n a g e m e n ti n f o r m a t i o ns y s t e m k e yw o r d s :f o r e s tr e s o u r c e sm a n a g e m e n ti n f o r m a t i o ns y s t e m ,h e t e r o g e n e o u sd a t a b a s e , d a t ai n t e g r a t i o n ,x m l n 第1 章绪论 第1 章绪论 当今社会正从工业时代迈向信息时代,信息化建设已成为国民经济和社会发展的一项 重要战略任务。随着“数字地球”、“数字林业”等概念的提出,发达国家的森林资源管理 无不采用先进的信息化手段【l 】,实现对森林资源科学高效的管理。“数字林业”是指在数 字地球大框架指导下,应用遥感技术、计算机技术、数字化技术、网络技术、智能技术和 可视化技术,把地球上的各种林业信息用地理坐标确定与连接起来,实现标准化规范化采 集与更新数据,实现数据充分享用的过程f 2 】。 在我国,随着数字林业工作的不断深入,各级林业管理部门纷纷加入到信息化、数字 化的改革大潮中来,人们已经认识到森林资源管理应该与信息技术紧密结合并有所突破。 数字林业与传统林业相比,更加重视高科技及现代化的技术在林业监测、管理、决策中的 作用。以信息化推动工业化、现代化,实现跨越式发展,森林资源管理部门迫切需要充分 利用信息时代的森林资源信息管理的理论体系与技术方法,用一种新的思维、新的方式去 管理森林资源,以推动营林、森林保护、林业管理、林产工业、退耕还林工程等技术的信 息化进程,为林业部门的决策提供信息支持,实现林业可持续发展例。 近几十年来,计算机网络的飞速发展和信息化的推进,使得人类社会所积累的数据量 已经超过了过去5 0 0 0 年的总和。数据的采集、存储、处理和传播的数量也与日俱增。我 国林业信息分布广泛、数量庞大,运用常规的人工方式管理和分析,不但周期长、时效性 差,而且难以满足复杂的数据分析需求。随着计算机、数据库、网络等技术迅猛发展以及 在林业中的广泛应用,林业行业从国家到地方,从生产管理部f - j n 研究机构构建了很多基 于b s 结构的应用系统【4 l 。但是,系统平台的差异以及数据标准、存储方式的不同,各应 用系统之间不能互通互联,无法实现共享,形成了一个个信息孤岛,导致信息不及时、不 一致、利用率低下【5 1 。因此,如何对数据格式进行有效的转换和整合已成为森林资源管理 信息系统的必然选择。因为每个管理系统都会拥有自己的数据库,这些数据库可能是独立、 异构且自治的,为了各部门间更好的合作和数据共享,并且为用户提供更好的搜索查询质 量,建立一个完善的数据格式转换系统是极有应用价值而且尤为重要的。 1 1 森林资源信息管理相关概念 1 森林资源 从较广义的角度理解,森林资源应包括两部分,一是直接的实物资源,二是间接资源。 直接资源包括林地( 现实和规定将要用于种植林木的土地) 、林木( 成片或单株的树木,包括 利用木材的树木和利用坚果、叶、茎、根等非木材的树木) 资源和林中其他植物( 树木以外 的其他植物) 、野生动物( 兽、鸟、昆虫、鱼类等动物) 和非生物( 水体、岩石、矿物等) 资源 的总称。间接资源主要是由于森林的存在而产生的环境、气候、观赏、旅游、森林文化等 资源【6 j 。 2 森林资源管理 首都师范大学工学硕十学位论文 森林资源管理是在可持续发展的指引下,为取得森林多种效益,通过计划、组织、指 挥、协调、控制,对同一地域内的森林资源及相关因素进行筹划和控制的过程,是人们为 了达到某一共同目标,有意识、有组织、不断进行的协调活动 7 1 。它强调的是为实现某一 目标而进行的各种活动,而各种活动的效果如何在很大程度上建立在对森林资源信息获 取、加工与利用之上,它不仅需要理论、方法的指导,也需要有手段与技术的支持。 3 。森林资源信息管理 森林资源信息管理是森林资源信息社会实践活动过程的管理,它是利用各种方法与手 段,运用计划、组织、指挥、控制和协调的管理职能,对信息进行收集、储存、处理提供 服务的过程,以有效地利用人财物,控制森林资源按预定目标发展的活动。 现代森林资源信息管理是以人( 知识或信息) 为中心,系统理论与方法为指导,信息技 术为手段,网络化为基础,可持续为目标的管理。它包含了以森林资源时间、空间信息为 主题的人、财、物机构等多种要素信息,它将朝系统的方向发展,形成森林资源管理信息 系统,并最终综合基本数据处理系统、信息分析系统和决策支持系统,从而达到具备支持 基层数据处理和查询分析的要求,中层管理控制和高层决策支持的功能【8 1 。 4 管理信息系统 管理信息系统( m a n a g e m e n ti n f o r m a t i o ns y s t e m ,简称m i s ) 是着重信息传输的逻辑程序 和数学模型,用计算机处理信息,用通讯技术传输、转换信息,为组织领导提供管理决策 的信息系统,在结构上,它可分为业务信息系统,功能信息系统与决策支持系统 4 1 。 它完成信息采集、编码、传输、贮存、检索、分发和输出的职能,独立存在或为林业 管理信息系统的组成部分。 5 异构数据库 异构数据库( h e t e r o g e n e o u sd a t a b a s e ) 包含不同物理模型的数据库、不同数据模型的 数据库、同数据模型不同厂商的同质异型数据库,以及同一数据库厂商的不同版本、针对 不同网络环境的数据库产品等等。引起数据库异构的因素很多,如:计算机硬件、操作系 统、数据模型、物理模型、数据语义等的不刚”。 6 分布式数据库 分布式数据库( d i s t r i b u t e dd a t a b a s e ) 是指物理上分散而逻辑上集中的数据库。在分布 式数据库中,被计算机网络联结的每个逻辑单位,称为结点。物理上的分散是指各站点分 散在不同的地方;逻辑上集中是指各站点之间是一个逻辑整体1 1 0 j h i 。 7 数据集成 数据集成是对各种异构数据提供统一的表示、存储和管理,这些功能在异构数据集成 系统中实现。数据集成屏蔽了各种异构数据间的差异,通过异构数据集成系统进行统一的 操作。因此集成后的异构数据对用户来说是统一和无差异的。 异构数据源集成u 2 i 就是在一个确定领域中,集成其存在的异构且自治的数据源,使用 户感觉到所查询的数据都具有单的模式且存储在单个数据源中。数据源集成系统最重要 的特点就是为用户提供一个统一的访问界面,使用户能够将注意力集中在要查询的内容 2 第1 章绪论 上,而不是如何去得到数据的方法上。 1 2 森林资源信息管理中的异构数据问题 森林资源管理信息系统在发展过程中积累了大量数据,而且森林资源管理部门为存储 和管理这些数据不断投资。然而,由于实施数据库管理系统的阶段性、技术性以及其他经 济和人为因素的影响,以致在不同的森林资源管理部门或是同一个森林资源管理部门内部 采用的数据库管理系统也大不相同,导致了数据结构、处理方式和服务范围等的不一致性。 这些不一致性导致了各种系统间的数据不能有效共享,系统操作人员重复劳动多,差错率 高,森林资源管理部门人员难以利用现有数据进行有效地决策分析。同时,网络的发展使 林业部门逐渐从一个孤立节点发展成为不断与网络交换信息和进行有关业务活动的实体, 森林资源数据集成也从林业内部集成走向了林业部门间集成。这样,一方面,现在的森林 资源管理需要将各种数据进行交换和在网上发布。为了满足这种要求,我们必须将各种有 关的异构数据源进行集成。另一方面,为了保护原有的信息化投资,这种数据集成又不能 只是简单地将其他系统的数据一次性移植到某一个系统中。传统的数据库集成方法现在已 经远远不能适应人们获取数据的需求,因此迫切需要一种新的数据集成系统【l 2 。 1 3 论文研究的目的和意义 在森林资源信息管理系统开发过程中,我们强调的原则是三分技术,七分管理,十二 分数据。数据的正确性是系统运行成功与否的关键。没有完整准确的数据支持,再强大完 备的软件,再精明能干的管理者也无法做出正确的决策【1 引。因此对系统所应用的各种技术 的研究与探讨有着重要的意义。 森林资源信息管理系统是“数字林业平台技术研究与应用”中数字林业公共技术平台 的一部分,很重要一项工作就是数据标准化,是向上一级数字林业平台提交标准化的数据, 为国家重大林业决策分析提供依据,而系统大多都是分开自行开发的,不同系统的数据依 据的行业标准各有不同,导致各子系统的数据库管理系统大不相同,存在着结构差异( 描 述数据项不同、字段名不同、相同的字段可能数据类型不同等) 和语义差异( 对同一资源 描述的数据项在一个数据库中存储为字段的值,而在另一数据库中存储为字段名等等) 。 为了保护已有的信息化投资,同时实现各部门之间数据的共享,迫切需要一种能够实现不 同数据库系统间数据交换和共享的平台,从而实现向上级递交标准化的数据。因此,异构 数据整合成为基于异构数据库的管理信息系统开发是否成功的关键。 在森林资源管理应用系统中,数据统计汇总是重要的一项功能,县级向省级上报,省 级向国家级上报数据。而不同级别的数字平台甚至是同一级别的平台,由于各地所应用的 软件和管理方式的不同,在向上一级汇总的数据也存在着异构问题。但关键是要做到各级 林业管理部门能进行图形数据和属性数据的相互转换,以实现数据的交流和共享【l ”。本论 文的研究的正是针对这些异构数据做的整合方案,通过本模型实现由不同类型的数据库到 儿文档的转换。 首都师范大学工学硕士学位论文 1 4 国内外的研究现状及趋势 1 4 1 国外的研究成果 1 森林资源管理 国外林业科技已进入了系统阶段,在高度分化基础上的高度综合成为了一种趋势。由 于信息技术的发展,管理信息系统综合了基本数据处理系统、信息分析系统和决策支持系 统,从而达到了具备支持基层数据处理,中层管理控制和商层决策支持的功能1 4 1 。 8 0 年代以后,随着网络等信息技术的迅猛发展,计算机在发达国家的森林资源管理工 作中得到了日益广泛的应用。目前在森林资源监测、科学研究、决策、规划、森林资源预 测与评价等各个领域发挥着不可估量的作用l ”j 。 加拿大林业部9 0 年代开始建立国家林业信息系统,采用了统一的林业元数据,建立了 国家林业数据仓库。该系统综合了遥感数据、样地森林蓄积数据、国家林业数据库和其他 联邦省份的地理信息,利用最新的数据处理和建模技术,采用分布式的数据库平台,实现 了森林资源监测,综合统计报表等功能【l6 】。c u e s t a s y s 公司开发的林业信息系统,利用g i s 和模型化的集成,达到对林地规划、造林、培育、采伐等经营管理。 美国p a t l a t c h 公司在九十年代早期建立了基于地理信息系统的森林经营系统,可随时提 供林地上的林木信息,采伐状况及显示林业专题图f 。目前,美国麻省理工学院林业科学 系在国家宇航局( n a s a ) 赞助下研建森林蓄积量监测信息系统,该系统利用卫星影像数据生 成森林立地类型图,对森林资源变化进行评价,同时把这些信息放在i n t e r n e t 上进行共享, 建立了森林目录与分析数据库提取系统、国家f i a 数据库系统( n a t i o n a lf i ad a t a b a s e s y s t e m i t s ) 等基于w e b 的数据库,这些数据库可通过网络直接面向用户,替代了先前的 e a s t w i d e w e s t w i d e 数据库。 俄罗斯森林资源研究中心把数据通信与计算机技术结合起来,形成了数据库和大地信 息系统及p c 系统为核心的信息处理系统,包括森林资源数据库及专题显示,利用通信技术, 实现森林火灾的预防。 随着8 0 年代关系型数据库理论的日趋完善,关系型数据库产品成为发展的主流,几乎 所有新推出的d b m s 产品都是关系型的,如o r a c l e ,s y b a s e ,s q ls e r v e r ,a c c e s s ,f o x p r o 等。但是,在这些早期数据库应用系统中,处理的一般都是来自本单位的数据库系统中的 数据,种类单一,应用程序和数据库系统之间的关系密切。然而,目前数据库应用开发人 员和最终用户所面对的往往是多个异构数据库系统。这些数据库系统都各自支持相应的应 用。对信息系统的使用人员来说,使用多种数据库语言分别访问不同的数据库来获得信息, 则过于繁琐,他们希望能在整个企业的多种数据库系统之间进行数据的整合和传送,从而 能使应用适应多种数据库。 2 数据集成研究现状 当前,实现异构数据库的集成一般有两种方法。第一种就是将原有的数据移植到新的 数据管理系统中来,为了集成不同类型的数据,必须将一些非传统的数据类型转化成新的 4 第1 章绪论 数据类型。许多关系数据库供应商提供了类似的功能。这种集成方式的缺点是随着数据管 理系统的升级,原来数据的相关应用软件,或是被废弃或是重新开发,以适应新的数据管 理系统。因此,通常移植到一个新系统不是一个实际的解决方案。第二种方法是利用中间 件集成异构数据库,该方法并不需要改变原始数据的存储和管理方式。中间件位于异构数 据库系统( 数据层) 和应用程序( 应用层) 之间,向下协调各数据库系统,向上为访问集 成数据的应用提供统一数据模式,和数据访问的通用接口。各数据库的应用仍然完成它们 的任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务。显然,中间件系 统模式是实现异构数据集成较理想的解决方案1 2 0 1 。 早期的数据来源主要是各种关系型数据库,因而集成主要针对关系数据库进行。像 o d b c 方法和传统的模式集成方法都是典型的对关系数据库进行集成的方法。随着信息技 术的迅速发展,数据的存储超出了关系数据库的范畴,相应的也就产生了跨平台对多种类 型的数据进行集成的要求。新出现的技术例如:微软的通用数据访问结构、二层集成方案、 d c o m c o r b a ( d i s t r i b u t e dc o m p o n e n to b j e c tm o d e l c o m m o no b j e c tr e q u e s tb r o k e ra r c h i t e c t u r e ) 和用扩展标记语言x m l 进行集成等都可以对多种异构的数据进行集成。 2 0 世纪9 0 年代以来,分布对象技术( d o c ) 得到了迅速的发展,随着研究的深入和应用 的日益广泛,d o c 形成了两个阵营:一个是m i c r o s o f t 公司,使用d c o m 技术;另一个是o m g 组织,使用c o r b a 技术。d c o m 技术只适用于w i n d o w s 平台,现在虽然在u n x 平台上有 了一定的扩展,但效果仍不理想。但是,因为它和w i n d o w s 都是微软的产品,因而可以和 操作系统紧密相关,从而大大提高了它的运行效率。目前有很多家公司开发了基于c o r b a 的应用。c o r b a 的跨平台能力非常优秀,但正因为此,所有与操作系统之间的交互必须通 过中介代理进行,这使得它的运作效率不j t l i d c o m 。 从采用基于x m l 技术的中间件来集成异构数据源或异构信息的角度来看,目前,相关 研究主要集中在国外。 美国政府在1 9 9 8 年通过o p a l 计划开始支持y a t 2 2 1 ( 基于中间件的信息集成系统) 系统 的研究,该系统采用m e d i a t o r w r a p p e r 间件框架实现了关系模式和s g m l 到o d m g 的转 化,在2 0 0 0 年,该系统的研究再次受至i j o p a l 计划和a q u a r e l l e 资助,并以研究基于x m l 中间件信息集成系统( y a t 系统) 为主,其中v c h r i s t o p h i d e s ,s c l u e t 等人主要研究 了以x m l 集成视图对异构数据的包装和查询,并提出了相应的代数体系结构。w i s c o n s i n 大学和i b m a l m a d e n r e s e a r c h c e n t e r 共同研究和实现t x p e r a n t o z 3 j 中间件系统。该中间 件系统支持对象关系数据的x m l 发布,支持基于x m lq u e r y 的x m l 关系数据视图,采用了 f l a t 模式转化算法,以d t d 为目标模式,但不支持主键及外键等约束的描述,也不支持 多表关系约束的转化。基于x m l 的异构数据源的数据集成研究r o n a l d od o ss a n t o sm e l l o 等 研究利用中间层结构集成和查询x m l 数据源的问题。m a r y l a n d 大学研究了基于x m l 代码自 动部署和数据交换m o c h a 中间件。相比之下,国内还没有公开的相关研究。 就关系模式到) 。讧l 模式转化方面来看,己经存在转化工具和大量相关算法的研究:一 些商业产品实现了关系模式到x m l 文档的转化,例如o d b c 2 x m l 、o r a c l e sx s q l 、x m l 首都师范大学工学硕士学位论文 s p y 、s i l k r o u t e t 具。目前,除o d b c 2 x m l 、x m ls p y 、s i l k _ r o u t e # l - ,大部分工具都是为 相关的数据产品服务,不支持多种异构数据库集成,更不支持其到) 叫l 的集成,而 o d b c 2 x m l ,x m ls p y ,s i l k r o u t e 虽然支持多种数据库系统,但仍不支持异构数据库的 集成。 1 4 2 国内森林资源信息化管理及系统建设的现状分析 随着信息技术的研究和实践的迅猛发展,我国信息技术的研究和实践虽然落后于发达 国家,但进入上世纪8 0 年代以后,也加快了发展进程。森林资源经营和管理领域信息技 术应用起步较晚,但是为适应潮流,自8 0 年代以后,也呈现跨越式的发展。 信息技术在我国森林资源管理领域的应用始于上世纪6 0 年代,我国森林经理学科的 测树研究方向,利用我国第一代计算机进行了数值计算实验,作了计算机应用的初步探索。 但是在以后的1 0 多年中处于停止状态,直到7 0 年代末开始进入有组织、有目标、有系统 的研究和实践时期。7 0 年代末、8 0 年代初,北京林业大学、原国家林业部规划院等单位 开始从事计算机在森林资源经营和管理中的研究,研究和推广了可编程的计算器( 如t i 5 9 等) ,用它编制了大量的林业常用软件( 如回归分析、解析木等计算和报表统计汇总等数据 管理) ,来解决森林资源经营管理中所遇到的许多实际问题。8 0 年代初,徐冠华等在中型 机上研建了遥感信息处理系统,用它进行森林数量分类、编制林分数量化蓄积表等工作, 推动了遥感信息技术的普及。为了开拓应用领域,从8 0 年代中期开始,研究和实践综合 与系统的信息管理。在原林业部资源司的组织,和原林业部规划院、北京林业大学和河北 省林业勘测设计院等单位参与下,先利用数据文件而后用数据库技术存储数据,研建了森 林资源连续清查的数据处理和存储、管理的程序,使计算机应用走迸了数据管理阶段 2 4 1 。 从8 0 年代后期北京林业大学在甘肃小陇山林业局、浙江开化林场开始研究面向管理 的森林资源管理信息系统,于1 9 8 8 年实现了我国第一个“森林资源管理信息系统”。因受 当时技术及手段的限制,这个系统只反映数据的统计及更新管理,应用面较狭窄,系统功 能差【2 5 l 。由于森林资源管理中,有许多问题是非结构化的问题需要经过模拟,做出并选中 满意的方案,在这一时期,产生了一些面向某类问题的决策支持系统,例如“择伐林经营 决策支持系统” 2 6 1 等。 进入9 0 年代后,由于计算机硬件支持能力的提升,各种软件开发平台从单一逐步走 向综合与集成,森林资源数据处理从以数据管理为主转向到综合分析与决策为主,从单向 应用系统转向到综合应用系统,并更加重视时空管理与动态分析以及网络环境下信息处理 与共享的等级与标准,广泛地应用了网络技术和g i s 技术。在这一时期,我国林业工作者 也开展了自主版权的g i s 软件开发工作,中国林业科学研究院的唐小明博士主持开发了基 于w i n d o w $ 平台的g i s 商品软件v i e w g i s ( 原名为w i n g i s ) ,已广泛试用于森林资源 经营管理的多个方面【2 7 1 。同时由于数据库技术的不断完善和其功能的不断增强,数据库的 重要性愈显突出,对数据库在森林资源上的应用探索增强,如v i s u a lf o x p m 环境下的森林 资源数据库的完整性控制的研究等【2 3 】,同时发现其一部分功能是g i s 所替代不了的,进而 6 第1 章绪论 逐步由单纯利用g i s 进行森林资源管理向将g i s 与数据库结合使用的方向转变 2 9 1 。 9 0 年代初期,以寇文正为主研制的“国家林火管理信息系统”成功地解决了林相图与 地形图的配准与标准化问题,集模型库系统、数据库系统、图形库系统于一体,功能丰富, 加强了林火信息管理及森林防火工作,提高了林火查找的决策能力。该系统开发后,先后 在黑龙江、云南、吉林、北京等省市进行示范推广、获得了较好的效果嘲。中国林科院资 信所基于w i n g i s 平台,开发完成了一套林火管理信息系统,提供了一套完备的决策、咨 询功能,生成一系列有关林火的专题地图【6 卿。1 9 9 8 年由中国林科院资源信息研究所唐守正 院士主持的“我国南方人工林国营林业局( 场) 森林资源现代化管理技术的研究”课题, 首先提出了森林资源经营管理三个反馈环的思想,并进行了森林资源动态管理及数据更新 技术、森林资源的管理等研究。 我国许多单位对“森林资源管理信息系统”方面的研究及研制的森林资源管理信息系 统软件为建立通用的森林资源管理信息系统提供了有益的借鉴和基础。唐守正院士主持完 成的“我国南方人工林林业局( 场) 集约经营技术的研究”、“天然林区森林资源监测与经 营管理技术研究”,提出了森林资源动态管理及数据更新技术、森林资源经营管理中的三 个反馈环思想等,全面地探索了森林资源现代化经营管理的途径,为建立森林资源管理信 息系统提供了坚实的理论基础和方法。“数字林业标准规范”的编制、系列技术规程的 不断更新与完善及林学基础研究为建立森林资源管理信息系统奠定了基础。 与发达国家相比,我国的林资源管理信息系统中部分先进技术与世界同步,例如遥感 技术、模型技术等。但是,我国森林资源信息化管理及系统建设仍然存在许多问题,其中 重要的一点就是系统建设没有统一的标准和规范,数据交换和共享困难:全国各地建立的 森林资源管理信息系统往往是各自采用自己的标准,自成体系,和其它相关系统互不兼容, 综合信息资源不能共享,信息内容与形式过于单一,上下层缺乏信息交流,各信息用户界 面风格不一,操作复杂,造成了森林资源信息分散,信息共享难以实现,通用性和兼容性 比较差【3 0 】。 从世界各国林业信息化的发展来看,为了与信息技术的发展相适应,我国森林资源管 理信息系统应朝着管理知识化、标准化、规范化、网络化、集成化和多媒体化向发展 综上所述,国内外对基于x m l 的森林资源管理信息系统中的异构数据整合方面研究较 少,而现有系统环境与数据库种类繁多,数据共享和通用性的数据上报研究开展的较少。 因此,研究当前形势下的森林资源管理信息系统中异构数据整合是非常必要的。 1 。5 研究内容 本论文研究的目标是从我国森林资源管理系统的研究现状出发,综合分析现有系统的 功能特点,在充分借鉴和肯定已取得的理论成果和实践成果的基础上,针对新的时代环境 下的森林资源管理信息系统的一些较为关键的内容进行研究,使系统的建立更加以人为 本,更好地为林业生产提供服务,为林业企业计划、核算、调度、统计定额和经济活动分 析等工作的提供依据。论文的具体研究内容如下: 首都师范大学- 丁学硕十学位论文 ( 1 ) 异构数据交换的相关技术研究:在分析数据库访问技术的基础上,研究了数据交 换技术和x m l 技术。 ( 2 ) 提出了森林资源信息管理系统异构数据整合方案。 ( 3 ) 提出了基于x m l 的森林资源管理系统数据交换子系统的模型。 ( 4 ) 基于x m l 的数据整合实现中的一些问题的讨论j d b c 数据库接口,数据类型转 换,大对象的处理及参照完整性。 1 6 研究的技术路线 本论文采用系统科学的方法,理论与实际相结合,宏观综合分析和微观具体实践相结 合。采取的技术路线如图1 1 所示,首先对现有系统和和进行分析,然后学习和分析系统所 涉及的相关技术,提出系统异构数据整合方案模型,并对数据整合中的一些问题进行讨论, 重点提出了大对象数据的处理及参照完整性的实现方案。 f 森林资源管理信息系统现状分析 现代信息技术应用现状分析数据异构问题分析 ll 数据数据交换相关技术学习 f 数据库访问技术ff 数据交换技术ff x m l 技术f 上 系统异构数据整合方案 1 分析异构ii 数据交换分i 基于x m l 的数据 i 数据类型ii 层结构模型l 交换的实现过程 数据交换模型 功能结构ll 交换模型i i 交换流程il 中间件架构与实现l | 界面模式 j 数据整合中的一些问题的讨论 lj d b c 数据库连接ii 数据转换ii 大对象的处理il 参照完整性i 图1 1 研究的技术路线 8 第2 章森林资源信息管理异构数据交换相关技术 第2 章异构数据交换相关技术 2 1 数据库访问技术 数据库技术的发展,已经成为先进信息技术的重要组成部分,是现代计算机信息系统 和计算机应用系统的基础和核心【3 2 l 。数据库的诞生以2 0 世纪6 0 年代i b m 公司推出的数 据库管理产品i m s ( i n f o r m a t i o nm a n a g e m e n ts y s t e m ,简称i m s ) 为标志。7 0 年代初,美国数 据库系统语言协会( c o n f e r e n c eo nd a t as y s t e ml a n g u a g e ,简称c o d a s y l ) 下属的数据库 任务组( d a t a b a s et a s kg r o u p ,简称d b t g ) 对数据库的方法和技术进行了系统研究,并提 出了著名的d b t g 报告。该报告确定并建立了数据库系统的许多基本概念、方法和技术。 报告成为网状数据模型的典型技术代表,它奠定了数据库发展的基础,并有着深远的影响。 1 9 7 0 年i b m 公司的e f c o d d 发表了著名的基于关系模型的数据库技术的论大型共享数 据库数据的关系模型,并获得1 9 8 1 年a c m 图灵奖,标志着关系模型数据库模型的诞生。 1 9 8 0 年以前,数据库技术的发展,主要体现在数据库的模型设计上。进入2 0 世纪9 0 年代后,计算机领域中其它新兴技术的发展对数据库技术产生了重大影响。数据库技术与 网络通信技术、人工智能技术、多媒体技术等相互渗透,相互结合,使数据库技术的新内 容层出不穷。数据库的许多整体概念、技术内容、应用领域,甚至某些原理都有了重大的 发展和变化,形成了数据库领域众多的研究分支和课题,产生了一系列新型数据库。从数 据模型来看,出现了面向对象数据库;从数据分布来看,出现了分布式数据库:从数据处 理方式来看,出现了并行数据库;从数据库的外部连接性来看,出现了w e b 数据库;从数 据库的应用领域来看,出现了各种各样的特殊数据库,如空间数据库、多媒体数据库、模 糊数据库等【3 3 】。数据库的产生与发展大致可用图2 1 来表示。 图2 1 数据库的产生与发展过程 2 l 世纪是信息时代,随着信息时代的来临,微机的普及,数据库和数据仓库技术的发 展,数据库之间交换数据将变得越来越频繁,数据交换也成为了一个热门的研究课题。传 统的森林资源调查积累了大量的森林资源基础数据,而随着遥感技术及全球定位技术等新 一代调查技术在森林资源调查中的广泛应用,使森林资源基础数据量日益庞大。这些庞大 9 首都师范大学工学硕士学位论文 且复杂的数据的组织与储存需要依靠数据库技术来实现,因此数据库技术的应用对森林资 源信息管理的影响极其深远。针对目前众多的数据库,需要一个专门的工具来处理各种数 据库之间的交换操作,这正是本论文的研究目的:研究功能完备且独立运行的数据交换系 统,尽可能减少环境依赖性。 2 1 1o d b c 数据库连接技术 o d b c ( o p e n d a t a b a s ec o n n e c t i v i t y ,简称o d b c ) 最初是由制定u n i x 标准的x o p e n 集团和s q l a c c e s s g r o u p 提出的开放数据库互连接口。m i c r o s o f t 是o d b c 的实现者。目 前,o d b c 己被其确定为w o s a ( t h ew i n d o w so p e ns y s t e ma r c h i t e c t u r e ,即w i n d o w s 开放 系统体系结构) 的主要部分。o d b c 建立了一组规范,并提供了一组对数据库访问的标准应 用程序编程接口a p i ( a p p l i c a t i o np r o g r a m m i n gi n t e r f a c e ,简称a p i ) 。这些a p i 独立于不同 厂商的d b m s ,也独立于具体的编程语言( 但是m i c r o s o f t 的o d b c 文档是用c 语言描述 的,许多实际的o d b c 驱动程序也是用c 语言写的) 。a p l 利用s q l 来完成其大部分任 务。o d b c 本身也提供了对s q l 语言的支持,用户可以直接将s q l 语句送给o d b c 。 o d b c 具有良好的数据独立性,提供对多种数据库的支持,如v i s u a lf o r x p r o 、a c c e s s 、 m ss q ls e r v e r 及o r a c l e 等,一个基于o d b c 的应用程序对数据库的操作不依赖任何 d b m s ,不直接与d b m s 打交道,所有的数据库操作由对应的d b m s 的o d b c 驱动程序 完成。也就是说,不论是f o x p r o 、a c c e s s 还是o r a c l e 数据库,均可用o d b ca p i 进行访 问。由此可见,o d b c 的最大优点是能以统一的方式处理所有的数据库。使用o d b c 编写 的应用更改起后台数据库来非常方便只要更改相应的驱动程序就可以了,在实现上即 表现为简单地装入不同的d l l 文件。这一点也使得利用它可以缩短开发时间。o d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家居健康建设项目可行性分析报告(总投资15000万元)
- 供应链管理优化降低成本的策略
- 物业公司质保到期工程管理作业规范
- 户外照明建设项目可行性分析报告(总投资11000万元)
- 菜刀项目可行性研究报告(总投资6000万元)(25亩)
- 压缩空气净化项目可行性分析报告范文(总投资9000万元)
- 2025年养老护理员(高级)职业技能鉴定题库及参考答案解析
- 小学安全教育课件
- 2025年消防安全知识培训考试题库:消防应急救援指挥员消防技术标准试题
- 高考阅读理解真题教案及答案
- (高清版)DBJ∕T 13-318-2025 《建筑施工盘扣式钢管脚手架安全技术标准》
- 大数据接入管理办法
- 2025珠海市劳动合同模板
- 消防工程师课件案例分享
- xx教育培训机构xx年中考全托提分计划
- 稻谷加工技术课件
- 护理工作人员应急调配管理方案及流程
- 昌平酒店封锁管理制度
- 解读:中华护理学会团体标准《住院患者身体约束护理》
- 华为人工智能全套完整教学课件
- 生产总监面试题及答案
评论
0/150
提交评论