(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf_第1页
(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf_第2页
(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf_第3页
(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf_第4页
(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(管理科学与工程专业论文)国家重点野外试验站网络信息共享系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得中国农业科学院或其它教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示了谢意。 研究生签名:_ 方泐时间腓月矽f 1 关于论文使用授权的声明 本人完全了解中国农业科学院有关保留、使用学位论文的规定,即:中国农 业科学院有权保留送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用 影印、缩印或扫描等复制手段保存、汇编学位论文。同意中国农业科学院可以用 不同方式在不同媒体上发表、传播学位论文的全部或部分内容。 ( 保密的学位论文在解密后应遵守此协议) 论文作者签名:穸髟 时间:) 一彳年g 月,日 导师签名 豸办易 时间:p 影年6 月乃日 中国农业科学院硕士学位论文 前言 我国成立了由1 3 个部委组成的“全球气候监测系统中国委员会”。2 0 0 2 年,g c o s 中国委员会成 立了由不同部门专家组成的专家组,并从专家层面上提出了中国气候系统监测总体实施方案。 我国现有的气象监测网主要针对天气预报的需要,而气候预测和气候变化研究需要把监测范围扩 大到整个气候系统,既监测它的各种物理过程、化学过程、生物地球化学过程,也监测对人类活 动的影响,由此,我国急需建设中国气候系统监测网。 我国正在整合气候监测系统资源,与气候系统监测相关的大气、海洋、生态等方面的资料采 集工作,是由气象局、海洋局、水利部、环保总局、中国科学院等机构分头进行的。经过多年的 建设和发展,这些数据集已经能够基本满足各部门的工作需要,但在学科交叉和融合已成为科学 发展基本趋势的今天,这些分敞在各部门的数据集,因其在格式、标准和交流上的问题已经不能 满足社会经济发展对气候工作的需求。 2 、陆地监测系统 我国的陆地监测涉及领域多,监测内容广泛,台站数量多,相对较成熟。主要包括生态系统 研究网络、森林生态系统监测网络、农业生态系统监测网络、地球物理监测网络以及环境材料腐 蚀试验网络等。 ( 1 ) 中国生态系统研究网络( c e r n ) 。中国科学院于1 9 8 7 年在国内率先实行野外监测试验 站开放制度,采用国家重点开放实验室的建设和管理规范对中国科学院的1 5 个野外试验站进行 了建设和管理。将1 5 个开放试验站建成了仪器装备先进,生活设施良好,具备向国内外开放条 件的野外试验站,并于1 9 8 8 年开始筹建中国生态系统研究网络( c 瑚冰) 。现拥有分布于全国各 主要生态类型区的3 6 个生态站、5 个学科分中心和1 个综合中心。2 0 0 2 年又进一步完善c e r n 和地磁台链,以已有台站为基础新建大气本底监测网络、特殊环境与灾害监测网络,并通过数据 交换中心将这四大网络联为一体。 ( 2 ) 森林生态系统野外监测网络。我国森林生态系统定位研究站始建于二十世纪6 0 年代, 随着规模的完善和扩大,这些不同类型的监测站构成了我国林业生态环境效益监测网络的主体, 形成了从沿海到内地,从农田林网到山地森林,从内陆湿地到干旱荒漠化地区的生态环境监测网 络系统。 国家林业局于1 9 9 2 年建立中国森林生态系统研究网络( c f e r n ) ,森林生态站由成立之初的 1 1 个发展到现在的1 5 个,与中科院c e r n 的1 1 个森林生态站在地域分布上互补,两者初步构成 我国国家森林生态系统研究网络的雏形。 ( 3 ) 农业生态系统野外监测网络。中国农业科学院在全国熏点农区建立了九个“国家土壤 肥力和肥料效益监测基地”及北京数据标本库,初步组成全国性监测试验网络体系。另外,为了 妥善保存我国已收集的3 8 万份作物种质资源,1 9 7 8 年以来,国家投资兴建了国家种质资源长期 库和3 2 个国家级种质资源圃,为我国一级作物种质资源保存提供了条件,也为各作物种质资源 监测鉴定研究提供了较好的基地。 ( 4 ) 地球物理野外监测台网。新中国的地球物理监测台网建设始于6 0 年代。到目前为止, 我国已建成由5 0 0 余个地方台站或监测点构成,包含重力、地磁、测震、大地电场等1 4 0 0 余个 监测项目的地球物理综合监测网。 野外地球物理监测试验台站为科学研究提供了眭期、综合、丰富的第一手资料,大大提高了 4 中国农业科学院硕士学位论文 前言 我国科学研究的原始创新能力。许多重要台站如南京台、上海余山台、长春台、兰州台、昆明台 的地震和地磁监测具有持续5 0 年至1 0 0 年的连续记录。这些资料不仅充实了相关学科的内容, 还为基础理论、前沿问题的研究做出了重要贡献,并在交叉学科的创立和新领域的开拓方面发挥 了重要作用。 ( 5 ) 材料环境腐蚀试验网络。我国材料自然环境腐蚀试验研究工作开始于五十年代,1 9 5 8 1 9 5 9 年分别建立了全国大气、海水、土壤腐蚀试验网站,1 9 5 9 1 9 6 0 年组织有关企业提供材料, 制备试件、投入试验。六十年代中期至七十年代试验中断。1 9 8 0 年后在全国范围内恢复和建立了 4 6 个大气、海水、土壤腐蚀试验站( 点) ,初步建成了“全国材料环境腐蚀试验网站”。 3 、海洋监测系统 由于海洋的特殊性,我国的海洋监测系统相对较弱,现存的监测系统主要包括海湾监测和浅 海监测两部分。海湾监测主要有大亚湾海洋生物综合试验站和胶州湾海洋生态系统定位研究站, 这两个研究站已加入中国生态系统研究网络( c e r n ) 。 浅海监测只有国家海洋局在沿岸进行一些环境监测,全国海洋环境监测网已经开始运行,监 测内容包括:潮汐、海浪、水温等海洋水文要素预报:风暴潮、巨浪、海冰及厄尔尼诺等海洋自 然灾害预报;海洋赤潮预测预警;全海域环境质量状况评价与变化趋势预测;入海河流等重要陆 源污染污染物排海量估算;海洋功能区环境质量状况评价:旅游季节海水浴场适宜度评价与短期 预测;海上溢油风险评价与损失评估等。另外,我国已加入国际a r g o 计划,成立了中国新一代 海洋实时监测系统( 灿o ) 大洋监测网,目前该项目尚需进一步运作。 4 、国家重点野外试验站( 试点站) 国家科技部于2 0 0 0 年开始,通过主管部门推选和专家评议,在全国现有台站中选择3 5 个基 础条件较好、研究力量强的野外试验站作为国家重点野外试验站。 表1 _ 1现有国家重点野外试验站( 试点站) 中国农业科学院硕士学位论文前言 序号 国家重点野外试验站( 试点站) 名称所属单位所在地区 6 中国农业科学院硕士学位论文 前言 与安全性的国家野外试验站信息共享系统技术解决方案,实现国家重点野外试验站监测数据的集 成与统一共享,为实现国家野外试验站信息共享奠定基础。 国家重点野外试验站 现状调研分析 一l 国家重点野外试验站 监测数据规范制定 太乡 国家重点野外试验站 网络信息共享系统设计 太乡 国家重点野外试验站 网络信息共享系统原型开发 图卜1 主要研究内容 本研究的主要内容包括; l 、国家重点野外试验站现状调研分析 2 、国家重点野外试验站监测数据规范制定 3 、国家重点野外试验站阿络信息共享系统设计 4 、国家重点野外试验站网络信息共享系统原型开发 中围农业科学院硕士学位论文系统调研与需求分析 第二章系统调研与需求分析 2 1国家重点野外试验站调研 为了更好的了解目前国家重点野外试验站信息共享的现状,掌握全面的用户需求,对2 5 个 国家重点野外试验站进行了调查。调查的主要内容是各野外试验站的基本情况、软硬件和网络以 及数据集现状,并了解各试验站的基础设施和发展状况。主要采用调查表、网上查询和电子邮件 交流的方式进行调查。 2 1 1 调查内容与方法 1 、调查内容 此次国家野外试验站调查主要涉及各试验站的基本状况、网络条件和数据管理三个方面的内 容。 2 、调查方法 设计了统一的国家重点野外试验站调查表通过邮件、电话和访谈等方式调查了2 5 个野外 试验站再进行综合统计分析。 2 1 2 基本情况 根据调查结果显示,2 5 个野外试验站分属于中科院( 1 3 ) 、农业部( 4 ) 、教育部( 2 ) 、林业 局( 3 ) 、气象局( 1 ) 、地震局( 1 ) 和海洋局( 1 ) 7 个国家机构( 如图2 1 所示) ,其中中科院系 统的试验站占了5 2 。站点分布在全国1 7 省及直辖市个范围内( 如图2 - 2 所示) 。多数试验站建 立的时间较长,其中8 0 年代以前建成有1 4 个( 如北京国家地球观测台建于1 9 3 0 年) ,8 0 年至 9 0 年有9 个,另外根据国家需要于2 0 0 0 年和2 0 0 1 年又分别成立了中国遥感卫星辐射校正场和珠 江海口渔业生态环境两个野外试验站( 如图2 3 所示) 。它们研究的领域涉及森林、渔业环境、湖 泊、热带生物、热带雨林、土壤肥料、水土保持、种植资源、农田系统和荒漠绿洲,还有卫星观 测、地震地磁、辐射校正、宇宙射线、亚南极地区和冰川等方面的内容。 海洋局_ 1 地震局一1 气象局1 教育部_ 2 林业局一3 农业部4 中科院皂! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 024681 01 21 4 圈2 12 5 个野外试验站隶属部门分布示意图 9 中国农业科学腕硕士学位论文系统调研与需求分析 7 3 i 7 8 i l1 , i i + f f i f【l 3 0 1234567891 01 l1 2 1 31 41 5 1 6 1 71 8 1 9 2 02 l2 22 32 42 5 图2 32 5 个野外试验站建立时间示意图 各试验站共有科研和管理人员6 9 4 名,科研占总人数的6 5 ( 实际参与科研工作的人员远远 高于这比例,如中国南极长城站其流动性较大,参与科研工作的人员每年都发生变化,还有各野 外试验站大多属于开放性试验站,客座研究人员的流动性也较大,而这些人员都没有统计在内) , 其中博士、硕士、大学本科和本科以下人员的比例大致为1 3 :l :2 4 :2 3 ( 如图2 - 4 所示) 。 5 0 0 4 0 0 3 0 0 2 0 0 1 0 0 0 科研人员管理人员博士硕士本科本科以下 围p 4 试验站人员结构分布图 2 1 3 试验站网络化与数据集情况 据反馈的调查表统计,各试验站网络的硬件与软件以及服务器和数据库操作系统条件参差不 齐,网络化现状差距较大。2 5 个台站一共记录了2 1 6 个数据集( 实际拥有的数据集应该远远大于 这个数目,如国家土壤肥力与肥料效益长期监测基地网下属的监测站就有9 个,上报的仅仅是监 测时间长、数据量较丰富的8 个数据集,其它台站也有类似的情况) 。这些数据集虽然包含的各 种信息十分广泛,但是在数据采集、存储、管理与共享等方面的能力和水平差别显著。 l 、试验站网络化现状 据调查表统计,2 5 个试验站中只有5 个没有建立局域网,其中1 2 个没有建立自己的主页, 然而各试验站在“十五”期间,7 6 的台站有改造和建立网络或进一步加强数据麸享的项目实施 计划( 图2 ,5 所示) 。 |耋|;i蕃|啪菖|哪蛳菖|;| 中周农业科学院硕士学位论文 异构数据库集成技术 r m i 等三大主流中间件技术平台和新一代分布式计算中间件平台w 曲s e i c e 。 3 2 1r p c r p c ,远程过程调用,通过在相互独立地址空间中正在运行的进程之间的过程调用来传送成 的同步的控制流和数据流。通常,我们将i 冲c 理解为应用程序对运行在远端计算机上的代码进 行调用。为实现该调用的请求,在相互协作的计算机之间,需要使用特定的协议支持来对信息数 据进行请求、打包、发送和接收。 r p c 通常具有如下特征: 特有的调用语义 参数和结果的类型检测。 全部参数的功能性。 优化响应时间而不是吞吐量。 透明性,特别是异常处理和通信失败的透明性。 一个典型的r p c 的结构如下图1 所示: ,、o p m “n n ( ) ,、 ( c l i e n ts t u b ) 。fs e r v e rs t u b1 + 一 堕匦蔓立巫堕立 (t r a n s d o r tp r o t o c a l1 、。、,。,。+ ,。,。,。,。 ( n e t w o r kl a v e r 1 、。+。,。,。 图3 1f p c 的结构 3 2 2c o r b a c o r b a ( c o m m o no b j e c tr 鹎u e s tb r o k e ra r c h i l e c h ) 是对象管理组织实现分布式计算节点 间互操作性的规范,其目标是定义一个架构,该架构允许不同种类的客户机朋务器对象在对象请 求代理( o b j e c tr e q u e s t b r o k e r ,o r b ) 的特定环境下进行对象级通信,无需考虑谁设计了分布式 应用程序的两个端点。它定义实现相互作用的接 x 中国农业科学院硕士学位论文 异构数据库集成技术 的基础,主要作用是负责客户、以及对象的接口间透明、可靠的通信。o m a 参考模型的另一部分 是对象框架( o b j e c t 矗a r r l e w 0 础s ) 。对象框架是面向特殊领域的,本身由应用、领域、设施和服务 对象组成的协作构件集。对象框架从概念上对分布式软件构件集成提供了支持。 o m g 在1 9 9 1 年推出c o r b a l 1 的0 r b 机制,1 9 9 3 年推出c o r b a l 2 规范,1 9 9 5 年推出 c o 砌l a 2o 规范。在c o r b a l 1 基础上,c 0 r b a 2 o 增加了o r b 的互操作、o r b 初始化服务, 并且扩充了接口库的功能。c o r b a 2 o 不仅为分布对象的跨语言、工具、平台和网络的通信提供 基本的消息机制,还提供了管理这些对象、描述这些对象的元数据环境。c o r b a 2 0 不仅可以为 一个进程中的对象的互相作用提供代理服务,还可以为跨操作系统或跨o r b 的对象的相互作用提 供代理服务。c o i m a 2 oo r b 是真正的对象总线。 对象请求代理0 r b 是对象总线,它是c o r b a 规范的核心,它定义对象在异构环境下透明的 发送请求和接受响应的基本机制,是建立对象之间客户朋务器关系的中间件。o r b 使得对象可以 透明的向其他对象发出请求或接受其他对象的响应,这些对象可以位于本地也可以位于网络中, o i m 拦截请求调用并负责找到可以实现请求的对象、传送参数、调用相应的方法并返回结果等。 除o i 国外,c o i 出a 还提供独立与编程语言的接口定义语言( i d l ) 来描述对象和操作。 o r b 的体系结构如图2 所示: 图3 2o 舳体系结构 采用c o r b a 的优点: 1 、c o 砌3 a 只是在高层提供接口,并不关心底层的实际实现,设计者在构建系统时可以不必 考虑与实现有关的很多细节,也能为用户提供统一的接口访问数据。这意味着基于c o r b a 的模 型有很大的灵活性和较少的复杂性。 2 、c o r b a 致力于实现异构环境下的分布式计算,所以设计者可以不必考虑诸如:不同的网 络连接、不同的通信协议和不同的操作系统等问题。因此采用c o 砌3 a 规范实现集成系统,不仅 可以解决分布利环境异构、减少复杂性,而且可以使集成系统更加开放和易于扩展。 1 9 中国农业科学院硕士学位论文 异构数据库集成技术 3 、c o b r a 是一个完整的、开放的、稳定的分布计算体系。o m g 的目的是以面对象技术为 核心,构建一绍完整的分布式软件开发标准。c o b r a 体系包含了从对象管理体系o m a 、接口定 义语言i d l 、对象请求代理o r b 、对象服务、对象建模等一系列全面的面向对象软件开发的体系 结构以及开发工具。 c o 瑚j a 的缺点:如果要开发c o 砌3 a 应用程序,其程序环境中的每个节点都需运行相同的 o r b 产品。现在也有来自不同厂商的c o r b a 应用程序能够相互操作,但是这种互操作性并不 能扩展到安全与事务管理那样更高级别的服务中,而且所有特定厂商产品的优化在这种情况下将 会丢失。 目前,国内外许多公司己经推出基于c o b r a 的成熟产品并得以广泛应用。例如:国外有1 0 n a 公司的o r b i x 、b o r l a n d 公司的v i s i b r o k e r 、d i 百t a l 公司的o b j e c t b r o k e r 等,国内有东南大学的o r b u s 、 国防科技大学的s t a r b u s 等。 3 2 3d c o m d c o m ( d i s h 伯u 把dc o r n p o n e mo b j e c tm o d e l ) 是微软提出的一种分布式组件对象模型,它是 c o m 在分布式计算方面的扩展。使c o m 跨越机器的边界,进一步应用于局域网、广域网,甚 至1 1 1 t e m e t 上。为了适应网络环境,d c o m 主要的任务是在c o m 的基础上,实现远程调用,并 采取一些策略,以适应和优化网络环境。d c o m 建立在标准的分布式计算环境( d c e ) 之上,拥 有d c e 提供的通用服务集,如远程过程调用( r e m o t ep r o c e d l l r ec a l l s ,r p c ) 、命名、线程管理 以及安全性等。d c o m 对d c er p c 进行面向对象的扩展,故又称对象r p c ( o r p c ) 。d c o m 是 使用d c er p c 进行进程间通信的,使得不同计算机上的应用程序可以通过使用各种各样的网络 传输协议相互通信。即可以使用命名管道、n e t b i o s 或是w h l s o c k e t 与远程系统通信。在使用d c o m 调用服务器方组件时,d c o m 会自动选择客户与服务器都拥有的通信协议中的最优协议来进行通 信。 图3 - 3d m 的体系结构 9 中国农业科学院硕士学位论文 异构数据库集成技术 d c o m 有以下技术特点: 语言无关性。因为d c o m 是c o m 的扩展,所以它延续了c o m 的这个特性。 可扩展性。d c o m 提供了许多能够增强应用程序的可扩展性,如对称的多进程处理、灵 活的配置、版本化功能的发展。 安全性。d c o m 使用了w 缸d o w s n t 提供的扩展的安全框架。 负载平衡。d c o m 为了使负载平衡而提供几种不同的技术:平行配置、分离关键构件和 连续进程的p i p e h n i n g 。 协议无关性。d c o m 提供了所有无连接和面向连接的协议的一个安全性框架。 容错性。d c 0 m 在协议级提供了对容错性的一般支持。 位置独立性。d c o m 使得组件的位置对你来说完全透明,无论它是位于客户的同一进 程中或是在地球的另一端。在任何情况下,客户连接组件和调用组件的方法的方式都是 一样的。 但是,d c o m 也有许多缺点:c o 】,d c o m 是w i n 小m s 平台0 l e 不断发展的产物,它缺少 完整的体系结构;d c o m 的服务当前只提供一种受限的命名服务、事务服务以及与n t 的安全性 集成;d c o m 的跨平台支持并非初始目标,其主要目标是用于w d 0 w s 平台,现已可运行于 若干 x 中国农业科学院硕士学位论文 异构数据库集成技术 对象实现了一个远程界面,在这个远程界面中声明了可以被其它对象从远程机器上调用的方法, 从而实现了客户程序跨网络的远程调用。 a p p i i c a t i o n r m is y s t e m ( e n t ) ( 嘶e n t ) ii s t u bs k e l e t o n s r e m o t er e f e r e n c el a y e r t r a n s p o r t 图3 4j a v a 刚i 体系结构 e j b j a v ar m i 的优点在于:复杂的商业逻辑以组件的形式部署在e j bs e r v e r 中。由于e j b s e n r e r 提供了多种组件事务服务,使系统更能够应付大量的并发用户和管理复杂的事务逻辑;e j b s e n r e r 中集成的组件命名服务可以使组件位置透明化,简化了组件的部署和客户端应用的维护; 开发过程易于分工,可以由专人负责编写组件,其他人组装页面。 3 2 5x m l x m l ( e x 咖s i b l em a r k u p 却a g e ,可扩展的标记语言) ,是一种w e b 应用的新技术。它和 h n 有些类似,都是通用标记语言标准( s t a n d a r d g e n e m l i z e d m 砌c u p l 釉g l l a g e 。以下简称s g m l ) 的子集,但使用的目的不同,所以两者有很大的区别。x m l 是一套定义带有语义标记的规则,它 继承了s g m l 的可扩展性,也就是说用户可以根据自己的需要来定义x m l 的标记,而这一点 h n 仉是做不到的,h t 中的标记是一组规定死的标记集合。另外x m l 是一种元标记语言, 可以用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言,由它可以产生出 许多种应用程序,如c m l ( c h e 蛐c a lm a r k u pl m g u a g e ,化学标记语言) 、m 蚰1 m l ( m a m e m a t i c a l m a r k u pl a n g u a g e ,数学标记语言) 、s m m ( s y n c h o l l i dm u l 血n e d i al m g l l a g e ,同步的多媒体集 成语言) 等等。h t m l 是s g m l 的一种应用,而x m l 是s g m l 的子集,从高度上来说x m l 处 于h t m l 的上一层。 x m l 文档包含三种主要构成成分:d t d ( d o c 砌e n t 聊e d e f m n i o n ,文档类型定义) 或讧l 模式( x m ls c h e m ) 、x s l ( e x t e n s i b l e s 哆1 e s l l e e t m g i l a g e ) 和x l i l l 】( ( e x t e n s i b l e l h l k i n g l 姐g u a g e , 可扩展链接语言) 。d t d 或x m l 大纲规定了x m l 文档的逻辑结构,定义了讧l 文档中的元素、 属性以及元素和元素属性之间的关系;x s l 是用于表达x m l 文档的呈现样式的语言,它使得数 据与其表现形式相互独立;而礼i 1 】l 【将进一步扩展目前w 如上已有的简单链接。 x m l 具有如下重要特性和优点: l 、x m l 易于设计,x m l 文档容易编写,设计严谨且简洁,可读性强。 2 、随着s o a p 的引入,x m l 可支持各种分布应用程序。 2 中国农业科学院顾士学位论文异构数据库集成技术 3 、x 具灵活性。x m l 提供了一种结构化的数据表示方式,使得用户界面与结构化数据相 分离。在x m l 中,可以使用样式表,如x s l 将数据呈现到浏览器中。另外,) m l 文档之间的超 链接功能由独立的x l i l l l ( 来支持。所有这些方面都可以相互独立地改进并同时发展。所以,c b 用户所追求的许多先进功能在x m l 环境下更容易实现。 4 、l 具自描述性。x 瑚l 文档通常包含一个文档类型声明,因而x m l 文档中的数据可以 被任何能够对x m l 数据进行解析的应用程序所提取、分析和处理,并以所需格式显示。x m l 表 示数据的方式真正做到了独立于应用系统,并且这些数据能被重用,所以) 。v f l 适台开放系统。 因为它的自描述性,文档里的数据可以由支持x m l 的应用来创建、查询和更新,与处理传统的 关系数据库和面向对象数据库里的数据相似。x m l 甚至还能用来表示那些以前不被看作文档但是 对传统的数据库来说又过于复杂而难以处理的数据。 5 、x m l 具可扩展性。正如j a 、,a 让使用者声明他们自己的类一样,x m l 让使用者创建和使 用他们自己的标记,而不是仅限于使用有限词汇表。可扩展性是至关重要的,因为不仅企业希望 用x m l 为电子商务和供应链集成等应用定义自己的标记语言,甚至各个行业也希望能够定义它 们所在行业的标记语言,咀作为行业的信息共享和数据交换的标准。 6 、x m l 的诞生也吸收了人们多年来在w 曲上使用h n 江l 的经验。) 口l 采用u n i c o d e 字符 编码系统,可以支持世界上几乎所有的主要语言,并且不同语言的文本可以在同文档中混合使 用。支持x m l 的软件能处理所有这些语言的任何组合。 所有这一切使x m l 成为数据表示的一个开放标准,这种数据表示独立于机器平台、提供商 和编程语言。它为信息技术和分布式应用带来新的机遇。 3 2 6s o a p 近年来,电子商务发展迅猛,尤其是b 2 b 的电子商务模型发展前景广阔,使用x m l 来描述 商务信息使得各种b 2 b 应用在数据层上获得了开放集成的能力。然而从技术的角度来看,这仅仅 完成了应用领域中最低层次的集成:数据层集成。在模块层,应用层仍然停留在一个不利于集成 的阶段。s o a p 规范正是使模块层能够以一种开放、自描述、统一的方式进行集成和交互。另一 方面,s o a p 的出现与w 曲s e r v i c e 的发展紧密相关;w 曲s e r “c e 是封装成单个实体并发布到网 络上以供其它程序使用的功能集合。它是用于创建开放分布式系统的构件。在w 曲s e i x 中国农业科学院硕士学位论文异构数据库集成技术 3 2 7w e bs e n c e 从表面上看,w 曲s e i c e 就是一个应用程鲥;蒲攀馑壤曩便妻一颦专童蔫塌 滢旧塔羹 差自i ;蛩誊 。藿喟。m 吲;i s 目自i 照舀“扣鼬茹酱哥鬟黔莹出量巴靶”鲢蛭鬟苫。蓖编鞲蓦薹i i j | 妻| 慨商; 薰 姜醵娃k 薹埠鼍寝。驰鄯蠡f i 萋希苹丢曼辇鬟辇虞。嚣鬟孽姜理慢馐j 型万式屏蔽甄赫箍 菇编并 不是直接在试验站数据节点上进行查询操作,而是在数据集成 发布平台上进行操作由数据集成发布平台来生成查询请求,将查询请求发送给试验站数据节点, 查询请求经处理后,再将查询结果返回给集成发布平台。经处理后呈现给用户。对于用户而言, 就好比是在一个虚拟的数据库上进行操作,而不绾问迪值摹 x r f l 国农业科学院硕士学位论文异构数据库集成技术 w s f l 图3 6 bs e r v i c e 协议栈 n e t w o r k 层是服务传输层,在图中可以看到w 曲服务可以使用多种( o s i 应用层) 网络 协议进行消息传递,唧是使用最为广泛的,因为h t r p 的请求应答模式十分符合r p c 类型调用,s m t p 主要用于异步方式的调用,例如订阅信息等等。 x m l _ b e d m e s s a 西n g 消息层,消息以) 砸l 文档的形式传送,并在一般情况下以s o a p 形式封装。 s e r v i c ed e s c r i 口n o n 在w s d l 中只有对服务的一些功能性描述,如绑定信息、方法签名等 等。为了更好的描述服务,u d d i 中还保存了服务的一些功能性描述,例如服务提供者 信息、商业描述、服务分类等。客户程序在绑定至服务时,不但需要一般的接口信息, 也需要得到每个服务具体的位置、安全性等其他信息。这些信息在w s d l 中被定义,在 绑定服务时往往被用来生成客户端的服务代理对象。和c o r b a 等其他分布式组件架构 一样,接口定义是由某种m l 语言完成的。在w 曲s e r v i c e 中,使用w s d l 来定义接口。 s e n r i c ed u b l i c a t i o n 服务发布层,服务通过u d d i 进行注册并发布。 s e r v i c ed i s c o v e r y 服务发现层,用户通过u d d i 获取已发布的服务的信息。 s e r v i c en o w s 服务流层,多个服务可以合成服务流,或是被包装成更高级的商业过程。 w 曲s e i c e 的运行机制基于三种角色( 服务提供者、服务注册中心和服务请求者) 之间的交 互。交互涉及发布、查找和绑定操作。这些角色和操作一起作用于w 曲s e r v i c e 构件:w e bs e r v i c e 软件模块及其描述。下图表示了这些操作、提供这些操作的组件及它们之间的交互。 2 5 中竭农业利学院坝士学位论文 异构数据库集成技术 图3 7 w e bs e r v i c e 的运行模式 w e bs e r v j c e 的运行模式中的角色 s e i c ep r o v i d e r 服务提供者。从企业的角度看,这是服务的所有者。从体系结构的角度 看这是托管访问服务的平台。 s e i c e r e q u e s t o r 服务请求者。从企业的角度看,这是要求满足特定功能的企业。从体系 结构的角度看,这是寻找并调用服务,或启动与服务的交互的应用程序。服务请求者角 色可以由浏览器来担当,由人或无用户界面的程序( 例如,另外一个w 曲服务) 来控 制它。 s e n r i c er e 西s 仃y 服务注册中心。这是可搜索的服务描述注册中心,服务提供者在此发布 他们的服务描述。在静态绑定开发或动态绑定执行期间,服务请求者查找服务并获得服 务的绑定信息( 在服务描述中) 。对于静态绑定的服务请求者,服务注册中心是体系结构 中的可选角色,因为服务提供者可以把描述直接发送给服务请求者。同样,服务请求者 可以从服务注册中心以外的其它来源得到服务描述,例如本地文件、f r p 站点、w 曲站 点、广告雨l 服务发现( a d v e n i s e m 8 n ta 1 1 dd i s c o v e r yo f s e r v i c e s ,a d s ) 或发现w 曲服务 ( d i s c o v e r yo f w c bs e n ,i c e ,d i s c o ) 。 w 曲s e r v i c e 的运行模式中的操作 对丁利_ l ;1w e bs e w i c e 的应用程序,必须发生以下三个行为:发布服务描述、查询或查找服 务描述以及根据服务描述绑定或调用服务。这些行为可以单次或反复出现。这些操作具体为: p u b l i s h 发布。为了使服务可访问,需要发布服务描述以使服务请求者可以查找它。发布 中国农业科学院硕士学位论文异构数据库集成技术 服务描述的位置可以根据应用程序的要求而变化。 f i f l d 查找。在查找操作中,服务请求者直接检索服务描述或在服务注册中心中查询所要 求的服务类型。对于服务请求者,可能会在两个不同的生命周期阶段中牵涉到查找操作: 在设计时为了程序开发而检索服务的接口描述,而在运行时为了调用而检索服务的绑定 和位置描述。 b i n d 绑定。晟后需要调用服务。在绑定操作中,服务请求者使用服务描述中的绑定细节 来定位、联系和调用服务,从而在运行时调用或启动与服务的交互。 w 曲服务的构件 s e i c e 服务。在这里,w 曲服务是一个由服务描述来描述的接口,服务描述的实现就是 该服务。服务是一个软件模块,它部署在由服务提供者提供的可以通过网络访问的平台 上。服务存在就是要被服务请求者调用或者同服务请求者交互。当服务的实现中利用到 其它的w 曲服务时,它也可以作为请求者。 s e r v i c ed i s c r i p t i o n 服务描述。服务描述包含服务的接口和实现的细节。其中包括服务的 数据类型、操作、绑定信息和网络位置。还可能包括可以方便服务请求者发现和利用的 分类及其它元数据。服务描述可以被发布给服务请求者或服务注册中心。 w 曲s e i c e 的运行过程具体如下:首先,在服务器端,服务提供者提供一个w 曲s e i c e , 并使用w s d l 语言描述其接口。然后在服务注册中心中对该服务进行注册并发布服务描述。 然后,服务请求者直接检索服务描述或在服务注册中心中查询所要求的服务类型,并在服务描 述中获得服务的接口描述,服务的绑定和位置描述。服务的接口描述在客户端应用程序开发时使 用。在客户端应用程序运行时,服务请求者使用服务描述中的服务的绑定和位置描述信息来定位、 联系和调用服务,从而在运行时调用或启动与服务的交互。 在请求远端服务,与服务的交互的过程中,服务请求者根据绑定和位置描述信息将请求数据 传送给在客户端的请求者代理( r e q u e s t e r a g e n t ) ,由请求者代理将请求数据序列化为咀。格式, 通过s 0 a p 发送给服务器端。服务器端的提供者代理( p r o v i d e ra g e m ) 将订l 格式的数据反序 列化为服务器端的数据格式。 最后,当w 曲s e r v i c e 对数据的处理完成后,结果按照请求的传递路径逆向返回给服务请求 者。 w e bs e i c e 建立于传统w 曲编程模型的松散藕合特性之上。w 曲s e i c e 和传统的w c b 运用 有三个主要区别: 1 、w 曲s e r v i c e 采用s o a p 消息进行通信。s o a p 使用x m l 从一个程序向另一个程序传递数 据,从m i m e 消息到s o a p 消息的转变是传统的基于浏览器的w 曲客户端与w 曲s e r v i c e 客户端 的关键不同之处。 2 、w 曲s e r v i c e 并不指定传输协议。s o a p 规范定义了在h r r p 协议上的实现,但你可以选择 s m t p 、t c p 、或者任何其他的你熟知的传输协议。 3 、w c bs e r v i c e 是自描述的,它提供了信息产生和使用时的元数据描述。这种信息交换模式 表达了w 曲s e i c e 具有的行为、使用的物理传输协议和逻辑访问地址。w 曲s e r v i c e 使用x m l s c h e m a 来定义其消息格式,描述的消息范围更广。比起传统r p c ,d c o m 和c o r b a 等分布式编 中国农业科学院硕士学位论文 异构数据库集成技术 程模型,w e bs e i c e 具有更为松散的关联性。其他任何用于构筑分布式应用的方法都不及w 曲 s e r v i c e 更为快速和广泛被采用。 3 3 国内外研究现状 目前,国山外已经有开发出的数据库集成查询系统,w a s h i n 酎o n 大学研制的t u k w i l a 数据集 成系统是为了实现i i l t e m e 恤h e t 环境中异构数据库联合查询的功能。它由五部分构成:用户接 口、查询再处理部件、支持信息库、优化规划部件、执行引擎和信息包装器构成。系统向用户提 供一个中间视图,其中包括各种特殊领域以及该领域内的不同数据源,用户的查询是基于中间视 图的,数据集成系统对查询重新处理。将其转换为在不同数据源上执行的若干个子查询,并将结 果采用“流”的方式返还给用户。t u k w i l a 系统把x m l 文档作为集成中使用的数据格式,核心采 用两叉计划执行方案以提高其适应能力,交叉计划和局部优化执行能够使它很快从错误估计目标 中恢复,增强了对动态环境的适应性。由华中科技大学计算机科学与技术学院研制的基于 c o r b a m l 的多数据库原型系统p a n o r a i i l a 不仅可以有效集成各种分布、异构和自治的数据管 理系统,还可以集成w e b 上的一些文件系统,除了支持常用的查询操作,对修改、基本的事务处 理也有一定的支持。 西北工业大学现代设计与集成制造教育重点实验室开发了基于语义与模型的企业异构数据源 集成中间件系统,它用来解决企业异构数据源集成问题,能有效的指导企业进行数据源集成工作, 并提供了检索和导航功能,为企业决策提供服务。系统实现了一种同时支持自底向上和自顶向下 集成方式的企业异构数据源集成方法。它通过提供异构数据源到全局x m l 模式的转化、相关数 据的语义匹配与发现、基于概念树的语义建模等功能辅助用户完成基于语义与模型的集成过程。 它通过静态的x m l s c h e m a 到关系模式映射、动态的x q u e r y 到s q l 的转换和x m l 与r d b 的同 步修改,建立起半结构化数据的双向管理机制,从而将m ,描述的半结构化数据纳入到了基于 语义与模型的集成范围中。在集成的基础上,它通过结合p r o 皓西知识模型和描述逻辑提供了异构 数据基于语义的导航、检索。该成果的应用,可以实现企业数据完整、一致、无语义冲突的有效 访问。此系统是为企业提供集成方案的,并不适合于w e b 上的异构数据源的集成。 中国农业科学院硕士学位论文 数据规范的制定 第四章数据规范的制定 监测数据规范的制定是国家重点野外试验站观测网络建设中的重要环节,是信息标准化的必 要步骤,是进行信息共享系统建设的基础,是实现信息共享的前提。建立国家重点野外试验站监 测数据规范,为各领域野外试验站监测数据的标准化及观测数据库的建设提供了标准依据,为实 现国家重点野外试验站信息共享奠定基础。 4 1 主要工作内容 根据国家重点野外试验站建设的总体目标,研究制定国家重点野外试验站数据分级分类与编 码标准和监测数据标准,以整合国家重点野外试验站数据,规范国家重点野外试验站监测数据采 集、整理、存储和加工,实现国家重点野外试验站数据的充分共享和可持续利用。 监测数据分级分类与编码标准对所有国家重点野外试验站的数据资源进行全局范围的科学 分级分类,并对不同层次、不同类别的资源赋予唯一的编码,适用于国家重点野外试验站建设中 监测规范、数据标准和数据质量控制规范等的制定、以及数据库和信息共享网络系统的建立。 国家重点野外试验站监测数据标准通过建立监测数据字典标准,再用该标准制定各领域的监 测数据字典( 数据标准) ,适用于国家重点野外试验站监测数据的采集、整理、存储和加工,数 据库的建立,以及信息共享网络系统的建立。 4 2 数据分级分类与编码标准制定原则和方法 4 2 1 分级分类与编码原则 在进行国家重点野外试验站数据分级分类与编码时,遵循下列原则; 1 、科学性 以适合现代计算机、数据库和网络技术的应用和管理为目标,按国家重点野外试验站数据的 属性或特征进行严密的科学分级分类,形成系统的分级分类体系。 2 、系统性 分级分类与编码体系在内容和层次上要充分体现系统性,即做到层次分明合理、反映出纵向 和横向顺序排列的层次结构。国家重点野外试验站数据的编码要统一规则、统筹安排,不能各行 其是,随意更动。 3 、一致性 一致性指任何专业名词、术语的定义必须严格保持概念的一致,对同一专业名词、术语必须 是唯一的,且不能重复。 4 、完整性 完整性是指分级分类体系在总体上应具有概括性和包容性,尽可能容纳国家重点野外试验站 现有和将来可能产生的数据和信息,具有完整性。 5 、扩展性 2 9 与监测规范相一致 注重实用性和可操作性 4 3 2 监测数据标准制定方法 依据国家重点野外试验站监测规范及分级分类与编码标准,制定国家重点野外试验站数据字 典标准,建立了国家重点野外试验站监测数据字典,即监测数据标准。 通过研究国家重点野外试验监测规范对数据采集的具体要求,分析数据采集结果的形式,按 照计算机信息处理的基本要求,对监测数据予以规范化和标准化,要求监测数据在数据库中存储 时按照此标准进行,实现监测数据库的标准化和统一化,保证了数据的可比性和可交换性。 国家重点野外试验站数据字典标准包括了数据编码、数据名称、英文名称、数据说明、数据 类型、数据长度、小数位数、数据单位、监测频度、监测方法、代码、精确度、备注、例子等1 4 项,再对每个监测指标项进行规范化的描述,形成数据字典。 数据编码与国家重点野外试验站数据分级分类与编码标准中的编码致。 数据类型分字符型( c ) 、数值型( n ) 和日期型( d ) 。 完成的监测数据标准示例如图5 3 。 最后完成的国家重点野外试验站监测数据标准包括了 国家重点野外试验站草地监测数据标准 国家重点野外试验站湿地监测数据标准 国家重点野外试验站荒漠监测数据标准 国家重点野外试验站湖泊监测数据标准 国家重点野外试验站海湾监测数据标准 国家重点野外试验站地磁监测数据标准 国家重点野外试验站森林监测数据标准 4 4 监测数据库原型 为了充分验证制定的数据标准的可行性,依据国家重点野外试验站监测数据分级分类和编码 标准,以及监测数据标准设计开发了国家重点野外试验站监测数据库原型,提供给国家重点野外 试验站各试点站进行实际试用,用来存储按照国家重点野外试验站监测规范所采集的数据。 试验站所监测数据的监测频度是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论