




已阅读5页,还剩65页未读, 继续免费阅读
(计算机软件与理论专业论文)协同设计平台中基于元数据模型的数据处理与交换研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着国际化分工和合作的深入发展,建筑设计并不是仅仅局限于某个设计室 或某个设计院小团队,而是一项跨区域、跨国家的多学科协作。这种多学科的合 作并不是一个单纯的序贯过程,而是存在不同学科之间的反复修改和协同,以获 得满足用户需求的最优设计方案。但由于地域、应用软件的差异,在协作中人与 人之间以及软件系统之间,往往受到彼此的不同背景、语言、协议和技术的制约, 各个子系统的信息语义的异构显得尤为突出,以上因素使得每个单位、组织和部 门的数据源和软件的集成构成为迫切的技术需求,要求为建筑设计用户提供一个 统一、方便的系统环境,为建筑设计的管理和决策提供及时可靠的服务,同时为 大规模的异构、分布建筑设计数据的共享和利用提供基础。 为此,本论文的思路就是针对建筑设计的行业特点,对基于元数据的建筑设 计数据的处理与交换进行了研究,提出解决异构应用系统间透明数据处理与交换 的方法,并且在建立元数据模型的基础上,在协同设计平台中设计实现了文档处 理与交换引擎原型。 本论文的成果和创新点在于: 进行了建筑设计领域内的元数据模型的建模工作。通过建立适当的机制,来 建立数据概念模型,描述数据的特性、同义表示以及相互之间的层次和关系,实 现应用系统数据格式的定义和描述,将应用系统的数据格式和不同应用系统数据 格式的转换规则以元数据的形式存储起来,实现不同系统之间的语义通讯、集成 和转换。该部分构造元数据模型是建筑设计数据处理与交换的核心,为全局的共 享提供语义基础。 根据建立的元数据模型和转换规则,设计并且实现文档数据处理与交换引擎, 将源数据格式经过处理,转换成目标数据格式。转换后的结果,根据应用要求再 传输到目标系统,实现了文档数据提取、文档数据重组和文档格式转换三大功能, 达到了建筑方案协同设计中,数据的统一描述、交换和共享的目的。 关键词:元数据:c s c w :r d f ( s ) ;数据交换;数据共享 华南理工大学硕士学位论文 a b s t r a c t w i t ht h ee x t e n s i v ed e v e l o p m e n to fi n t e r n a t i o n a l i z e dw o r kd i v i s i o na n d c o o p e r a t i o n ,a r c h i t e c t u r ed e s i g n sb e c o m eam u t l i s u b j e c tc o l l a b o r a t i o n a c r o s sr e g i o n sa n dc o u n t r i e si n s t e a do fc o l l a b o r a t i o nw i t h i nad e s i g nr o o m o rd e p a r t m e n t s u c hc o o p e r a t i o ni sn o tas i m p l es e q u e n c e b u tr e p e a t e d m o d i f i c a t i o n sa n dc o l l a b o r a t i o na m o n gm a n ys u b j e c t si no r d e rt 0a c h i e v e t h eo p t i m i z e dd e s i g nr e s u l t st h a tm e e tu s e r s r e q u i r e m e n t s h o w e v e r ,d u e t ot h ed i v e r s i t yo fp l a c e sa n da p p l i c a t i o ns o f t w a r e ,p e o p l ea n ds o f t w a r e s y s t e m sc o o p e r a t i n gw i t he a c ho t h e ra r eo f t e nr e s t r i c t e db yd i f f e r e n t b a c k g r o u n d s ,l a n g u a g e s ,p r o t o c o l s a n dt e c h n o l o g i e s ,w h i c hm a k et h e h e t e r o g e n e o u si n f o r m a t i o ns e m a n t i cp r o b l e m sv e r yo b v i o u s a 1 1t h e s e f a c t o r sc o n t r i b u t et ot h ed e m a n d i n gt e c h n o l o g y r e q u i r e m e n t s f o rt h e i n t e g r a t i o no fd a t as o u r c e sa n ds o f t w a r ei nv a r i o u su n i t s ,o r g a n i z a t i o n s a n dd e p a r t m e n t s ,w h i c hr e q u i r ep r o v i d i n gau n i f o r ma n dc o n v e n i e n ts y s t e m e n v i r o n m e n tf o ra r c h i t e c t u r ed e s i g nu s e r s ,a n dt i m e l ya n dd e p e n d a b l e s e r v i c e sf o rm a n a g e m e n ta n dd e c i s i o n m a k i n g ,a sw e l la sf o u n d a t i o r sf o r t h es h a r i n ga n du n t i l i z a t i o no fl a r g e s c a l eh e t e r o g e n e o u sa n dd i s t r i b u t e d d e s i g nd a t a a sar e s u l t ,t h i sp a p e rm a i n l ym a k e ss o m er e s e a r c h e so nt h et r e a t m e n t a n de x c h a n g eo fa r c h i t e c t u r ed e s i g nd a t ab a s e do nm e t a m o d e la c c o r d i n gt o t h ei n d u s t r i a lc h a r a c t e r i s t i co fa r c h i t e c t u r ed e s i g n ,a n dp r o p o s es o m e r e s o l u ti o n sa b o u th o wt ot a c k l et h ed a t at r e a t m e n ta n de x c h a n g ea m o n g h e t e r o g e n e o u sa p p l i c a t i o ns y s t e m st r a n s p a r e n t l y o nt h eb a s i so f m e t a m o d e l ,w ed e v e l o pt h ed o c u m e n tt r e a t m e n ta n de x c h a n g ee n g i n e p r o t o t y p ei nc o l i a b o r a t i o nd e s i g np l a t f o r m t h em a j o ri n n o v a t i o n sa n dc o n t r i b u t i o n so ft h i sp a p e ri n c l u d e s : d os o m em o d e l i n gw o r ki nt h ef i e l do fm e t a m o d e lw i t h i na r c h i t e c t u r e d e s i g ni n d u s t r y b ye s t a b l i s h i n gp r o p e rm e c h a n i s m st ob u i l dd a t ac o n c e p t m o d e l ,d e s c r i b ed a t ac h a r a c t e r i s t i c s ,s y n o n y m yr e p r e s e n t a t i o na n dm u t u a l h i e r a r c h ya n dr e f a t i o n s h i p ,w ec a nd e f i n e a n dd e p i c td a t af o r m a t so f h b s t r a c t a p p l i c a t i o ns y s t e m s ,a n ds t o r et h e ma n dt r a n s i t i o nr u l e s o fd i f f e r e n t a p p l i c a t i o nd a t af o r m a t si nt h ef o r mo fm e t a d a t a ,a sw e l la ss u p p o r tt h e s e m a n t i cc o m m u n i c a t i o n ,i n t e g r a t i o n a n dt r a n s i t i o n a m o n gd i f f e r e n t a p p l i c a t i o ns y s t e m s t h ed e s i g n o fm e t a d a t am o d e li st h ec o r eo f a r c h it e c t u r ed e s i g nd a t at r e a t m e n ta n de x c h a n g e b a s e do nt h ee s t a b l i s h e dm e t a - d a t am o d e la n dt r a n s i t i o nr u l e s ,w e d e s i g na n di m p l e m e n td o c u m e n tt r e a t m e n ta n de x c h a n g ee n g i n et od e a lw i t h s o u r c ed a t aa n dc o n v e r tt h e mi n t ot a r g e td a t af o r m a t s t h er e s u l t sw i l l b et r a n s f e r r e dt ot a r g e ts y s t e m sa c c o r d i n gt ot h ea p p l i c a t i o nr e q u i r e m e n t s w h i c hc a ni m p l e m e n tt h ef u n c t i o n so fd a t ae x t r a c t i o n ,d a t ar e o r g a n i z a t i o n a n df o r m a t t r a n s i t i o n ,a n dp r o v i d e f o u n d a t i o n sf o rt h es h a r ea n d u t i l i z a t i o no fl a r g e s c a l eh e t e r o g e n e o u sa n dd is t r i b u t e dd e s i g nd a t ai n a r c h i t e c t u r ed e s i g np l a t f o r m sa n da c h i e v et h eo b j e c t i v eo fu n i f o r md a t a d e s c r i p t i o n ,e x c h a n g ea n ds h a r i n gi nc o l l a b o r a t i o nd e i s g np l a t f o r m k e yw o r d s :m e t a d a t a :c s c w : r d f ( s ) ;d a t ae x c h a n g e :d a t as h a r i n g 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其 他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果 由本人承担。 作者签名:余珊珊日期:2 0 0 f 年6 月i 曰 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权华南理工大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本 学位论文。 保密曰,在l 年解密后适用本授权书。 本学位论文属于 不保密口。 ( 请在以上相应方框内打“”) 作者签名:会硼册 导师签 日期:2 f 年6 月f 日 日期:彩咆= 年6 月日 第一章绪论 1 1 课题的背景与意义 第一章绪论 随着国际化分工和合作的深入发展,建筑设计并不是仅仅局限于某个设计室 或某个设计院小团队,而是一项跨区域、跨国家的多学科协作。从了解用户需求 开始,建筑师给出初步的建筑方案随后结构工程师完成结构设计方案,接着设 备工程师开始水暖电等系统的设计,最后所有的方案还需要概预算人员进行成 本分析和控制等等。这种多学科的合作并不是一个单纯的序贯过程,而是存在不 同学科之间的反复修改和协同,以获得满足用户需求的最优设计方案。 但是由于地域的差异,在协作中人与人之间以及软件系统之间,往往受到彼 此的不同背景、语言、协议和技术的制约,各个子系统的信息语义的异构显得尤 为突出,以上因素使得每个单位、组织和部门的数据源和软件的集成构成为迫切 的技术需求,要求为建筑设计用户提供一个统一、方便的系统环境,为建筑设计 的管理和决策提供及时可靠的服务。 为此,本文的思路就是对基于元数据模型的建筑设计数据的处理与交换作一 些研究,提出解决异构应用系统间透明数据处理与交换的方法,在多种应用系统 构成的w e b 应用集合中,实现信息的透明处理与交换,解决分布式数据交换或互 操作问题。 具体是,在系统间数据传递与互操作的基础上,建立元数据模型来描述异构 建筑设计系统之间数据的关系和转换方法。因为只要适当地定义统一的元数据模 型。一种系统的数据就能够方便、准确地转换为目标系统的数据,当存在多个异 构的目标系统时,可以将源数据转换成多种不同的目标数据,以实现大规模的异 构、分布建筑设计数据的共享和利用。 1 2 国内外研究现状分析 1 2 1 计算机支持的建筑设计的发展现状分析 上世纪8 0 年代后期,国际上开始出现集成化的建筑方案设计平台的研究。这 类集成设计的共同特点是将各种有关的分析模拟软件集成在一个环境下,建立统 华南理工大学硕士学位论文 一的数据库,各个软件通过与统一数据库传输数据,从而达到交换数据的目的。 基于这种集成化建模思想开发的软件平台有欧共体的c o m b i n e ( c o m p u t e rm o d e l s f o rt h eb u i l d i n gi n d u s t r yi ne u r o p e ) ,其基本思想就是充分利用已有的建筑 模拟软件( d t s ) ,建立中心数据库( i d m ) ,各个软件通过与中心数据库通讯来相 互传递消息,另附有一个部件数据库( c d b ) 。瑞士的c l i c ki n f o r m a t i o n 公司和 p a u ls c h e r r e ri n s t i t u t e 联合开发集成的暖通空调( h v a c ) 系统考虑了整个建 筑与设施,并作为一个集成的模型,在完成了大量的样品应用试验之后,将基本 程序与一些典型化的应用组合起来形成一个“功能模型”,能够对有限的典型h v a c 工程中的一些例程进行处理。它的内部基本结构包括以下几个软件工具:用户界 面语言、参数绘图语言、层次定义语言和数据定义语言。该功能模型已初步体现 了数据描述和交换的基本机制。 随着并行工程思想和计算机协同设计方法不断向其它专业的渗透,建筑方案 的并行设计也得到了蓬勃发展。e v b u o m w a n 提出基于并行工程的围护结构设计与 修建的框架结构,但没有指明并行设计各阶段之间协作的实现方法。并行设计协 作的关键就是信息共享的实现,r i v a r d 提出实体分解模型( d o m a i ne n t i t i e s a n a l y s i s ) 来实现建筑、设备与修建三阶段( a e c ) 的协作。k a l a y 提出基于三 层结构的集成模型来实现数据共享,包括面向对象数据库、面向工程数据库和访 问数据库的操作运算,但局限于单机不同计算软件之间的数据交换,没有涉及到 适合网络传输和浏览的数据模型,因此不支持异地协同设计。t u n g 利用智能主体 ( a g e n t ) 自主性、交互性、反应性和主动性四个特征提出围护结构分布式设计的 框架,但仍然没有将数据表达模型、数据交换模型以及协作设计模式扩展到网络 环境,故而分布式设计的框架没有得到底层的数据库支持。 1 9 8 4 年,m i t 的i r e n g r i e f 和d e c 的p a u l c a s h m a n 正式提出了计算机支持的 协同工作( c o m p u t e rs u p p o r t e dc o o p e r a t i v ew o r k ,c s c w ) 的概念。c s c w 技术的 实质和目的是:利用计算机技术、多媒体技术和通信技术建立一个协同工作的环 境,在此环境中人们可以相互合作,共同工作于一个产品,一个研究领域或一个 项目,或求解一个学术上的难题。 由于建筑方案设计过程具有群体性、交互性、分布性和协作性等特点,非常 适合应用计算机支持的协同工作( c o m p u t e rs u p p o r t e dc o o p e r a t i v ew o r k ,c s c w ) 技术。c s c w 应用的关键是协作过程的体系结构、任务冲突与用户协调、协作支持 工具和协作过程中的信息共享技术。目前人们普遍认同三层次的协同设计体系结 2 第一章绪论 构:基本功能分布层、c s c w 支持层以及用户协作层,通过异步和同步的设计方式 完成协作。协同工作中多用户的协调和任务调度是工作流( w o r kf l o w ) 技术的核 心,利用工作流技术完成建模、分析和控制等一系列工作,引导整个设计过程协 调、高效、有序地向前推进。对于协作设计支持工具,最常见的是利用应用共享 机制对单用户应用程序进行共享,截取单用户系统输入输出界面,严格地按照 “w y s i w i s ”方式提供显示级的界面共享,但仅支持发言权协作模式,协作性能差; 此外也有专用协作支持工具。例如a u t o d e s k 公司为适应w w w 的快速发展所推出的 d w f 数据格式及其配套的浏览工具w h i p ,仅能在w e b 浏览器上进行单向的c a d 图 形发布、浏览和打印,不能有效地支持实时交互协同图形设计。 近年来,基于网络的客户端一服务器结构( c s ) 和浏览器一服务器结构( b s ) 为分布式建筑方案设计提供了良好的平台。在c s 和b s 结构的基础上,建立基 于x m l 文档的数据交换机制以描述二维图片、三维模型和相关的工程文档,通过 引入工作流管理技术来协调设计中的冲突,同时配合虚拟现实技术( v r m l 、x g l 和 x 3 d ) 形象展示多方协同设计结果。 1 2 2 基于本体的协同工作的应用研究 本体论( o n t o l o g y ) 原是哲学的一个研究分支,研究客观事务存在的本质。 它与认识论( e p is t e m o l o g y ) 相对,认识论研究人类知识的本质和来源。也就是 说,本体论研究客观存在,认识论研究主观认识。而本体论的含义是形成现象的 根本实体。本体是一种对“存在”的系统化解释,用于描述事物的本质。本体的 概念和方法被i t 领域采用,用于知识表示,知识共享和重用。直观地讲,本体是 对某领域应用本体的方法分析、建模的结果,即把现实世界中的某个领域抽象为 一组概念及概念之间的关系,本体的本质是概念模型。 本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,己 在信息系统的许多领域得到广泛的应用,如知识工程,数字图书馆、软件复用、 信息检索和w e b 上异构信息的处理、语义w e b 、协同设计等。 根据目前搜集到的材料,本体在计算机支持的协同工作方面的应用研究比较 广泛,主要是: 1 、企业制造领域: 企业资源本体论、成本本体论、质量本体论、调度控制本体论、支持工作流 协作的企业供应链本体模型、网络协同制造本体论( 如行业型企业联盟基础上的 华南理工大学硕士学位论文 网络协同制造一一液压行业制造本体论) 等; 2 、工业设计领域: 异构企业信息系统的协作和信息互操作研究:基于实体的网络c a d 协同工作 系统等; 3 、计算机教学领域: 基于本体的计算机支持的协同学习环境:基于领域本体的跨学科智能教学系 统;论文管理系统;e l e a r i n g 的知识共享与应用等: 4 、其他领域: 通用数据的交换技术等。 根据目前的资料,在建筑设计领域,计算机支持的协同工作主要集中在计算 机支持的c a d 建筑协同设计方面,着重于提高c a d 集成软件的集成度,并且开发 支持协同工作的应用设计平台,而在解决各个子系统的信息语义异构的问题上尚 缺乏行之有效的方法和具体实践。 因此本论文将针对建筑设计的行业特点,把本体的概念引入到建筑领域,对 建筑设计数据的处理与交换提出建筑设计的元数据模型,并且根据建立的元数据 模型和转换规则,设计并且实现文档处理与交换引擎,为建筑设计平台中的大规 模的异构、分布建筑设计数据的共享和利用作了一些理论研究和实践验证。 1 3 课题的来源及主要研究内容 1 。3 1 课题的来源 本课题来源于国家9 7 3 项目【基于建筑物复合能量的协同设计开发平台】。作 为该项目中的一个分支内容,我重点对基于元数据模型的建筑设计数据处理与交 换做了相应的研究。 1 3 2 课题的主要研究内容 本论文对基于元数据模型的建筑设计数据的处理与交换进行了研究,主要是 以下两个方面的内容: 1 、建筑设计领域内的元数据模型的建模工作: 基于建筑物复合能量的协同设计开发平台所接入的应用系统的建筑设计数据 之间有着密切的联系,但同时在格式和表示方面存在多样性。因此需要通过适当 4 第一章绪论 的机制,来建立数据概念模型,描述数据的特性、同义表示以及相互之间的层次 和关系。本体是概念化的明确表示和描述,能够使某一领域的概念有共同理解, 提高交流和协作的效率以及不同系统的互操作性。 因此,本论文的一项重要的研究工作就是:实现应用系统数据格式的定义和 描述,将应用系统的数据格式和不同应用系统数据格式的转换规则以元数据的形 式存储起来。该部分构造的元数据模型是建筑设计数据处理与交换的核心。 2 、文档数据处理与转换引擎的设计与实现: 实现源数据向目标数据的转换功能。根据建立的元数据模型和转换规则,将 源数据格式经过处理,转换成目标数据格式。转换后的结果,根据应用要求再传 输到目标系统。实现了协同设计平台中数据的统一描述、交换和共享的目的。 该部分实现的文档数据处理与交换引擎是基于协同建筑设计的元数据模型的 具体实践,是基于建筑物复合能量协同设计平台中重要的组成部分。 1 4 论文的结构安排 第一章,绪论。 介绍课题的背景与意义,计算机支持的建筑设计的发展状况,基于本体的协 同工作的应用研究,说明了课题来源和研究内容,提出了论文的主要研究内容和 结构安排。 第二章,关键技术与理论。 第三章,元数据模型的设计。 尝试利用元数据模型来建立基于r d f ( s ) 的建筑设计元数据模型,从而为实现 不同建筑系统之间的语义通讯、集成和转换等提供了一个全局的语义基础; 第四章,协同开发平台的系统设计。 介绍了系统的开发背景和环境、系统架构、部署、主要流程与主要模块。 第五章,文档数据处理与转换引擎的设计与实现。 介绍了其主要功能和采用的主要技术,定义数据格式和实现方式,以及具体 的接口描述、主要方法和结构,最后给出了系统测试。 论文的结论: 参考文献; 攻读学位期间发表的论文; 华南理工大学硕士学位论文 致谢。 6 第二章关键技术与理论 2 1 元数据技术 第二章关键技术与理论 2 1 1 元数据的定义 元数据英文原文为n e t a d a t a ,其英文含义为“s t r u c t u r e dd a t aa b o u td a t a ” 或者“i n f o r m a t i o no fd a t a ”等。简单的说就是“关于数据的数据”或者更精确 的说是“关于数据的结构化数据”,即关于数据的内容、质量、状况和其他特性的 信息。它用于描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数 据的提取方式等信息。为用户回答已经存在什么内容的信息( w h a t ) ,覆盖哪些区 域范围( w h e r e ) ,跨越的时间范围( w h e n ) ,找什么人联系( w h o ) 或者通过什么 方式获取( h o w ) ,是数据集与数据应用者之间的桥梁。 它是一种广泛存在的现象,在许多领域中有其具体的定义和应用: 在数据仓库领域中,元数据被定义为:描述数据及其环境的数据。一般来说, 它有两方面的用途。首先,元数据能提供基于用户的信息,如记录数据项的业务描 述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和 维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具 体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能: l 、描述哪些数据在数据仓库中; 2 、定义要进入数据仓库中的数据和从数据仓库中产生的数据; 3 、记录根据业务事件发生而随之进行的数据抽取工作时间安排; 4 、记录并检测系统数据一致性的要求和执行情况; 5 、衡量数据质量。 在软件构造领域,元数据被定义为:在程序中不是被加工的对象,而是通过 其值的改变来改变程序的行为的数据。它在运行过程中起着以解释方式控制程序 行为的作用。在程序的不同位置配置不同值的元数据,就可以得到与原来等价的 程序行为。 在图书馆与信息界,元数据被定义为:提供关于信息资源或数据的一种结构 化的数据,是对信息资源的结构化的描述。其作用为:描述信息资源或数据本身的 特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估,选择等功能。 此外,元数据在地理界,生命科学界等领域也有其相应的定义和应用,在此 7 华南理工大学硕士学位论文 不一一阐述。 2 1 2 元数据的基本特点与作用 现在,很多种的元数据标准已经在国家级或者某国际组织机构范围内使用, 并且在国际互联网上提供查询,从标准的内容和实施的方法来看,它们的共同特 点是 1 : 将元数据定义为“关于数据的数据”,目标是数据共享; 元数据描述的基本对象是“数据集”,可以扩展为数据集系列和数据集内 的要素和属性; 元数据的存储形式为格式化的文本和关系型数据库表; 元数据的使用密切结合计算机网络,在网络上为用户提供查询和检索元数 据以及相关数据库的工具; 元数据的实施,一般包括内容标准的制定、操作工具( 输入工具、编辑工 具和维护工具等) 的开发、元数据的数据收集、元数据库文件的建立、 元数据库文件与数据库的链接和外部用户使用工具( 如超文本浏览器) 开发等。 因此,可以说目前元数据已经从简单的描述或者检索发展成为管理数据、发 现数据、使用工具的一种重要工具。 元数据的主要作用可以归纳为如下方面 2 : 帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并保证即 使其主要工作人员退休或调离时,也不会失去对数据情况的了解; 提供有关数据生产单位数据存贮、数据分类、数据内容、数据质量、数据 交换网络( c l e a r i n g h o u s e ) 及数据销售等方面的信息,便于用户查询检索 地理空间数据; 提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输 有关的辅助信息: 帮助用户了解数据,以便就数据是否能满足其需求作出正确判断; 提供有关信息,以便用户处理和转换有用的数据。 由此可见,元数据是使数据充分发挥作用的重要条件之。它可以用于许多 方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进 数据的管理、使用和共享均有重要的作用。原始数据如果没有元数据,就很难有 第二章关键技术与理论 效地进行管理和使用。元数据对于建立空间数据交换网络是十分重要的,网络中 心通过设在中心的元数据库可以实时地连接各个分发数据的分结点元数据库,帮 助潜在的用户找到其特定应用所需要的数据,实现数据共享。不难预见,元数据 在地理信息系统产业中将担当重要的角色。然而,在数字形式下,元数据的建立 和维护、生产者与用户之间的交流均不那么容易,需要数据生产者更多的努力, 并需要那些随后可能应用数据的用户,或可能修改数据以便符合其需求的用户作 出相应的努力。 2 。1 。3 元数据的应用目的 现代的元数据概念已经不仅仅是传统的描述型元数据,元数据概念的外延已 经扩展到任何一个信息系统的组织、管理、服务、技术以及其他资源管理的方方 面面。从某个程度上而言,元数据管理与应用的好坏是任一个信息系统成功与否 的关键 3 。 元数据的应用涉及到多个领域和不同的应用目的,是个多层次、多结构、多 用途的概念。元数据应用开发的目的可以分为 4 : l 、确认和检索:致力于如何帮助用户检索、确认所需的资源。数据元素往往 限于作者、标题、主题、位置等简单信息; 2 、著录描述:用于对数据单位进行详尽的著录描述。数据元素包括内容、载 体、位置与获取方式、制作与利用方法、相关数据单元方面;数据元素数量往往 较多,m a r c 、g i l s 和f g d c c s d g m 是这类m e t a d a t a 的典型代表。 3 、资源管理;支持资源的存储和使用管理,数据元素除比较全面的著录描述 信息外,还往往包括权利管理( r i g h t s p r i v a c ym a n a g e m e n t ) 、电子签名( d i g i t a l s i g n a t u r e ) 、资源评鉴( s e a lo fa p p r o v a l r a t i n g ) 、使用管理( a c c e s s m a n a g e m e n t ) 、支付审计( p a y m e n ta n da c c o u n t i n g ) 等方面的信息。 4 、资源保护与长期保存:支持对资源进行长期保存,数据元素除对资源进行 描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式 ( m i g r a t i o nm e t h o d s ) 、保存责任等内容。 2 2 本体论 起源于哲学的本体论( o n t o l o g y ) 近年来受到信息科学领域的广泛关注 5 ,6 其重要性也己在许多方面表现出来并得到广泛认同 5 ,7 ,8 。 9 华南理工大学硕士学位论文 2 2 1 本体概念 本体论最早是哲学上的概念,从哲学上讲,本体是指关于世界某个方面的一 个特定的分类体系,这个体系不依赖于任何特定的语言。关于本体现在一个较为 普遍的定义:本体是领域概念模型的显式表示 9 。 概念就是事物的本质,是事物的内部联系。具体来讲,某个领域的本体就是 关于该领域的一个公认的概念集,其中的概念含有公认的语义,这些语义通过概 念间的关联未体现。本体通过它的概念集及其所处的上下文未刻画概念的内涵对 于软件系统来说,本体包含该软件系统所需要的概念集合以及它们之间的相互关 系的约束。 本体在计算机领域实际上是一个人造物,它由一个用于描述某种显示情况的 特定术语集和一组显式定义的公理集组成,这组公理用于描述上述术语的内涵。 对于术语可以有其词汇表及词汇意义的说明,而公理可以描述术语所表示概念间 的关系,这样,利用术语集和公理集就可以很好地描述本体。如果多个系统间采 用相同的术语集和公理集来对某个共同领域进行描述,这样就有助于系统问的通 信、重用、交互操作和共享 1o 。 2 2 2 本体描述语言的发展 本体描述语言起源于历史上人工智能领域对知识表示的研究,主要有以下语 言或环境为代表:k i f i t l 与o n t o l i n g u a l 1 2 ,o k b c ( o p e nk n o w l e d g e b a s e c o n n e c t i v i t y ) el 3 ,o c m l ( o p e r a t i o n a lc o n c e p t u a lm o d e l i n gl a n g u a g e ) 1 4 , f r a m el o g i c 1 5 tl o o m 1 6 等。 近年来,w e b 技术为全球信息共享提供了便捷手段,以共享为特征的本体论 与w e b 技术结合是必然趋势。在此背景下,基干w e b 标准的本体描述语言( 以下 简称为“w e b 本体语言) 正成为本体论研究和应用的热点,如s h o e ( s i m p l eh t m l o n t o l o g ye x t e n s i o n ) 1 7 ,o m l ( o n t o l o g ym a r k u pl a n g u a g e ) 1 8 ,x o l ( x m l b a s e d o n t o l o g ye x c h a n g el a n g u a g e ) 1 9 等。 在标准方面,由w 3 c 主持制定的r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 2 0 和r d fs c h e m a 2 1 是建立在x m l 语法上,以语义网( s e m a n t i cn e t w o r k s ) 为 理论基础,对信息资源进行语义描述的语言规范。 r d f 采用“资源( r e s o u r c e ) ”、“属性( p r o p e r t i e s ) ”以及“声明( s t a t e m e n t s ) ” 等三元组来描述事物。r d fs c h e m a 则做进一步扩展,采用了类似框架的方式,通 1 0 第二章关键技术与理论 过添力r d f s :c l a s s ,r d f s :s u b c l a s s o f ,r d f s :s u b p r o p e r t y o f ,r d f s :d o m a i n , r d f s :r a n g e 等原语,对类、父子类、父子属性以及属性的定义域和值域等进行定 义和表达,这样,r d f ( s ) 成为一个能对本体进行初步描述的标准语言。 2 2 3r d f r d f 资料模型是一种与语法无关( s y n t a xn e u t r a l ) 的表示法。如果两个r d f 语法对应的资料模型相同,则代表这两个r d f 语法具有同样的意义,反过来说, 如果两个r d f 语法具有同样的意义,则它们的资料模型应该相同。r d f 的基本资 料模型包括了三个对象类型: 资源( r e s o u r c e ) :所有以r d f 表示法来描述的东西都叫做资源。它可能是 一个网站,可能是一个网页,可能只是网页中的某个部分,甚至是不存在 于网络的东西,如纸本文献、器物、人等。在r d f 中,资源是以统一资源 标识( u r i u n i f o r mr e s o u r c ei d e n t i f i e r s ) 来命名,统资源定位器( u r l u n i f o r mr e s o u r c el o c a t o r s ) 、统一资源名称( u r n u n i f o r mr e s o u r c e n a m e s ) 都是u r i 的子集。 属性( p r o p e r t i e s ) :属性是用来描述资源的特定特征或关系,每一个属性 都有特定的意义,用来定义它的属性值( v a l u e ) 和它所描述的资源形态, 以及和其它属性的关系。r d f 的( p r o p e r t yp r o p e r t y v a l u e ) 在概念上和传 统的( a t t r i b a t ea t t r i b u t e v a l u e ) 是相同的。 陈述( s t a t e m e n t s ) :特定的资源以一个被命名的属性与相应的属性值来描 述。称为一个r d f 陈述,其中资源是主题( s u b j e c t ) ,属性是谓词 ( p r e d i c a t e ) ,属性值则是对象( o b j e c t ) ,陈述的对象除了可能是一个字符 串,也可能是其它的资料形态或是一个资源。 r d f 数据模型是对象一属性一值( o b j e c t p r o p e r t y v a l u e ) 机制,可以称为“属 性为中心”( p r o p e r t y c e n t r i c ) ,可通过“a b o u t ”属性来给已有的资源增加属性。 元数据信息是通过一组以r d f 描述的陈述( s t a t e m e n t ) 来表示的。这种陈述 主要有三种表示方法图: 采用二元谓词形式:谓词( 对象,值) ,即p r e d i c a t e ( o b j e c t ,v a l u e ) , 如t i t l e ( j o h n l i f e h t m ,t h el i f eo fj o h n ) 。 采用带有标签的图示:对象与值之间用带箭头的属性连接 ( o b j e c t 卜p r o p e r t y 一 v a l u e ) 。 采用x m l 语法作为交换格式。r d f 提供了一个抽象的框架来描述资源,r d f s 定义 华南理工大学硕士学位论文 和声明了一些属性类,但是,r d f 资料模型只是一个抽象与概念的框架,要形成 人机可读的具体文件并利用计算机处理,则还需要一个具体的语法体系来完成, r d f ( s ) 通过x m l 语法实现对各种元数据的集成。 2 2 4r d f ( s ) r d f 所提供的建模原语非常基础,只是提供了一个模型,因此需要对其作进 一步扩展 2 2 。r d fs c h e m a 在r d f 基础上增加了许多语义原语,用来更进一步增 加对资源语义上的描述能力,如类、属性、类和属性之间的隶属关系等。常用的 r d fs c h e m a 原语包括:r d f :r e s o u r c e 、r d f s :c l a s s 、r d f s :l i t e r n a l 、 r d f :p r o p e r t y 、r d f s :r a n g e 、r d f s :d o m a i n 、r d f :t y p e 、r d f s :s u b c l a s s o f 、 r d f s :s u b p r p p e r t y o f 等。这些描述机制是单纯的r d f 所不具备的。另外对于r d f s c h e m a 和x m ls c h e m a ,除了名字上的相似以外,并没有角色上的相同之处。x m l s c h e m a ( 包括d t d ) 描述的是一个x m l 文档中所使用的标签( t a g ) 的顺序和组合, 定义了x m l 的语法;而r d fs c h e m a 提供的是对r d f 建模表示的声明进行解释说 明的信息( 语义) ,但并不对一个r d f 描述的语法外观进行约束。r d f s 虽然能表 示语义,在某一程度上也能用它来表示o n t o l o g y ,但是它没有足够的v o c a b u l a r y ( 可以理解为标签) 来表示完整意义上的知识本体。r d f r d f s 的工具有:a m a y a , p r o t 6 9 6 ,m o z i l l a ,s i l r i 等等。 2 3 本章小结 本章主要介绍了论文涉及到的一些主要关键技术与理论。首先,阐明了元数 据的定义,介绍其在各个领域的应用情况,总结出元数据的基本特点、作用和应 用目的;接下来对本体及其描述语言作了探讨,主要介绍了r d f 和r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 18731:2025 EN Spices and condiments - Seasoning oil of Zanthoxyli pericarpium - Specification
- 学前口语考试试题及答案
- 深海养殖自动化喂养系统应用方案
- 混凝土砌块墙体施工技术方案
- 金属雕塑建筑施工组织设计及对策
- 光村镇2024-2025学年第二学期五年级科学期末学业评价题目及答案
- 农村饮水安全巩固提升工程施工方案
- 房屋建筑工程消防安全实施方案
- 碳捕集利用工程项目进度管理方案
- 宅基地空地租赁与农业项目合作合同书
- 国际音标卡片(打印版)
- 科技与全球资源分配问题
- 2024年高等教育教育类自考-00285中国福利思想笔试历年真题荟萃含答案
- 蛋白质相互作用传递信息蛋白质
- 马克思主义劳动观的内涵
- 《金属热处理》课件
- 学生上下学交通方式台账
- 路边停车经营管理方案
- 混凝土围墙贴砖施工方案
- 人体工程学室外环境设施课件
- 初次聊天话术900句高情商的对话语录
评论
0/150
提交评论