




已阅读5页,还剩56页未读, 继续免费阅读
(环境工程专业论文)城市地理本体系统的分析与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 在当前地理信息系统技术逐步走向社会化的背景下,本文以不同领域地理信 息系统之间信息的集成和共享为切入点,以城市中土地管理和城市规划两个领域 部门为研究对象,借助地理本体理论,通过研究它们各自领域的语义特征,分别 构建土地管理本体和城市规划本体,并在领域本体之上构建通用本体,三个本体 分别存储于不同的关系数据库中。同时,通过语义推理机制寻求两个领域本体之 间隐含的语义联系,借助这种语义联系,从语义上实现不同领域的地理信息的共 享查询。 最后,基于a r c g i ss e r v e r 和a s e n e t 构建的城市地理信息服务网站对上述 领域本体库构建的有效性进行了验证。实验表明,分布于不同领域部门的城市地 理信息在形式上没有交集,但借助它们之间隐含的语义联系,能真正从语义上实 现信息的跨库查询,返回给用户的信息更准确、全面。由此可见,城市地理本体 系统的构建在信息共享化程度越来越高的今天是有其重要价值的。 本文在以下几方面进行了创新性研究:( 1 ) 采用关系数据库来存储地理本体。 这种存储模式兼顾考虑领域本体的领域特点和关系数据库成熟的存储技术,在一 定程度上保留了地理本体丰富的语义特性,同时采用由系统表生成的视图来存储 属性的类型和值域,为语义推理时读取属性的类型和值域提供了方便。( 2 ) 将基 本属性结合遥感特征属性共同描述城市地理本体概念,更丰富了本体概念的语义 信息。即利用面向对象多尺度遥感影像分割技术,将遥感影像数据按不同的分割 尺度构造相应分割尺度下的影像对象层,不同影像对象层的对象分别对应不同领 域的概念,并通过分析研究找出不同尺度下这些对象的影像特征之间的关系,从 而得出地理概念间的语义联系。这样,在基本属性之间不存在交集的情况下,可 以转向比较影像特征属性的取值,从而能更完整智能地挖掘出领域本体间隐含的 语义联系。( 3 ) 本文着眼于城市中分布于不同领域的地理信息的语义冲突问题, 以土地管理和城市规划两大领域本体的构建为主要研究内容,将理论与实践相结 合,是地理本体理论在应用层面的推广。 关键词:地理本体,关系数据库,信息集成 a b s t r a c t c u r r e n t l y , t h et e c h n o l o g yo fg e o g r a p h i ci n f o r m a t i o ns y s t e m ( g i s ) i sg r a d u a l l y h e a d i n gf o rp o p u l a r i z a t i o na n ds o c i a l i z a t i o n i nt h i ss i t u a t i o n ,t h i sp a p e rt a k e sl a n d m a n a g e m e n td e p a r t m e n ta n du r b a np l a n n i n gd e p a r t m e n tf o rs t u d yo b je c t s ,a n dm a k e s f u l lu s eo fg e o o n t o l o g yt h e o r y , g i sa n dn e t w o r kt e c h n i q u e ,a n df i n a l l yc o n s t r u c t sa n u r b a ng e o o n t o l o g ys y s t e m ,w h i c ha i m sa tt h ei n f o r m a t i o ni n t e g r a t i o na n ds h a r i n g a m o n gd i f f e r e n tg i s si nv a r i o u sd o m a i n s f i r s t l y , t h i sp a p e rr e s p e c t i v e l ye s t a b l i s h e s t w od o m a i no n t o l o g i e sb ya n a l y s i so fs e m a n t i cc h a r a c t e r i s t i co ft h e i ro w nd o m a i n , a n dt h e nau n i v e r s a lo n t o l o g yi se r e c t e db a s eo nt h ea b o v et w oo n t o l o g i e s t h e s e o n t o l o g i e s a r es t o r e di n t od i f f e r e n tr e l a t i o nd a t a b a s e m e a n w h i l e ,as e m a n t i c r e a s o n i n gm e c h a n i s mi ss e tu pt os e e kf o rc o n n o t a t i v es e m a n t i cr e l a t i o n s h i pa m o n g d o m a i no n t o l o g i e s ,w h i c hi st h ek e yp o i n tt oa c h i e v ei n f o r m a t i o n s h a r i n g s e m a n t i c a l l y f i n a l l y , t h i sp a p e rc o n s t r u c t saw e b s i t en a m e du r b a ng e o g r a p h i ci n f o r m a t i o n s e r v i c e sb a s e do na r c g i ss e r v e ra n da s e n e t , w h i c hi sav a l i d a t i o no ft h e e f f e c t i v e n e s so ft h ea b o v eg e o o n t o l o g yr e s e r v o i r t h er e s u l ts h o w st h a t ,t h eu r b a n g e o g r a p h i ci n f o r m a t i o nd i s t r i b u t e di nd i f f e r e n td o m a i nd e p a r t m e n ts e e m si r r e l e v a n t w i t he a c ho t h e r ,h o w e v e r , t h r o u g ht h eu n i v e r s a lo n t o l o g yb a s e do nt h ec o n n o t a t i v e s e m a n t i cr e l a t i o n s h i pa m o n gd o m a i no n t o l o g i e s ,w ec a nr e a l i z e st h ei n f o r m a t i o n s e a r c ha c r o s sd i f f e r e n td a t a b a s e ss e m a n t i c a l l y , a n dt h er e t u r n e dr e s u l t sa r em o r e c o r r e c ta n dc o m p l e t e t h e r e f o r e ,w i t ht h ei n c r e a s i n g l yn e c e s s a r yf o ri n f o r m a t i o n s h a r i n g ,t h ec o n s t r u c t i o no fu r b a ng e o o n t o l o g ys y s t e mi s o fg r e a tv a l u ea n d s i g n i f i c a n c e t h e r ea r et h r e es u p e r i o r i t i e si nt h i sp a p e r :w ea d o p tr e l a t i o nd a t a b a s et os t o r e g e o o n t o l o g y , w h i c hn o to n l yt a k e st h ec h a r a c t e r i s t i c so fd o m a i no n t o l o g yi n t o a c c o u n t ,b u ta l s ot h em a t u r et e c h n i q u eo fr e l a t i o nd a t a b a s e t h i ss t o r a g es c h e m at o s o m ee x t e n tk e e p so r i g i n a ls e m a n t i cc h a r a c t e r i s t i ct h a tac o n c e p ti sd e s c r i b e db ys o m e a t t r i b u t e s ,a n dw eu s ev i e wb a s e do ns y s t e mt a b l e st os t o r et h et y p ea n df i e l dr a n g eo f a t t r i b u t e s ,w h i c hf a c i l i t a t e st h ea c q u i s i t i o no ft y p ea n df i e l dr a n g eo fa t t r i b u t e s i n v o l v e di nt h ec o u r s eo fs e m a n t i cr e a s o n i n g w ec o m b i n eb a s i ca t t r i b u t e sw i t h r e m o t es e n s i n gf e a t u r ea t t r i b u t e st od e s c r i b eg e o - o n t o l o g yc o n c e p t ,w h i c he n r i c h e st h e s e m a n t i ci n f o r m a t i o no fo n t o l o g yc o n c e p t f i r s t l y , b yt h eu s eo fm u l t i s c a l e i i s e g m e n t a t i o nt e c h n o l o g yo fo b j e c t o r i e n t e dr e m o t es e n s i n g ,t h er e m o t es e n s i n gi m a g e i sd i v i d e di n t od i f f e r e n ti m a g eo b j e c tl a y e r sa c c o r d i n gt od i f f e r e n ts e g m e n t a t i o ns c a l e s , w h i c hc o r r e s p o n dt oc o n c e p t so fd i f f e r e n td o m a i n t h e n ,t h es e m a n t i cr e l a t i o n s h i p b e t w e e ng e o g r a p h i cc o n c e p tc a nb eo b t a i n e db ya n a l y z i n gt h er e l a t i o n s h i pa m o n g i m a g ef e a t u r e so fi m a g eo b j e c t sf r o md i f f e r e n ts e g m e n t a t i o ns c a l e t h e r e f o r e ,e v e ni f t h e r ei sn oi n t e r s e c t i o nb e t w e e nb a s i ca t t r i b u t e s ,w ec a nc o n v e r tt oc o m p a r ei m a g e f e a t u r ea t t r i b u t e st o a c q u i r ec o n n o t a t i v es e m a n t i cr e l a t i o n s h i p b e t w e e nd o m a i n o n t o l o g i e s t h i sp a p e ra p p l i e st h et h e o r yo fg e o o n t o l o g yi n t ol a n dm a n a g e m e n t d o m a i na n du r b a np l a n n i n gd o m a i n ,w h i c he x t e n d st h e a p p l i c a t i o nl a y e r o f g e o o n t o l o g y k e yw o r d s :g e o g r a p h i co n t o l o g y , r e l a t i o nd a t a b a s e ,i n f o r m a t i o ni n t e g r a t i o n i i i 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 武汉理工大学或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在沦文中作了明确的说 明并表示了谢意。 签名:豫垒日期:型21 兰:! ! 学位论文使用授权书 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的 全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制 手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有 关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息 服务。 ( 保密的论文在解密后应遵守此规定) 研究生( 签名) :解蜥导师( 签 j 期1 陟 武汉理工大学硕士学位论文 1 1 研究目的和意义 第一章引言 纵观地理信息系统的发展历史【l 】,从早期的结构简单、功能单一且面向于专 业部门的地理信息系统,发展到如今多功能、智能化、网络化的遍布于各行各业 的综合性信息系统,这无疑是地理信息科学发展的一大飞跃。然而,由于遍布于 各领域的地理信息系统的建立都依赖于各自的行业标准和规范,不同的应用部门 对同样的地理现象有着不同的理解和不同的数据定义f 2 】,从而导致不同领域的不 同词汇可能表达的是同一个概念,或同一词汇在不同的应用中可能具有不同的概 念语义,这会造成在地理信息服务为应用提供信息时提供错误的信息或者遗漏重 要的信,息1 3 , 4 1 ,即形成所谓的“信息孤岛 ,这与当今社会信息的逐步高度共享化 是背道而驰的。因此,随着地理信息系统的应用层次及应用领域的不断扩展, g i s 的各个应用部门对共享和集成空间信息有强烈的要求,从而解决不同领域的 地理信息系统间的信息共享和互操作问题显得尤为迫切。 如前所述,阻碍地理信息系统间共享和互操作的原因之一是不同系统间的语 义冲突问题。以城市中土地管理部门和城市规划部门为例,前者信息系统构建依 据从属于( - i - _ 地管理法的土地利用现状分类( g b t 2 1 0 1 0 2 0 0 7 ) ,后者则 依据从属于城市规划法的城市用地分类与建设用地标准( g b 儿3 7 9 0 ) 。 由于适用范围和侧重点的不同,两类用地分类标准对于概念层次的划分、概念的 粒度以及概念的描述都存在着较大的差别,这就给两个系统间的信息集成和互操 作带来诸多麻烦。然而,语义冲突并不意味着它们在语义上是完全对立的,相反 是有渗透和交叉的。由于研究的对象都是用地分类,它们之间或多或少地存在语 义联系,同名异义、异名同义、语义包含与被包含的现象普遍存在。正是这种隐 含的语义联系的存在,使得两个系统问的语义共享成为可能。 当前,解决地理信息系统间语义冲突的方法有很多,其中地理本体理论发挥 着举足轻重的作用,也是当前地理信息领域研究的热点之一。地理本体是本体理 论应用于地理科学领域而形成的一门理论。目f i i f 公认的本体的定义是g r u b e r 于 1 9 9 5 年提出的“某一领域的共享概念化模型的形式化和显式的说明规范【5 l 。地 理本体既继承了它的这一定义,同时又有其独特之处【6 】。它是把有关地理科学领 域的知识、信息和数据抽象成一个个具有共识的对象或实体,并按照一定的关系 而组成的体系,同时进行概念化处理和明确的定义,最后以形式化表达的理论与 方法【7 】8 3 。即它描述的对象是与空间位置有关的地理实体,因此除了常用的基本 1 武汉理工人学硕士学位论文 属性,还可以融入地理信息特有的空间属性、遥感影像特征等属性来描述本体概 念,这样既丰富了概念语义,同时也为寻找概念间的语义联系拓宽了途径。 综上所述,由于g i s 的应用领域很多,要它们从概念上遵从同一个标准, 那几乎是不可能的,也是不现实的。但是,概念间隐含的语义联系为看似彼此孤 立的系统间信息共享提供了可能,同时描述共享概念语义的地理本体理论又为实 现这一可能提供了强有力的理论支撑。也就是说,利用系统间的交集或是隐含的 关系,借助本体,可以提供一种明确定义的共识作为领域内部不同主体( 软件系 统,入,机器) 之间进行交流( 对话,互操作,共享等) 的一种语义基础【8 1 ,从 而实现信息的共享和互操作。因此,论文研究城市地理本体系统的构建的目的就 在于,借助地理本体理论、g i s 平台及网络编程工具,针对城市圈内的几大领域, 从横向上将分布于各个领域的地理信息在语义层面上实现共享集成。系统尝试着 以土地管理、城市规划两个部门为研究对象,分别构建各个领域的领域本体系统, 并在此基础上通过推理建立各个领域本体系统间的语义关系,从而形成通用本体 系统,便于用户在这一层面上实现多领域地理信息的共享查询。这样,基于城市 地理信息共享平台,不同领域的用户可以获取更加全面、准确的信息,这在信息 共享化程度越来越高的当下是有其重要意义的。 1 2 地理本体的研究现状及存在问题 随着人们对语义互联网及语义集成的需求越来越强烈,哲学中的本体论开始 在科学技术领域兴起,从而形成领域本体。地理本体,即地理信息的领域本体, 从2 0 世纪9 0 年代末开始在地理信息科学领域受到广泛关注。最主要的表现是, 地理本体已逐渐成为主要国际学术会议尤其是空间信息与地理信息科学会议的 重要讨论专题。例如,在2 0 0 8 年于我国广州举办的第1 6 届国际地理信息科学与 技术大会上,地理本体就是会议的重要主题之一。这是因为,地理本体的研究可 为语义互联网、地理信息系统之间的语义互操作、知识级地理信息共享与知识重 用、地球科学中的语义建模提供重要理论与方法支撑【7 】8 3 。下面分别从理论和应 用两个方面介绍地理本体的研究现状。 1 2 1 理论方面 目前,关于地理本体的理论研究主要侧重于地理本体基础理论及地理本体的 构建方法。 在基础理论方面,国外许多专家学者进行了深入研究。例如,s m i t h 和m a r k 对地理信息的认知类型和地理目标的本体特征的研究 9 , 1 0 , 1 1 1 ;b i t t n e r 侧重于地 2 武汉理工人学硕十学位论文 理尺度、不确定性以及部分与整体理论的本体研究1 1 2 , 1 3 ;f r a n k 对时空数据库 的基础本体的研究【1 4 】;k a v o u r a s i l 5 】教授领导的地理本体研究小组o n t o g e o 在 理论方面的研究包括地理学中的概念理论、地理类别、概念映射、本体的模 糊性、时空建模,地理学中的相似性和粒度等。归纳起来,地理本体基础理论 主要涉及三大方面:认知科学、数学理论及地理分类理论。其中,认知科学是本 体论最开始研究的方向,地理本体理论的研究也基于此。这是由于地理对象的描 述很大程度上依据的是特定领域的应用需求,需求不同描述地理对象的角度和侧 重点就不同,因而有必要研究不同领域对地理对象的分类以及对地理现象的解 释。数学理论的引入主要是针对地理本体描述的地理对象所特有的复杂的空间拓 扑特征。地理分类理论的引入主要是由于目前很多地理科学领域都有自己的一套 分类系统或者各自依据的国家标准、行业标准等,地理本体体系的建立可以延用 这些标准中定义的概念、概念的定义及概念的层次等级,但前提是这些标准具有 合理性、科学性和相对稳定性。 在本体构建理论方面,主要有专门用来构建企业本体的“骨架法 、多伦多 虚拟企业本体( t o v e ) 采用的评价法、斯坦福大学医学院开发的主要用于构建 领域本体的七步法。可以看出,本体构建方法在逐步发展,从一开始只针对特定 领域( 如企业) 发展到适用于领域本体的构建,从只能建立静态的本体系统到开 始考虑本体系统的进化问题。但共同点是,建立一个本体系统的过程即是逐步把 用自然语言描述的隐含的或默认的知识形式化和显式地表达出来。 1 2 2 应用方面 目前地理本体的应用研究主要是集中在地理信息集成以及地理信息的查询 与检索等方面。例如,f o n s e c a 怕】提出了一种基于本体的地理信息集成框架。在 这种集成框架中,他引入等级和角色来表达地理本体,提供概化和特化机制并实 现知识共享和重用,而角色的使用可以有效表达地理实体的不同特征以避免多态 继承问题,两者的结合可以实现基于地理信息内涵的、多层次的、高集成度的地 理信息集成。u i t e r m a r k t l7 】提出了一种基于本体的地理数据集成方法。他认为,不 同的地理数据集的对象实例必须与不同的调查规则集一致,因此地理数据集成概 念框架除了领域本体还应包括一系列调查规则,并通过特化一泛化等级结构和部 分整体结构来表达不同地理数据集之间存在的等价、父类一子类以及部分整体三 种类型的语义关系。 在国内,崔巍教授【1 8 , 1 9 , 2 0 1 对地理本体进行了大量深入研究。他还把本体、 网络技术和轻量目录访问协议有机地融合在起,首次提出了基于本体的地 理信息系统集成和互操作的新体系结构空间信息语义网络,对网络的语 3 武汉理工大学硕士学位论文 义集成和互操作进行了探讨,使空间信息的语义通过本体全面渗透到网络之 中。此外,景东升【2 1 l 主要研究了本体查询模式,并结合本体推理,提出了基 于语义的地理信息查询框架;分析了语义网络服务,以地理缓冲区服务为例 进行了语义服务表达;还以我国土壤系统分类为例,初步建立了面向语义的 土壤地理信息系统。此外,有些学者【2 2 】将本体应用于海洋灾害领域,在大量 分布式的海洋灾害数据集的基础上建立海洋灾害领域本体,开发了基于本体 的海洋灾害w e b g i s 查询系统。李宏伟【2 3 】等对基于本体的土地利用数据分类 分级表达进行了研究。 随着网络及w e b g i s 技术的不断成熟,基于地理本体的g i s 数据的查询与检 索可以一定程度上消除分布于w e b 上的g i s 数据的语义异质性问题,因而也成 为地理本体应用研究的一个热点。 1 2 3 存在问题 综合目前对地理本体的研究,发现主要存在如下三方面问题: 其一,地理本体对空间特征的描述不够。地理本体与一般的信息本体的 本质区别就在于具有空间特征,而现有的研究往往只关注地理本体的属性特 征。 其二,本体的形式化语言过于多样化,而其中却很少涉及地理本体的形 式化方法。目前很多地理本体往往只是提供了地理概念的一个自然语言解释 或类自然语言的定义库;或者借助于其它形式化语言对一些地理概念进行简 单的描述,不仅形式化程度不够,而且本体概念与底层的地理数据模型之间 的映射又是一大难题。 其三,地理本体的研究大多只停留在理论层面上,真正应用于具体领域 的地理信息集成的还不多。 1 3 研究内容及技术路线 论文研究城市地理本体系统的分析与实现,主要包括以下几方面内容: ( 1 ) 本体树的生成。以土地管理、城市规划两大领域为研究对象,借鉴领 域本体构建的“七步法”,分别获取两大领域的领域本体知识,从中 提取出重要术语,然后确定概念和描述概念的属性,将概念分层,生 成两大领域的本体树。 ( 2 ) 本体库的建立。通过比较分析现有的几种基于关系数据库的本体存储 模式,并结合面向对象中类与对象和本体中概念与实例的相似性,综 4 武汉理工大学硕士学位论文 合考虑领域自身的特点,寻找一种容易理解、结构稳定、易于扩展, 并能兼顾考虑查询效率的优化关系数据库存储模式来存储本体,形成 两大领域本体库。这是论文研究的重点内容。 ( 3 ) 城市地理本体系统的实现。基于e s m 公司的a r c g i ss e r v e r 组件和 m i c r o s o f tv i s u a ls t u d i o 中的a s r n e t ,采用c 撑编程语言开发b s 结 构的城市地理本体系统。系统以构建城市地理信息服务网站为核心, 主要由信息查询和信息管理两大模块组成。前者是对上述的本体库建 立的有效与否的验证,通过两大领域本体库及在其上构建的通用本体 库,借助于网络,实现分布于网络中两大领域g i s 信息的基于语义的 跨库检索。后者主要是对本体库内容的浏览、管理与更新等操作,以 不断完善本体库的内容。 系统采用的技术路线如图1 1 所示: 图1 1 系统技术路线图 1 4 小结及本文的组织结构 本章首先阐述了论文研究的目的和意义,即构建城市地理本体系统目的在于 5 武汉理工大学硕十学位论文 借助地理本体理论,解决城市中不同领域的政府部门的g i s 系统间的基于语义 的共享查询问题。接着分别从理论和应用两方面分析了当前地理本体系统的研究 现状,指出地理本体作为个新兴且正被广泛关注的研究领域,尽管取得了很大 的进展,但国内只开展了一些探索性的思考和研究,尤其是地理本体的应用研究 方面还很少。最后概括地论述了论文的主要研究内容及系统采用的技术路线。 针对本文研究的内容,论文的组织结构如下: 第一章为引言,介绍了论文研究的目的和意义,提出论文研究的主要内容及 技术路线。 第二章主要是分析土地管理、城市规划两大领域的领域特点,获取领域知识, 从而生成领域本体树。 第三章是本文的核心,重点探讨了本体库的建库过程。论文采用关系数据库 存储本体,力图寻找一种实用且高效的存储模式来构建本体库。 第四章介绍系统的实现部分。包括系统采用的开发模式,系统内部结构以及 系统各个功能模块。最后是系统的测试及对构建的本体库的一个检验,并对结果 进行分析和评价。 第五章分析和总结本文的研究内容,指出系统存在的不足,以及今后努力的 方向。 6 武汉理工大学硕士学位论文 第二章城市地理本体的构建 2 1 本体论与地理本体 本体源于哲学词汇,原意是指“对世界上任何领域内的真实存在所做出的客 观描述【2 4 】,。应用于信息系统之后,普遍公认的定义为“某一领域的共享概念的 明确的形式化说明规范。从定义上理解,本体主要包括以下几方面内容: ( 1 ) 本体描述的是某一领域的知识。领域范围越广,描述的领域知识越丰 富,构建的领域本体规模就越大,适用范围也越广。相反,领域越窄,构建的领 域本体就越小,但维护起来更方便。 ( 2 ) 本体描述的概念是这一领域所共享的,即是被这一领域群体共同认可 的。这样一来,领域本体可以复用领域已有的知识库,也可以借鉴领域所依据的 国家标准、行业标准和技术规范等。 ( 3 ) 概念化,是指通过确定某个现象的相关概念而得到这个现象的抽象模 型。基本方法是从领域知识和术语中提取出描述领域中实体、现象和事件的词汇, 期间最好是有领域专家的参与。 ( 4 ) 明确,是指对概念要有确切的定义,包括概念的属性、属性的类型及 属性取值范围等。 ( 5 ) 形式化是指本体应该是能被计算机解译的。 地理本体是本体论用于描述地理信息而形成的理论。目前,关于地理本体的 定义也不少。陈建军把地理本体定义为“把有关地理科学领域的知识、信息和数 据抽象成一个个具有共识的对象( 或实体) ,并按照一定的关系而组成的体系, 同时进行概念化处理和明确的定义,最后以形式化表达的理论与方法”【刀8 3 。崔 巍则把地理本体系统定义为“空间信息科学中具体应用领域里共享的一个概念化 的知识体系的形式化和显式的说明规范”【1 8 1 2 6 。总的来说,地理本体既继承了本 体的五大特点,同时也有其独特之处。主要表现在: ( 1 ) 地理本体描述的是与空间位置有关的地理对象。因此,用于描述地理 本体概念的属性就不仅仅局限于普通的描述性属性,还包括地理对象特有的时 间、空间特征,以及地理对象在g i s 、r s 中的特有属性,如遥感影像特征。这 样不仅丰富了地理本体概念的含义,同时也为寻找不同领域地理本体系统间的语 义联系开辟了新的途径。也就是说,当两个本体系统中的概念在一般的地理属性 集中不存在交集时,可以转向其它属性特征集中寻找语义联系。 ( 2 ) 一般的本体概念实例映射为属性数据库中一条记录,而地理本体概念 7 武汉理1 二大学硕士学位论文 的实例更多是与地图上的某一个要素联系起来。因此,地理本体概念对应的是一 类地理实体,依据比例尺的不同,该类地理实体在地图上表现为点、线或面。 2 2 现有的本体构建方法 目前,用于构建本体的方法主要有以下几种。 ( 1 ) m e t h o n t o l o g y 法,该方法由m a r i a n of e m a n d e z 2 5 】等人提出,专用于构建 化学本体。它主要包括管理阶段、开发阶段和维护阶段。其中开发阶段分为规范 说明、概念化、形式化、执行以及维护五个步骤;维护阶段则包括知识获取、系 统集成、评价、文档说明、配置管理五个步骤。 ( 2 ) 骨架法【2 6 1 。该方法专门用来构建企业本体,是相关商业企业间术语和 定义的集合。该方法首先要确定知识本体的应用、目的和范围,接着对知识本体 进行分析,包括定义术语的含义及术语间的关系,然后用语义模型表示本体。接 着是依据清晰性、一致性、完善性、可扩展性等评价标准来评价和检验本体。如 果符合标准,则本体建立成功,如果不符合标准,则返回本体分析阶段,直到符 合评价标准为止。 ( 3 ) 七步法【2 7 】。该方法主要用于构建领域本体,是由斯坦福大学医学院开 发而成。七个步骤分别是: 1 ) 确定本体的专业领域和范畴:包括明确本体覆盖的专业领域、构建目的、 用户、可以用来解决的问题等,为下一步设计提供基础依据。 2 ) 考查复用现有本体的可能性:这是构建本体最快最有效的方法,但前提 是存在特定的本体。 3 ) 列出本体中的重要术语:即列出与领域相关的重要概念、概念具有的属 性及与概念相关的重要术语,要求所列的概念集尽可能地全面。 4 ) 定义类和类的等级体系:首先是将具有代表性、概括性的概念抽取出来 映射为类,然后通过考察类之间的等级关系,将这些平面的概念集组织 成等级分类体系,从而形成类的等级体系。 5 ) 定义类的属性:即对概念的内涵进行描述,同时本体中子类均可继承父 类的属性,同时子类还具有自己的特有属性。 6 ) 定义属性的分面:即属性的类型、取值范围及其它一些特征。 7 ) 创建实例:添加类的具体实例及该实例具有的属性值。 ( 4 ) 迭进法。针对本体构建过程中存在的几个问题:需求不充分和无计划性、 缺少本体进化的方法、对领域专家的依赖性太强以及忽视本体的共享和重用,刘 仁宁【2 8 】等学者提出了迭进法。该方法强调本体建设前期的需求分析的重要性, 同时建立领域本体共享词语库的过程采取增量迭代式的开发方式,即是一个不断 r 武汉理t 大学硕士学位论文 增加新概念,修改已经存在概念的过程。他们认为这样可以降低领域专家参与的 程度,在使用过程中逐步的完善。 综合上述几种方法可以看出,本体构建方法在逐步发展,从一开始只针对于 特定领域( 如化学本体、企业本体) 发展到适用于各个领域本体的构建,从只能 建立静态的本体系统到开始考虑本体系统的进化问题。但各种本体构建方法可以 说是万变不离其宗,即建立本体的过程就是逐步把用自然语言描述的隐含的或默 认的知识形式化和显式地表达出来的过程。 2 3 城市地理本体的构建 2 3 1 城市地理本体系统构建的必要性 随着地理信息技术的广泛普及,地理信息系统已进入许多政府部门,成为政 府部门存储、管理和处理地理信息不可缺少的工具。这是因为,与一般的纯属性 数据的管理系统相比,地理信息系统具有丰富的图形表现能力和强大的空间分析 功能,能以更直观、立体、丰富的方式展现地理数据。但是,由于各政府部门构 建的信息系统依据的标准和规范不一致,导致各部门间联系甚少,各行其是。 例如,崔巍教授在其博士论文用本体实现地理信息系统语义集成和互操作 中,对农林本体系统之间存在的语义联系进行了深入探讨。他依据中国土地资 源调查技术的分类标准构造林业本体的概念系统和体系结构。该条例把林地分 为包括郁闭度0 2 以上的有林地以及竹林地、灌木林地、疏林地、采伐火烧迹地、 未成林造林地、苗圃地和宜林地。同时探讨了该分类体系与农业本体中草原分类 体系之间的语义联系,得出如图2 一l 所示的语义关系副博j 77 : 图2 1 农林系统间的语义关系 9 武汉理t 大学硕士学位论文 又如,笔者之前也对湿地的分类体系进行过研究,并以环保部门的湿地分类 体系与林业部门的湿地分类体系进行了分析对比,也发现了它们之间同样存在上 述的语义联系,如图2 2 所示: - i 潮下海域l - e 潮问海域l 图2 2 环保部门与林业部门的湿地分类体系对比图 此外,高捷在其硕士学位论文我国城市用地分类体系重构初探 2 9 j 中就 城市规划用地分类与其他土地利用分类之间作了细致的比较,结果表明城市总体 规划、村镇规划与土地利用总体规划“三者的用地分类标准中其标准的定义和划 分依据尺度都存在着较大的差别,这三个用地分类体系之间虽有一定联系,但又 不尽相同,歧义太多,给三者规划之间的协调和衔接增加了诸多困扰”。 尽管国家于2 0 0 7 年又新颁布了土地利用现状分类与编码的新标准,但从属 于城市规划法的城市用地分类与建设用地标准( g b j l 3 7 9 0 ) 与从属于 土地管理法的土地利用现状分类( g b t 2 1 0 1 0 2 0 0 7 ) 仍然是摆脱不了上 述问题。笔者在对这两种标准经过细对比研究后,发现:两种分类体系之间的关 系可谓错综复杂,同名异义,同义异名,语义包含与被包含的语义异构的现象普 遍存在。譬如,土地利用分类中的“军事设施用地”、“使领馆用地”、“监教 场所用地”分别与城市用地分类中的“军事用地 、“外事用地”、“保安用地 表达的语义内涵相等或相近,即属于异名同义现象。而前者中的“公共设施用地” 与后者的“公共设施用地”完全没有交集,即属于同名异义现象。显然,前者的 1 0 武汉理工大学硕十学位论文 “公共设施用地”含义更窄,它在后者被包含在“市政公用设施”这一大类中, 这又是另一种语义异构现象“上下义关系9 1 p 9 即前者的“公共设施用地”是 后者“市政公用设施”的下义词,用语义本体解释就是,内涵更多而外延更少。 如图2 3 所示。 图2 3 土地利用现状分类与城市用地分类对比图( 部分) 由此可见,分布于城市各部门间的地理信息并不是孤立存在的,它们之间都 或多或少地相互联系着。正是这些语义联系为信息共享的实现提供了可能。而城 市地理本体系统的构建则为它的实现提供了理论依据和实现工具。也就是说,通 过构建各领域或各部门间的语义本体系统,为它们之间的信息交流搭建一个语义 共享平台,通过这一平台实现信息的高度共享和集成,在一定程度上避免了为用 户提供错误的信息或是遗漏重要信息等问题的出现。 2 3 2 城市地理本体的构建 2 3 2 1 城市地理本体的建立过程 城市地理本体的构建主要借鉴领域本体构建的“七步法”。同时,本体的构 建并不是一蹴而就的过程,尤其是对于城市地理本体这样中大型的本体,在本体 构建初期不可能一次性地覆盖所有概念和属性,因此系统会综合上述的迭进法, 提供本体管理模块,供领域专家对概念尤其是描述概念的属性进行修改和添加操 作,以不断完善本体系统。具体来说,城市地理本体的构建过程有如下几个步骤。 武汉理工大学硕士学位论文 ( 1 ) 确定本体的专业领域和范畴。城市地理本体系统以城市中土地管理和 城市规划两个领域部门为研究对象,即系统面向的是城市的各个政府部门。系统 进一步完善后,可以横向扩展到其它部门。 ( 2 ) 获取领域知识。领域知识的获取可以借鉴的方法有【3 0 】:领域专家法; 领域内具有权威性的文献和字典:现有的信息系统和数据库提供的运行模型 和实体关系模型:网上发布的本体。由于系统面向的是政府部门,而政府部门 对于用地的分类往往都会严格依据国家最新出台的标准和规范。所以,领域知识 的获取主要是来源于国家标准以及相关的规范和条例,同时兼顾考虑g i s 、r s 领域中对于基础地理信息的分类体系及相关特征等内容。 这里,土地管理部门对于土地利用现状的分类依据的是2 0 0 7 年新颁布的从 属于土地管理法的土地利用现状分类标准( g b t 2 1 0 1 0 2 0 0 7 ) 【3 。该标 准规定了土地利用的类型和含义,采用一级、二级两个层次的分类体系,共分 1 2 个一级类、5 7 个二级类,同时采用数字编码,一级采用两位阿拉伯数字编码, 二级采用相应的两位一级编码再加一位阿拉伯数字的方式进行编码( 如表2 一l 所 示) 。 表2 1 土地利用现状分类和编码( 部分) 一级类 二级类 编码名称编码名称 0 1 1水田 0 1 耕地 0 1 2水浇地 0 1 3 旱地 城市规划部门对于城市用地的分类依据的是从属于城市规划法的城市 用地分类与建设用地标准( g b j l 3 7 9 0 ) 3 2 】,该标准将城市用地分为大、中、 小三类,其中包括1 0 个大类、4 6 个二级类和7 2 个三级类,同时大类采用一位 大写英文字母表示,中类采用大类的英文字母加一位阿拉伯数字的方式表示,小 类则在中类的基础上再添加一个阿拉伯数字来表示( 如表2 2 所示) 。这样的编 码方式可以用来在同一本体库中辅助存储概念间的父类和子类关系。这会在以后 本体存储的章节中具体阐述。 表2 2 城市用地分类和编码( 部分) 类别代号类别名称 大类中类小类 e 水域和其它用地 e 2耕地 武汉理工大学硕士学位论文 类别代号类别名称 大类中类小类 e 2 1菜地 e 2 2灌溉水田 e 2 9其它耕地 ( 3 ) 从领域知识中提取出重要术语。所谓提取重要的术语,即是从语句中 确定那些用来描述地理领域中实体、现象和事件的词汇。这里所说的词汇包括概 念本身和用来描述概念的词汇,后者是作为属性来表示的。 这里以林业部门的湿地分类体系中的“浅海”概念为例。该概念比较有代表 性,但它并不属于本文研究的城市地理本体中的概念,城市地理本体中的概念的 基本特征属性的提取将会在2 3 2 2 小节中详细讲述。湿地分类体系定义“浅海 的下一级概念包括:浅海水域、潮下水生层、珊瑚礁。对这些概念作进一步的细 究后发现这样的描述语句:浅海水域指“低潮时水深不超过6 m 的永久水域,植 被盖度 3 0 ,包括海湾、海峡 ;而潮下水生层指“海洋低潮线以下,植被盖度 3 0 ,包括海草层、海洋草地;而珊瑚礁则指“由珊瑚聚集生成而成的湿地, 包括珊瑚岛及其有珊瑚生成的海域 。由此可以从中直接提取出描述“浅海这 一概念的重要术语:水深、植被盖度、海湾、海峡、海草层、海洋草地、海洋低 潮线、珊瑚礁。 ( 4 ) 确定概念和描述概念的属性。概念相对较容易确定,如“浅海”这一 概念。而确定概念的属性就相对困难了,包括确定属性的属性名称、属性类型和 属性值域。然而,在这之前,先要对众多的属性进行约简,通常采用的方法是数 据挖掘技术中的属性相关性分析来得到各属性对于概念的重要程度,但这一方法 的前提是要有一定量的样本数据。 对上述例子来说,通过查阅资料知道,海洋低潮时水深一般不足6 m ,因此 海洋低潮线以下这一限定条件等同于水深小于6 m ,可知海洋低潮线这一属性为 冗余属性应去掉。而海草层、海洋草地、珊瑚礁可以概化为“植被类型 属性。 这样一来,用来描述“浅海”这一概念的属性为:水深、植被盖度、植被类型、 海湾、海峡。其中,水深、植被盖度、植被类型为值属性,而海湾、海峡为实例 属性( 对象属性) ,即海湾、海峡可认为是浅海水域的下义词。而水深属性的值 域为“ o 座落 座落 1r 水田 水浇地 旱地 公园与绿地 i di di o i d 面积: 0面积: o面积: o 面积: o 座落座落座落 座落 农作物类型: 农作物类型:水生农作物农作物类型:旱生农作物 红波段均值:2 6 1 3 2 2 8 3 4 5 水乍农作物,水早生农作物 有无水源保证:t r u e有无水源保证:t r u e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省德州市武城县实验中学、武城县第二中学2024-2025学年八年级上学期第一次联考历史试卷(含答案)
- 湖南省邵阳市2025-2026学年高一上学期9月联考语文试题(含答案)
- 部门级安全培训计划课件
- 《工程施工土建监理建筑监理资料》某市国家税务局办公楼装饰装修工程施工组织设计
- 部门安全教育培训课件
- 部门主任入场安全培训课件
- 避免意外伤害的课件
- 碳化土壤生态功能退化-洞察及研究
- 基于多模态数据融合的出血时间预测系统可靠性验证方法
- 基于光谱分析的复合型制冷剂混合气体识别技术瓶颈突破
- 患者身份识别管理标准WST840-2025学习解读课件
- 高等传热学全册课件
- 人教版四年级数学上册全册电子教案
- 新《高等教育学》考试复习题库450题(含各题型)
- 三字经全文带拼音注释打印版
- 函数的概念学习任务单-高一上学期数学人教A版(2019)必修第一册
- 产品技术规格书模板
- 《绿色建筑评价标准》解读
- 小学数学 北师大版 六年级上册 第二单元第1课时《分数混合运算(一)》 课件
- 《冷冲压工艺与模具设计》完整版ppt课件全套教程
- 生姜检验报告单
评论
0/150
提交评论