(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf_第1页
(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf_第2页
(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf_第3页
(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf_第4页
(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(交通信息工程及控制专业论文)陕西省公路信息基础数据元集编制研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 陕西省公路信息化工作经过多年的建设,取得了初步成果。但是,信息孤岛、数据 格式不规范、数据利用率低等问题普遍存在,严重地制约了信息化工作的进展。本文在 深入分析国内外交通信息技术的应用现状和陕西省对公路信息基础数据元建设需求的 基础上,对陕西省公路信息基础数据元集的编制原则、分类和编码方法、抽取方法、更 新机制等进行了深入的研究。 论文首先对陕西省公路信息基础数据元集的编制总则进行了研究,给出了数据元集 的建设依据、规范性引用文件、适用范围及编制原则。在总结现有数据元分类方法的基 础上,提出了按照业务领域和按照管理层次对陕西省公路信息基础数据元集进行二维分 类的方法,重点研究了基于管理层次的数据元分类方法和基于业务领域的的数据元分类 方法,给出了数据元的二维分类模式视图。论文还详细论述了数据元的抽取方法,结合 陕西省公路信息化建设和管理的实际情况,采用业务流程分析法和以现有信息系统为基 础直接提取的方法提取数据元。同时,考虑到陕西省公路建设、养护、管理的业务特点, 采用用户视图分析法对部分数据元进行抽取。最后对数据元的更新机制进行了研究,分 析了数据元的更新需求,给出了数据元更新的步骤,简述了数据元更新的保障机制。 论文的研究成果在陕西省交通信息资源整合工程中得到了应用,并将数据元标准在 全省公路行业内推广应用。应用表明,论文提出并编制的陕西省公路信息基础数据元集 对于消除信息孤岛、提高数据利用率,实现交通行业信息管理的规范统一等具有重要意 义。 关键词:公路信息、数据元、抽取方法、更新机制 a b s t r a c t a r e ry e a r so fc o n s t r u c t i o n ,1 1 i g h w a yi n f o m a t i o n i z a t i o n 、v o r ki ns h a a n x ip m v i n c eh a s a c l l i e v e dt h ep r e l i m i n a 巧r e s u l t h o 、e v e r , t h e p r o b l e mo f t h ei o n i l a t i o n i s o l a t i o n , n o n s t a n d a r dd a t af o r n l a t ,a n dl o wc l a t au t i l i z a t i o nc o m m o n l ye x i s t ,w m c hs e r i o u s l yr e s 饿c tt h e p r o g r e s so fi n f o r m a t i o n i z a t i o n b a s e do nt h ei n d e p t ha n a l y s i so ft h e 印p l i c a t i o ns i t u a t i o no f t r a m ci n f b m a t i o nt e c h l l o l o g ya th o m ea i l da b r o a da n dt h ec o i l s t n l c t i o nr e q u i r e m e n t so fd a t a e l e m e n t si ns h a a n x ih i g h w a yi n d u s t r y ,t h ec o m p i l a t i o np r i n c i p l e ,m ec l a s s i f i c a t i o na n dt h e c o d i n gm e t h o d ,t h ee x t r a c t i o nm e t h o d ,a n dt h eu p d a t i n gm e c h a n i s mo fs h a a n x ik 曲w a y i n f o m a t i o nb a s i cd a t ae l e m e n t ss e ta r et h o r o u g h l ys t u d i e di nt h et h e s i s f i r s to fa l l ,t h ec o m p i l a t i o ng e n e r a lm l e so fs h a a n x ih i g h w a yi n f o m l a t i o nb a s i cd a t a e l e m e m ss e ta r es t u d i e si nt h et h e s i s i tg i v e st h ec o n s t r u c t i o nf o u n d a t i o n ,t l l en o m “v e r e f e r e n c e s , t h es c o p eo fa p p l i c a t i o na n dt h ec o m p i l a t i o np r i n c i p l eo fs h a a n x ih i g h w a y i n f o m l a t i o nb a s i cd a t ae l e m e m ss e t o nt h eb a s i so ft h es u m m a 巧o fe x i s t i n gd a t ae l e m e n t c l a s s i f i c a t i o nm e t h o d ,t h et h e s i sp u t sf o r w a r da n ds e t su pa2 d c l a s s i 匆i n gm e t h o db a s e do n t h eb u s i n e s sa r e aa n dm a i l a g e m e n tl e v e lf o rs h a a r ih i 曲、v a yi n f o n n a t i o nb a s i cd a t ae l e m e n t s t h i st h e s i sf o c u s e so nt h er e s e a r c ho fc l a s s i 矽i n gm e t h o df o rc i a t ae l e m e n tb a s e do n m a n a g e m e n tl e v e la n db u s i n e s sa r e 钆p r o v i d e st 1 1 ed a t ae l e m e n t2 d - c l a s s i 匆i n gv i e w t h e t h e s i sa l s om a k e sad e t a i l e di n t r o d u c t i o nt od a t ae l e m e n te x t r a c t i o nm e t h o d i n t e g r a t e dw i t h a c t u a lc o n d i t i o n so fs h a a n x ih i g h w a yi n f o m a t i o n i z a t i o nc o n s t m c t i o na n dm a n a g e m e n to ft h e a c t u a ls i t u a t i o n ,t h em e t h o d so f b u s i n e s sp r o c e s sa n a l y s i sa n dd i r e c te x t r a c t i o no nt h eb 撕so f t h ee x i s t i n gi n f o m a t i o ns y s t e ma r ea d o p t e dt o e x t r a c td a t ae l e m e n t a tt h es a m et i m e , c o n s i d e r i n gt h ef e a t u 】r e so f h i g h w a yc o n s t m c t i o n ,m a i n t a i n sa n dm a n a g e m e n ti i ls h a a n 面,t 王l e t h e s i su s e st h eu s e rv i e wa n a l y t i cm e t h o dt oc a r r yo nt 1 1 ee x t r a c t i o nt ot l l e p a n i a ld a t a e l e m e n t s i i lt h ee n d ,t h eu p d a t i n gm e c h a n i s mo fd a t ae l e m e n ti ss t u d i e di nm i sp a p e r t h e t 置1 e s i sa n a l y z e st h eu p d a t er e q u i r e m e n t so fd a t ae i e m e n t ,a i l dg i v e nt h es t e p st 0u p d a t ed a t a e l e m e n t s ,t l l e ni n t r o d u c e sb r i e n yp r o t e c t i o nm e c h a n i s mf o rd a t ae l e m e n tu p d a t i n g t h er e s e a r c hr e s u l t si nt h i sp 印e rh a v e b e e na p p l i e di nt r a n s p o n a t i o ni o n l l a t i o n r e s o u r c ec o n f o m i t ) rp r o j e c ti ns h a a r i ,a n dt h ed a t ae l e m e ms t a n d a r dw i l lb ep r o m o t e dt h e a p p l i c a t i o ni nh i g h w a yp r o f e s s i o no ft h ee n t i r ep r o v i n c e t h e 印p l i c a t o ns h o w st h a ts h a a r i l l i g h w a yi n f 0 砷a t i o nb a s i cd a t ae l e m e n t ss e th a v et 1 1 ev i t a ls i g 面f i c a n c ei ne l i m i n a t i n gt h e i n f b m l a t i o ni s o l a t e d i s l a l l d ,i m p r o v i n g d a t au t i l i z a t i o nr a t i o ,a n dr e a l i z i n gl l l l 嫡e da n d s 伽1 d a r d i z e dt r a 伍ci n d u s t 巧i 1 1 f i o m l a t i o nm a n a g e m e n t k e y w o r d s : h i g h w a yi o 肌a t i o n ; d a t ae l e m e n t s ;e x t r a c t i o n m e t h o d ;u p d a t i n g m e c h a n i s m 论文独创性声明 本人声明:本人所呈交的学位论文是在导师的指导下,独立进行研究工 作所取得的成果。除论文中已经注明引用的内容外,对论文的研究做出重 要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何 未加明确注明的其他个人或集体已经公开发表的成果。 本声明的法律责任由本人承担。 论文作者签名: p妒 年6 月加 论文知识产权权属声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属学 校。学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权 利。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成 果时,署名单位仍然为长安大学。 ( 保密的论文在解密后应遵守此规定) 论文作者签名: 导师签 f 7 蝴 名:易弼影韬:以卿暂妖母- 细7 年6 月v 日 钐矽年月2 日 长安人学硕上学位论文 1 1 研究背景 第一章绪论 以信息化带动工业化,以工业化促进信息化,是我国经济建设和改革的一项长期战 略。经过2 0 多年的努力,我国的信息化建设取得了令人瞩目的成就。但是由于信息技 术本身发展的一些限制,也存在很多问题。在信息化建设的初期阶段,许多部门根据自 身情况,建立了一系列为自身服务的应用系统等,但由于相互之间的技术标准、行业标 准等不一致,导致各部门之间信息不能共享,这就是“十五 期间我国各行各业在总结 信息化问题时,提到的最频繁的一个问题信息孤岛【1 卅。“系统整合”【7 1 1 1 也是 “十五 期间针对“信息孤岛问题时被提到最多的一个词。系统整合是通过统一标准, 对现有系统进行改造,从而提高系统的服务能力,保护现有成果和投资。可以清楚地看 到,在一些信息化进展较快的部门,对各种已建的应用系统的整合成为了一个最热门的 话题。而在信息化进展慢一些的部门,已经在考量是否停下刚建不久的独立系统重新建 设。甚至,在一些起步晚的部门,如一些地方政府,从信息化建设之初就丌始基于信息 共享来实施【眩】。 交通行业信息化建设经过若干年的努力,已建立了一批技术含量高、实用的专项业 务管理信息系统和政府部门的办公业务系统【1 3 以6 】,这些系统为行业信息化建设奠定了基 础。与其它行业一样,由于当时的认知水平所限,大多数系统在建设时仅仅是为了解决 某些具体、局部的问题,因此各系统基本上是独立工作的。在公路交通方面,现有的建 设管理、养护管理、收费【1 7 】、监控【1 8 - 19 1 、通信【2 0 】、路面2 1 1 、桥梁管理【2 2 - 2 3 1 、路政管理 和紧急事件管理【2 4 】等系统已广泛应用,它们已积累了大量的信息,但信息孤岛、应用孤 岛、数据利用率低2 5 1 等问题普遍存在。因此,交通行业的系统整合也迫在眉睫。 在这种大的行业背景下,2 0 0 5 年交通部开始组织实施“省级公路交通信息资源整合 工程”【2 6 】,成为三大信息化建设示范工程之一,该示范工程与部级公路业务信息资源整 合工程密不可分。资源整合包括以下几个方面的内容:1 ) 物理资源的整合;2 ) 数据资 源的整合;3 ) 应用系统的整合;4 ) 建设人才的整合。整合的最终目标是为交通行业各 级政府部门、企事业单位、社会服务机构提供一个信息交流、内部协作、提升原有资源 价值的平台,特别是同时形成一个政府为广大老百姓提供高质量的办公、信息服务的平 第一章绪论 台。示范工程由江苏、浙江、山东、成都、北京等省市承担,示范工程对于解决存在的 信息孤岛、应用孤岛的问题起到了重要的作用。 陕西省信息化工作经过了多年的建设,也取得了许多成果,例如全省公路路况信息 服务系统、陕西公路信息网站应用系统、省公路局人力资源管理系统、省公路局设备管 理系统、全省建设项目动态管理系统等。但是,信息孤岛、应用孤岛、数据格式不规范 的问题同样存在。 系统整合的基础是数据标准化,交通部出台了交通信息基础数据元规范,示范工程 各省也根据本省的情况制定了相关的规范。但是,各省都有自身的特殊情况,因此,急 需根据陕西省的具体情况,依据国家和行业相关规范、标准,制定陕西省的数据元规范, 并建立相应的检索系统,规范陕西省的交通信息化工作,为本省的信息化建设提供服务。 1 2 数据元研究和发展现状 1 2 1 国外研究现状 国际上在数据元的理论研究方面,从2 0 世纪6 0 年代开始起步,其间,国际标准化 组织( i s o ) 成立了数据元及其编码表示工作组( t c 9 7 w g k ) ,后升级为“数据元表 示法”分技术委员会( t c 9 7 s c l 4 ) ,s c l 4 调查了各国以及国际间已应用或准备应用的 数据元编码的内容和结构,制定了有关描述数据元和数据交换中涉及数据元表示法的国 际标准以及数据标准协调一致问题,制定了有关指南和规范。到目前为止,已经正式公 布了1 4 项标准,包括i s 0 2 9 5 5 :1 9 8 3 ,信息处理国际单位制和其他单位的表示; i s 0 6 5 2 3 :1 9 8 4 ,数据交换_ 组织表示法的结构;i s 0 6 7 0 9 :1 9 8 3 ,用于地理定位的纬 度、经度和高度的标准表示法:i s 0 5 2 1 8 :1 9 7 7 ,信息交换人的性别表示法;i s 0 7 0 6 4 : 1 9 8 8 ,数据处理检验字符系统;i s o i e c 7 8 2 6 1 :1 9 9 4 ,信息技术代码值交换的 总体结构;i s o i e c 9 7 8 9 :1 9 9 4 ,信息技术用于数据交换的数据元表示和组织的导 则编码方法和原则【2 7 1 ,近期制定的标准包括:i s 0 i e c ,1 l1 7 9 1 :1 9 9 9 ,信息技术, 数据元的规范和标准化,第1 部分:数据元规范和标准化框架;i s o i e c1 1 1 7 9 2 :2 0 0 0 , 信息技术,数据元的规范和标准化,第2 部分:数据元分类;i s o i e c1 11 7 9 3 :1 9 9 4 ,信 息技术,数据元的规范和标准化,第3 部分:数据元的基本属性;i s o i e c1 11 7 9 4 :1 9 9 5 , 信息技术,数据元的规范和标准化,第4 部分:数据定义格式的规则和指南;i s o i e c 2 长,安大学硕士学位论文 1 1 1 7 9 5 :1 9 9 5 信息技术,数据元的规范和标准化,第5 部分:数据元命名和标识规则; i s o i e c1 1 1 7 9 6 :1 9 9 7 信息技术,数据元的规范和标准化,第6 部分:数据元的注册等。 1 2 2 国内研究现状 我国从1 9 8 3 年成立了全国计算机与信息处理标准化技术委员会数据元表示分技术 委员会,委员会积极参与各项国际标准化活动,多年来取得了丰硕的成果,交通基础数 据元采用的国家标准包括:g b 厂r1 1 2 0 0 0 标准化工作导则第1 部分:标准的结构和编 写规则;g b t1 2 2 一1 9 9 3 标准化工作导则第2 单元:标准内容的确定方法第2 2 部分: 引用标准的规定;g b t1 3 0 1 6 一1 9 9 1 标准体系表编制原则和要求:g b t1 5 6 2 4 1 1 9 9 5 服务标准化工作指南第l 部分:总则;g b t1 7 2 9 8 1 9 9 8 单证标准编制规则;g b t 2 0 0 0 1 3 2 0 0 1 标准编写规则第3 部分:g b t7 0 2 7 2 0 0 2 信息分类编码;信息分类和编 码的基本原则与方法等。 在数据元建立方法研究方面,欧阳毅【2 8 】以信息系统的数据重构过程为背景,围绕快 速、准确提取数据元的需求,对面向信息系统需求的数据元提取方法进行总结与归纳。 高贵锦2 9 1 等提出了用数据元自底向上维护数据标准的方法,结合数据元在专利电子申请 中的具体应用,设计了数据元的元数据属性,给出一套对数据元进行描述和维护以及基 于其上信息抽取的方法,定义了数据元到x m l s c h e m a 的映射规则,设计了x m l s c h e m a 辅助生成的算法。 在行业应用方面,金水耐3 0 1 等对公共卫生行业的数据元进行了研究;王殷【3 l 】等对产 品数据管理方面的数据元采用国际规范,采用自顶而下的顺序建立了数据元字典;魏宏 【3 2 1 等在电子政务方面探讨了数据元的概念和应用;孙翠羽【3 3 】等参考国际标准化组织( i s o t c 2 1 1 ) 元数据标准、美国联邦地理数据委员会( f g d c ) 的c s d g m 以及中国可持续发 展信息共享元数据标准,制定了能够描述测绘空间数据的元数据标准,并设计实现了测 绘空间数据元数据管理系统。 1 3 交通信息基础数据元研究和发展 交通部在信息标准化建设方面的工作主要包括:制定了交通行业信息标准体系表 【3 4 1 ,2 0 0 5 年底颁布了交通信息基础数据元系统【3 5 1 ,2 0 0 7 年l o 月颁布了交通信息 基础数据元前5 部分并进行了宣贯,以及一系列i t s 、e d i 和物流技术标准。这些标 3 第一章绪论 准为规范行业信息化建设、促进行业信息资源有效整合提供了重要手段。各省在信息化 示范工程中,也制定了省级的规范,例如山东省交通信息资源中心数据元标准、江苏省 交通信息数据库建设规范等,为各省的信息化建设工作提供了有益的指导。 在交通信息基础数据元集标准中,交通部对交通基础数据按照业务领域,分为公路、 车辆、港口、航道、船舶五大类【3 6 1 。其中公路基础数据元集又细分为八大类:综合统计、 路线概况集、路基集、路面集、主要构造物集、沿线设施集、交通量集、沿线环境集等。 山东、浙江等省建立的数据元标准以交通部的为基础并基于本省急需开展的应用进行了 细化,基本结构与交通部的标准保持一致。在数据元查询系统建设方面,交通部建立了 交通基础数据元查询系统,可以进行远程查询。 但从现有的成果来看,交通行业基础数据元研究由于时间紧,任务重,尚有许多问 题急需解决。 1 4 陕西省公路基础数据元的研究需求 1 4 1 建设和养护管理基础数据元 根据国家高速公路网规划,我国高速公路网总规模将达到8 5 万公里。而目前开通 大约为4 5 万公里,在全国范围内,高速公路的建设任务依然繁重。陕西省共有6 条公 路列入了国家高速公路网规划,规划里程总长约3 0 1 0 公里。根据陕西省高速公路规划, 省级高速公路总规模将达到4 1 0 0 公里。但截至目前,陕西省开通高速公路里程大约2 0 0 0 公里,因此,陕西省的高速公路建设任务也非常艰巨。公路建设和养护周期长、投资大、 涉及人员多、社会影响面广,因此,公路建设和养护管理复杂度很高。这就要求更多地 利用信息系统为公路管理服务,提高管理效率。 陕西省公路局作为陕西省公路行业管理部门,关于公路建设和养护信息化的工作尚 处于建设阶段,目前,正在规划中的“陕西省公路管理信息平台”将整合现有的建设、 养护和管理系统,对现有的系统进行规范,消除信息孤岛【3 7 1 。其建设任务大,复杂度高。 数据元是为信息系统建设的基石,因此,陕西省公路建设和养护业务和管理系统对 建设、养护和管理类数据元的建设要求是非常迫切的。交通部目前正在编制建设项目数 据元,从现有数据元在资源整合省份的实施情况来看,其现有数据元在各省实施时,需 要根据本省的情况进行扩充,例如山东、江苏等都推出了自己的数据元,因此,陕西省 4 长安大学硕士学位论文 从自身业务角度出发,与交通运输部建设项目进行沟通交流,并研究本省的数据元规范 是可行的、必要的。 1 4 2g i s 数据元 地理信息系统( 以下简称g i s ) 是集现代计算机科学、地理学、信息科学、管理科 学和测绘科学为一体的一门新兴学科。它采用数据库、计算机图形学、多媒体等最新技 术,对地理信息进行数据处理,能够实时准确地采集、修改和更新地理空间数据和属性 信息,为决策者提供可视化的支持。g i s 突破了常规关系数据库管理的概念,集图形管 理与数据管理于一身,具有很强的空间表现力,它将空间数据处理、属性数据处理、空 间分析与模型分析与计算机技术紧密结合,通过数据准备、系统建立、空间分析与模型 分析,产生对资源环境、区域规划、管理决策、灾害防治等有用的信息。在公路管理中, g i s 与传统的交通信息分析和处理技术紧密结合延伸出了公路地理信息系统。公路地理 信息系统在公路的规划与建设、养护管理等方面具有较强的应用价值。 陕西省公路行业已经建立了自身的g i s 系统,即陕西省公路路况信息服务系统。该 系统以可视化的方式动态显示、查询和管理各级公路,实现公路管理信息的采集、存储、 分析与实际应用,公路信息互联网发布等功能,为公路建设和养护管理提供信息及决策 支持。它主要分为以下三个子系统:1 ) g i s 查询分析子系统:该系统可将地理空间数 据和各类公路属性数据动态关联,实现公路及其附属设施各类信息的实时查询、统计、 显示和最佳路径分析、桥梁过载分析。2 ) 公路属性数据管理子系统:完成下级单位上 报数据的校验、编辑、入库和备份,以及向上级部门提交各类数据报表等功能。3 ) 公 路信息的互联网发布子系统:以w e b g i s 为技术手段,将陕西省与公路相关的主要信 息以互联网的形式向社会发布。 除了在现有的路况信息查询中的应用外,g i s 系统在公路行业中的应用非常广泛, 可能的应用包括:g i s 在智能交通管理中的应用;g i s 在公路管理、建设、养护中的应 用;g i s 在运输调度中的应用;g i s 在公路交通应急处置中的应用;g i s 在公众服务中 的应用;g i s 在行业综合监管中的应用;g i s 在行业运行分析中的应用;g i s 在领导辅 助决策中的应用等。因此,本论文将建立公路g i s 系统的数据元,为陕西省公路g i s 的应用进行规范。 根据对交通运输部交通基础信息数据元课题组的调研,部里目前尚没有进行g i s 数 5 第一章绪论 据元建立的计划,因此,本部分的研究同时可为部标准作出贡献。 1 4 3 面向多维的层次数据元体系的建立 从公路的生命周期来看,主要包括建、养、管三大部分,标准中的数据元按照 行业的业务领域进行分类,在公路信息( 第2 部分) 、道路运输信息( 第7 部分) 、建设 项目信息( 第9 部分) 、交通统计信息( 第1 0 部分) 、收费公路信息( 第1 3 部分) 五个 部分中给出了公路相关的、普适的数据元的定义,对于各省的公路交通信息化具有重要 的指导作用。但是,( 1 ) 从数据元的建设初衷来看,数据元是为信息系统服务的,信息 系统是为管理服务的,管理有其共性也有特殊性,因此,在陕西省应用应结合本省的管 理实际;( 2 ) 各省的信息化程度不同,对数据元的需求也不同,例如,对于陕西省急需 建立的公路桥梁养护管理和监测系统等,现有标准中只有少量的桥梁几何属性可以参 考。因此,只有站在本省角度对在公路建、养、管信息化过程中涉及到的海量数据元, 按照管理层次和业务系统建立需求进行梳理,对本省信息系统建设所需的数据元进行补 充,对省级代码进行编制,才能真正起到数据元对本省信息化建设的指导作用。本文提 出基于管理维度的数据元分类的思想,正是站在陕西省公路建、养、管的角度,加强和 深化交通部数据元规范,使其能在陕西省公路行业真正应用。 基于管理维度的思想也符合日常管理习惯和数据元建设中急需先行的原则。这是由 于管理具有层次性,每层的管理实体关心的信息粒度级别不同。因此,海量的数据元可 以按照管理层次进行划分。层次越高,数据元越少,越容易规范,但是对行业的引导作 用越大。因此,可以首先制定高管理维度的数据元规范。也就是本论文提出的基于管理 维度的数据元分类的基本思想。 1 5 本论文的研究内容 本研究课题受陕西省交通厅科研项目支持。论文主要研究陕西省公路信息基础数据 元集的编制,着重对数据元的编制总则、数据元的分类方法进行了研究,对数据元抽取 的方法进行了介绍并提出了陕西省公路信息基础数据元的抽取策略,论文还对如何建立 数据元的更新机制进行了研究,从而更有效的实现数据元的集成应用和快速更新,保证 数据元标准的时效性。文章主要完成了如下工作: 第一章介绍了本文的研究背景,数据元的国内外研究和发展现状,简述了交通信息 6 长安人学硕上学位论文 基础数据元的发展情况,指出了交通行业基础数据元还有许多问题急需解决,从陕西省 公路信息基础数据元的研究需求出发分析了本研究的必要性。最后提出了本文的研究内 容。 第二章根据国家的相关标准,对数据元建设的理论和方法进行总结,为本论文研究 提供理论指导。 第三章对陕西省公路信息基础数据元集的编制总则进行研究,介绍了陕西省公路信 息基础数据元编制的适用范围,陕西省公路信息基础数据元编制原则,陕西省公路信息 基础数据元建设依据和规范性引用文件,并对数据元的基本术语和定义进行了整理。 第四章对陕西省公路信息基础数据元采用按照业务领域和按照管理层次进行二维 分类,并对陕西省公路信息基础数据元的编码方法进行了设计。首先对交通部和其他省 市的数据元分类方法进行研究和比较,对其分类方法的优缺点进行了综述,在总结现有 分类方法的基础上,提出了按照业务领域和按照管理层次对陕西省公路信息基础数据元 进行二维分类。然后重点研究了基于管理层次的数据元分类方法和基于业务领域的的数 据元分类方法,最后给出了数据元的二维分类模式,设计了其编码方法。 第五章对陕西省公路信息基础数据元的抽取方法进行了研究。详述了数据元四种抽 取方法,针对陕西省公路建设、养护和管理的模式,采用业务流程分析法、从应用信息 系统出发直接提取的方法、用户视图分析法提取并分析需要标准化的数据元。最后对数 据元的属性进行了确定,首次在数据元的属性中引入推荐字段名属性和管理分类性,并 对其属性内容进行了确定。 第六章对数据元的更新机制进行了研究。首先对数据元更新的必要性进行了综述, 研究了数据元更新需求的三个来源,提出了数据元更新的原则,详细描述了数据元的更 新步骤,最后为了保障数据元标准化的持续进行,给出了数据元更新维护的保障机制。 最后,对本文的研究工作进行总结,并对未来的研究方向提出建议。 7 第二章数据元理论基础 第二章数据元建设的理论基础 根据国家相关标准,本章对数据元建设的理论和方法进行总结,作为本论文研究 的理论指导。 2 1 数据元基本概念 1 数据元定义 中文定义:数据元( d a t ae l e m e n t ) 【3 8 】,是指用一组属性描述其定义、标识、表 示和允许值的数据单元。在特定的语意环境中被认为是不可再分的最小数据单元。 英文定义:t h et e r n ld a t ae l e m e n ti sa i la t o m i cu n i to fd a t at h a th a s :( 1 ) a n i d e n t i f i c a t i o ns u c ha sad a t ae l e m e n tn a m e :( 2 ) ac l e a rd a t ae l e m e n td e f i n i t i o n ;( 3 ) o n eo r m o r er e p r e s e n t a t i o nt e r m s ;( 4 ) o p t i o n a le n 啪e r a t e dv a l u e sc o d e ( m e t a d a t a ) ;( 5 ) al i s to f s y n o n y m st od a t ae l e m e n t si no t h e rm e t a d a t ar e g i s t r i e ss y n o n y mr i n g 【3 9 】 2 元数据定义 元数据( m e t a d a t a ) 【4 0 】是描述和限定其它数据的数据,元数据的典型实例有数据 的重要特征,如“作者名称”、“出版年 等,有助于信息检索的数据,如文本描述“信 息摘要”信息的关键词和分类名称等,以及用于数据定位的数据,如图书分类卡片“书 籍的完全说明”、“磁盘的标签”等。 3 数据元与元数据的关系 数据元本身也是数据。数据元规范是一个用来对各行业的数据进行规范的方法或 理论,使用该理论对行业数据进行统一的名、型、值定义及分类。从定义来看数据元 是组成数据的最小单元,是基本的。就像化学元素一样,化学元素本身并不多,即几 十种,但由这几十种元素构成的物质可是形形色色。所以对于一个行业来讲数据元应 该是有限的。理解数据元应该从它的几个性质来认识: ( 1 )原子性:即说明数据元具有原子特征,即是组成数据最小单元。例如“金额” 本身就是一个基本数据元,“产量”,“重量”、“密度”等等。 ( 2 ) 集成性:按照数据本身自然联系建立数据间的关联关系,体现出了数据的集 成性。同时,通过对数据元的分析,对数据的分类具有重要的指导作用。 8 长安大学硕士学位论文 ( 3 ) 演绎性:说明可由基本数据元演绎或派生出许许多多的应用数据元,继上面 的实例: 煤产量、原油产量、钢产量等,或更细致地可以演绎出:煤年产量煤月产量煤 季产量煤累计产量等。 从上面的讨论可以看出,数据元由基础数据元与应用数据元之分,所以一般来讲, 我们就是指基础数据元。 可以看出,行业数据元是有限的,规划好行业数据元之后,可以为行业构建出统 一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。更重要的是 在逻辑层上为我们提供了一个统一的“参考模型”。以前存在的一些模型中的数据与其 它模型进行共享时,可以在这个逻辑的“参考模型”一层上得到统一。 而所谓的元数据是“描述数据的数据”。例如,描述数据元有二十几个属性,即这 二十几个属性( 例如数据元名称、定义、类型等) ,都可以称为是描述数据元的元数据。 d b m s 中的表结构、索引、字典、报表格式等均为描述数据库中数据的元数据,所以 可以看出,元数据( m e 谢a t a ) 与数据元( d a t ae l e m e n t ) 不是一个层面上的概念。 4 数据元的作用 图2 1 各数据层级的数据元 9 第二章数据元理论幕础 图2 1 是数据层级的简化表示,表明数据元所在的那些层。数据元出现在数据库、 文件和事务集中。数据元是一个组织管理数据的基本单元,因而它必然是组织内部数 据库和文件设计,并用于建立与其它组织交流的事务集的组成部分。 在组织内部,数据库或文件由记录、段和元组等组成,而记录、段和元组则由数 据元组成。数据元本身包含有字符、图像、声音等多类数据。 一个组织需要将数据传输给其它组织时,数据元构成了事务集的基本单元。事务 主要发生于数据库间或文件间,但组织问的文件和数据库结构( 如记录或元组) 并不 一定相同。信息( 数据加上理解) 传输的公共单元是数据元。 当数据元提取出来以后,在注册机构注册,形成数据元库,经过一定时间的积累 和完善后,应用系统数据层面的工作就是利用数据元库中的数据元组织数据结构,例 如,数据库的结构,数据交换格式等。从而保证系统建设时属性层面的数据是一致的, 为各种共享和数掘即成奠定基础。其作用表现在以下几个方面: 统一数据的名称和定义; 统一数据格式; 有利于实现系统之间的数据交换; 便于数据结构的建立等。 2 2 数据元的表示 1 数据元基本属性 数据元表示规范是通过描述数据元的一系列属性来实现的。常用的数据元属性参 见表2 1 。纵列“约束 表示:在数据元字典中,一个属性是“必选( m ) ”,还是“条 件选( c ) ,或者是“可选( o ) ”。 表2 1 数据元属性 属性种类数据元属性名称 约束 标识类 m c c c o c 名称标识符版本注册机构同义名 称相关环境 定义类定义 m 分类模式关键字( 词) 相关数据参照 关系类 关系类型 o o oc 表示类别表示形式数据元值的数据类型 表示类 数据元值的最人长度数据元值的最小长度表示格m m m m m c m 式数据元允许值 管理类 责任机构注册状态提交机构备注 0co o 1 0 长安大学硕十学位论文 2 数据元属性描述符 数据元属性应依照一种标准方式来注册和控制,以便数据元字典中的数据元在信 息交换中保持一致性,并且能够在不同的数据管理环境中进行数据元比较。表2 2 给 出了关于描述数据元属性的常规描述符集。纵列“约束”表示描述数据元属性时,一 个描述符是“必选( m ) ,还是“条件选”( c ) ,或者是“可选”( o ) 。 表2 2 常规描述符 属性描述符约束 名称( 中、英文)m 定义m 约束m 条件 c 最多实例数 o 数据类型m 最大长度 o 字符集 c 语言 c 备注 o 3 标识类属性描述 ( 1 ) 名称:数据元名称 定义:赋予数据元的单个或多个中文字词的指称 约束:必选 出现次数:1 :1 数据类型:字符串 ( 2 ) 名称:中文全拼。 定义:数据元中文名称的汉语拼音 约束:必选 出现次数:1 :1 数据类型:字符串 ( 3 ) 名称:版本 定义:在一个注册机构内的一系列逐渐完善的数据元规范中,某个数据元规 范发布的标识 11 第二章数据元理论基础 约束:必选 出现次数: 1 :1 数据类型:字符串 ( 4 ) 名称:注册机构 定义:经主管部门授权对数据元实施注册、维护和管理功能的组织 约束:必选 出现次数:l :1 数据类型:字符串 4 定义类属性描述 名称:定义 定义:表达一个数据元的本质特性并使其区别于所有其他数据元的陈述 约束:必选 出现次数:1 :1 数据类型:字符串 5 表示类属性描述 ( 1 ) 名称:数据类型 定义:用于表示数据元的符号、字符或其他表示的类型 约束:必选 出现次数:1 :1 数据类型:字符串 备注:表2 3 包括了数据类型可能的取值列表,但不限于下表中所列 表2 3 数据类型可能的取值列表 数据类型 说明 字符型( s t r i n g )通过字符形式农达的值的类型 数字型( n u m b e r )通过“0 ”到“9 ”数字形式表达的值的类型 通过y y y y m m d d 的表达形式表达的值的类型,符合 日期型( d a t a ) g b t 7 4 0 8 通过y y y y m m d d h h m m s s 的表达形式表达的值的类型,符 日期时问型( d a t a t i | 1 1 e ) 合g b t 7 4 0 8 布尔型( b o o l e 锄)两个且只有两个表明条件的值,如o n o f f 、t r u e f a l s e 二进制( b i n a r y )上述无法表示的其他数据类型,比如图像、音频等 1 2 长安大学硕士学位论文 ( 2 ) 名称:数据格式 定义:从业务的角度规定的数据元值的格式需求,包括所允许的最大和或 最小字符长度,数据元的表示格式等( 一个汉字占两个字符) 。 约束:可选 出现次数:o :1 数据类型:字符串 备注:1 数据格式中使用的字符含义如下: a ) a = 字母字符 b ) n = 数字字符 c ) a n = 字母数字字符 d ) m ( m = 为自然数) = 定长m 个字符( 字符集默认为g b 2 31 2 ) e ) u l = 长度不确定的文本= 从最小长度到最大长度,前面附加最小长度,后面 附加最大长度; f ) y y y y m m d d h h m m s s = “y y y y 表示年份,“m m ”表示月份,“d d 表 示日期,“h h ”表示小时,“m m ”表示分钟,“s s 表示秒,可以视具体实际 情况组合使用。 g ) “, = 区分数字字符个数与小数点后数字位数的分隔符,即“,”前为数 字字符个数,“,”后为小数点后数字字符个数。 例l :a 1 1 5 表示定长5 个字母数字字符。 例2 :a n 3 8 表示最大长度为8 ,最小长度为3 的不定长字符。 例3 :n 8 ,4 表示该数值最大长度为8 位整数、4 位小数。 ( 3 ) 名称:值域 定义:根据相应属性中所规定的数据类型、数据格式而决定的数据元的允许 值的集合,是该数据元内容的代码取值。 约束:必选 出现次数:l :1 数据类型:字符串 备注:该集合可以通过以下四种方式给出: 1 3 第二章数据元理论基础 a 1 通过名称给出,即直接指出值域的名称,比如数据元“两字母国家代码 的值域是g b t2 6 5 9 全部两字母代码;世界各国和地区名称代码中 的全部两字母代码; b ) 通过参考资料给出,比如数据元“产品条码 的值域是已经在物品编码 中心注册的所有产品的条形码; c ) 通过一一列举的方式给出所有可能的取值以及每一个值对应的实例或含 义,以列表形式表示。 d ) 通过规则间接给出,比如数据元“隧道代码的值域是“公路隧道代码 采用j t gb 0 1 的规定;公路隧道编号以其所在的省级行政区划的路线为 基础,自路线起点至终点顺序编制;位于上、下行路段上的公路隧道分 别单独编号。 除以上四种方式外,也可对值域不做要求。 ( 4 ) 名称:计量单位 定义:属于数值型的数据元值的计量单位 约束:可选 出现次数:0 :1 数据类型:字符串 6 管理类属性 名称:状态 定义:数据元在其注册的全生存期内所处状态的标示 约束:必选 出现次数:1 :1 数据类型:字符型 备注:数据元在其注册的全生存期内包括四种阶段: a ) 草案:该数据元的内容处在草案阶段,相关单位和部门可以广泛提出意 见和建议: b ) 试用:该数据元的内容经过一定的技术程序,可以在一定范围内进行试 用,并反馈实验意见; 1 4 长安大学硕十学位论文 c ) 标准:该数据元的所有内容已经成为各方应当遵守的标准; d ) 废止:该数据元的内容即将从标准中删去。 7 附加类属性 ( 1 ) 名称:备注 定义:数据元的附加注释 约束:可选 出现次数:0 :1 数据类型:字符串 备注:在上述属性未能描述的其他注释 ( 2 ) 名称:自定义属性 定义:数据元的附加属性,用来表示管理分类 约束:必选 出现次数:1 :1 数据类型:数字型 备注:长度为6 位,使用第1 ,2 位表示管理分类,其他4 位保留,默认 置0 ( 3 ) 名称:推荐字段名属性 定义:自动生成字

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论