(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf_第1页
(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf_第2页
(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf_第3页
(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf_第4页
(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(计算机应用技术专业论文)彩色地形图点状地物符号的提取与识别.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

彩色地形图点状地物簦等的提取与识别中文摘要 彩色地形图点状地物符号的提取与识别 中文摘要 地理空间数据对数字城市的建设至关重要,将现有的地形图数字化,并对地图要 素进行自动提取和识别以获得地理信息,是获得地理空间数据的一种低廉而高效的方 法,在今后相当长的一段时间内仍将是数字地理信息的主要来源之一。 本文针对彩色地形图点状地物符号的自动提取和识别作了具体的研究工作。本文 首先分析了人阅读地图的过程,并利用模式识别理论分析了计算机阅读地图过程,在 此基础上对地图识别的总体框架进行了设计,采用二次去嗓模型,提高了彩色图像处 理的效果。 地形图经扫描后,采用非线性各向异性扩散方法对彩色图像进行平滑处理,以提 高彩色图像的质量。通过对各种颜色空间的比较,选择了适合彩色地形图分割的 1 1 1 2 1 3 颜色空闻,并利用模糊c 均值聚类方法在颜色链表的直方圈上完成了对彩色 地形图的自动分色,得到了黑、棕、蓝、绿四个要素图。要素图经二值化后,用数学 形态学方法对其进行二次去噪,修补断点,去除孤立点、毛刺,为后续的识别打下基 础。对细化的二值要素图进行矢量化操作,得到矢量化数据。最后使用统计方法和神 经网络方法实现了点状她物符号的识别。 关键词:地形图自动分色地图模式识别点状符号数字图像处理 作者:周蓓蓓 指导教师:龚声蓉 英文摘要 彩色地形图点状地物符口的提取与识别 r e s e a r c ho na u t o m a t i ce x t r a c t i o na n dr e c o g n i t i o no f c o l o r t o p o g r a p h i cm a p p o i n ts y m b 0 1 a b s t r a c t g e o g r a p h i cs p e c i a ld a t ai sac r u c i a lp a r ti nc y b e r c i t yc o n s t r u c t i o n c o n v e r t i n gt h e o l dm a p st o d i g i t a lf o r m a ta n de x t r a c t i n gm a p s e s s e n t i a l s ,r e s u l t i n g i n a c h i e v i n g g e o g r a p h i ci n f o r m a t i o n ,i st h eo n eo ft h ee c o n o m i ca n de f f e c t i v ew a y s a n di tw i l lb ea m a i ns o u r c eo fd i g i t a lg e o g r a p h i ci n f o r m a t i o nf o ral o n gw h i l ef r o mn o wo n t h i st h e s i sr e s e a r c h e dt h ea u t o m a t i ce x t r a c t i o na n dr e c o g n i t i o nt o p o g r a p h i cp o i n t s y m b o li nd e t a i l a tf i r s t ,i ta n a l y z e dt h ep r o c e s so fh u m a nr e a d i n gm a p s ,a n dt h e nu s i n g m o d er e c o g n i t i o nt h e o r y , i ta l s oa n a l y z e dt h ep r o c e s so fc o m p u t e rr e a d i n gm a p s b a s e d o na b o v et w oe f f o r t s ,t h et h e s i sd e s i g n e dt h ew h o l ef r a m eo fm a pr e c o g n i t i o n i no r d e rt o i m p r o v et h ec o l o rm a pp r o c e s sr e s u l t ,i te m p l o y e d2 - s t e pn o i s ei m m u n i t ym o d e l a f t e rm a ps c a n n i n g ,t h ei m a g ee f f i c i e n c yc a nb ei m p r o v e d b ys m o o t h i n gt h ec o l o rb y t h em e a n so fn o - l i n e a rw a ya n dd i f f e r e n tc h a r a c t e r si nd i f f e r e n td i r e c t i o n c o m p a r i s o no f v a r i o u sc o l o rs p a c ea r em a d e t h u si1 一1 2 - 1 3c o l o rs p a c ei sc h o s e na st h ea p p r o p r i a t eo n e s u i t a b l ef o rc o l o rs p a c es e g m e n t a t i o n t h ef u s s ycm e a n sc l u s t e r i n ga u t o m a t i c a l l ys e g m e n t t h ec o l o rt o p o g r a p h i cm a p s ,g e n e r a t i n gf o u rc o l o re s s e n t i a le l e m e n t ss u c ha sb l a c k ,b l o w n , b l u ea n dg r e e n f o r m a t t i n gt h e s ee s s e n t i a le l e m e n t si n t ot w ov a l u e s ( 0o r1 ) ,m a t h e m a t i c m o r p h o l o g yi si m p l e m e n t e d t od e c r e a s en o i s e ,w h i c hb e n e f i tt h ef o l l o w i n gi m a g e r e c o g n i t i o n t h ep r o c e s s e de l e m e n t sa r ev e c t o r i z e da f t e rt h i n n i n g t h es t a t i s t i cm e t h o da n d a r t i f i c i a ln e u r a ln e t w o r k sa r ee m p l o y e dt or e c o g n i z et h ep o i n tt o p o g r a p h i cs y m b o li nb l a c k e l e m e n tm a p k e y w o r d s :t o p o g r a p h i cm a p ;a u t o m a t i cc o l o rs e g m e n t a t i o n ; m 印p a t t e r nr e c o g n i t i o n ;p o i n ts y m b o l ;d i g i t a li m a g ep r o c e s s i n g i i w r i t t e n b y :z h o ub e i - b e i s u p e r v i s e db y :p r o f e s s o rg o n gs h e n g r o n g 苏州大学学位论文独创性声明及使用授权的声明 学位论文独创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进 行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 其他个人或集体己经发表或撰写过的研究成果,也不含为获得苏州大学 或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律 责任。 研究生签名:避日 研究生签名: 墼j 监匦日期:狮子弓p 学位论文使用授权声明 苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文 合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本 人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分 内容。论文的公布( 包括刊登) 授权苏州大学学位办办理。 研究生签名: 导师签名: 胆日 监日2j 2 u 彩色地形图点状地物符号的提取与识别第一章绪论 第一章绪论 1 1 研究背景及意义 美国人w i l i a mg i n s o n 在其1 9 8 4 年出版的著名科幻小说精神人中第一次提 出赛博空间( c y b e r s p a c e ) 的概念,他将赛博空间定义为由计算机生成的景观,是连 接世界上所有人、计算机和各种信息源的全球计算机网络的虚拟空间。很明显,赛博 空间不是我们生存的空间,它是一个庞大的、具有各种各样信息的数据集合体,是一 个全新的计算机网络空间。由于城市在现代社会中的重要地位,赛博空间的一个最主 要子集就是c y b e r c it y ,我们将其称为数字城市n 1 。 数字城市是对现实城市中自然和社会活动的三维、多时期基于网络的数字再现, 它的应用遍及城市的各行各业和方方面面,包括政务系统、城市规划、市政管理、房 地产管理、城市交通、环境保护,园林绿化、环境卫生、公安消防、网上医疗、电子 银行、远程教育、智能小区管理、电子商务、网上图书馆、网上旅游、网上娱乐节目 点播、房地产交易等等,对一个国家或地区的现代化、信息化水平的提高具有重要战 略意义。城市的现代化、信息化水平和数字化程度已经成为衡量一个国家和地区融入 全球化进而提升经济社会实力和知名度的标志。 数字城市建设是一项十分复杂庞大的系统工程,其工程的复杂程度和规模之大并 不亚于物质城市( 现实城市) 的建设。在整个数字城市的构建中,信息基础设施是其 基础。没有扎实雄厚的信息基础设施做支撑,数字城市就是空中阁楼。数字城市的信 息基础设施包括两个方面:一是网络与通信基础设施;二是数据基础设施。两者作为 数字城市的基础缺一不可:没有网络与通信基础设施,数据无法快速传输和交换,信 息无法共享;没有数据基础设施,网络与通信基础设施就失去了存在的价值。网络与 通信基础设施同数据基础设施的关系,如同人体的血管与血液的关系,对于数字城市 都是至关重要的。 根据数字城市建设的目的和任务,数据基础设施建设应以地理空间数据为核心。 所以数字城市建设的首要任务是在宽带高速计算机网络上,将各种地理空间数据存入 数字城市的数据库系统,实际上就是在一定的坐标系统内,将具有确定定位信息和属 性标志的地面要素及现象的离散数据,在计算机的存储介质上形成概括的、有序的集, 用地面要素的坐标、属性数据以及关系数据记录和表现地理形态。 目前,数字地理空间数据的主要来源和获取途径乜3 主要有以下三种:全数字野 第一章绪论 彩色地形图点状地物符芎的提取与识别 外测量;利用数字摄影测量和遥感的方法从地面的数字影像上获取;将现有的各 种比例尺地形图数字化。 全数字野外测量是利用全站仪直接获得地形、地物数据、经必要后续处理形成数 字地形图所需的数据。自8 0 年代初以来,野外直接测量的仪器有了比较快速的发展。 但是由于全数字野外测量方式本身野外作业和所需人力大等因素的局限,一般适用于 小范围、大比例尺和高精度的应用场合。 摄影测量在经历了模拟摄影测量和解析摄影测量的发展阶段之后,现在已进入数 字摄影测量时代。数字摄影测量采集速度快、数据精度高、现时性好,是今后具有发 展前途的地理信息获取途径。但是由于数字摄影测量工作站的价格比较昂贵且作业过 程相对复杂等原因,数字摄影测量和遥感获取地理信息的方法更适合于进行数字地理 信息的更新。 现有各种比例尺地形图是测绘工作者长期辛勤工作的结晶,已形成了对地理信息 的比较完整的表示。相比之下,将现有地形图数字化以获得地理信息是获得地理空间 数据的一种低廉而高效的方法,在今后相当长的一段时间内仍将是数字地理信息的主 要来源之一,比较适合于初始地理信息库的建立。 1 2 地图信息的自动识别与提取 由于将纸质地图数字化以获得地理信息所具有的优点,多年来使得广大研究人员 对其进行了不懈的探讨,地图信息的数字化经历了一个不断发展的过程瞳1 : 盲数字化阶段:以点方式最常用,是将地图贴在数字化板上,由操作人员手 扶跟踪头,沿图形线的中心位置移动,每按一下记录按钮,标示器所在点的 坐标就输送到计算机里,进而要素信息便以一连串的坐标位置以及按图示符 号性质赋予的相应属性编码来表示。在此过程中操作员可以控制所采集的特 征点,可大大减少非特征点数据,对作业条件的要求不高,可直接提供矢量 格式数据,但系统没有关于结果的直接反馈信息。 数字化仪交互数字化阶段:由显示器显示通过数字化仪所采集输入的点、线 等,操作人员可以实时地对矢量化过程中的错误进行修改。 地图图像手工数字化阶段:将地图扫描成图像并输入计算机中,将地图的数 字图像显示于计算机屏幕上,用鼠标逐点采集地理要素的空间信息,通过键 盘或菜单输入其相应的属性信息,可实现图像的漫游浏览、放大、缩小、叠 2 彩色地形图点状地物符号的提取与识别第一章绪论 加等。与基于纸质地图的矢量化方法相比,降低了采点难度,可实时地检查 出矢量化过程中的错误,方式更加灵活。 地图图像人机交互式数字化阶段:随着计算机图形图像处理技术及模式识别 技术的发展,人们开始了人机交互式地图矢量化算法的研究。主要通过人工 引导下的线划自动跟踪技术以获取地图上各要素的空间信息,同时采用人机 交互方法确定并输入相应的属性信息。此阶段地理信息的数字化方法具备了 一定的智能化功能,但在要素粘连、重叠问题常出现跟踪错误,地图要素属 性识别方面的研究也很薄弱,操作过程中还需要作业人员进行大量的引导、 判断、干预、修正等。 地图图像自动识别和提取阶段:在此阶段不仅要实现地理要素的自动提取并 转化为矢量数据,还要在无需人干预的情况下获取各种属性关系信息。目前 地图符号识别方面的研究取得较大进展,但距地图信息自动识别和提取的真 正实现还有一定距离。 在科技发展的今天,地图信息的自动识别和提取不仅涉及计算机技术和图形图像 处理,而且越来越依赖于模式识别技术。模式识别( p a t t e r nr e c o g n i t i o n ,简称p r ) 是指用计算机的方法,就人类对外部世界某一特定客体、过程及现象的识别功能进行 自动模拟。模式识别起源于6 0 年代初,是一门新兴而迅猛发展的学科,是信息与自 动化领域的一个重要分支。 将传统的地图制图技术与模式识别技术相结合,进一步发展而形成了地图模式识 别技术( m a pp a t t e r nr e c o g n i t i o n ,简称m p r ) 。地图模式识别技术是一种智能技术, 它是研究如何使计算机实现人对地图的阅读和理解,探讨采用机器模拟人类视觉系 统,以及模拟人脑对视觉信息的分析判决过程。地图模式识别技术研究从二维数字扫 描图像中提取目标的色彩、形状和语义信息,并通过对特征信息的处理与分析,完成 对不同地图模式的分类决策,是- f - j 由多种学科互相渗透而发展起来的综合性新技 术,它与遥感技术、地理信息系统一起被称为现代地图制图的三大技术。 地图模式识别技术最早源于6 0 年代开始起步的图纸读取技术,受当时的计算机 水平的限制,此项研究进展缓慢。7 0 年代以后,随着计算机软硬件、计算机视觉和 模式识别等技术的发展,首先在文字识别领域应用并取得了令人鼓舞的成果,同时, 图形、图像的识别也开始受到应有的关注。 八十年代,由于c a d c a m 技术的发展,把原有的电路图、机械图和各种设计图转 第一章绪论彩色地形图点状地物符号的提取与识别 换成c a d 系统所接受的数据,进而进行查询、修改处理的要求显著增加,从图纸上提 取图文信息的各种算法大量涌现,图纸技术的研究进入一个高潮,也预示了地图信息 识别与处理研究高潮的到来。这时人们开始认识到将具有不同特征的文字和图形分开 识别的必要性,因此出现了针对某类要素,如道路网、点状注记符号识别的研究。德 国汉诺威( h a n n o v e r ) 大学地图制图研究所相继完成了德国1 :5 0 0 0 地籍图的自动 化、德国1 :5 0 0 0 地籍图上的独立符号、注记、范围线的自动获取研究;德国法 兰克福应用测量研究所也从事了这一研究,并取得大量研究成果;美国环境研究与技 术公司在计算机上实现了微型栅格矢量变换;巴特勒一哥伦巴斯实验室为国防制图局 系统的进行栅格矢量数据分析,并完成了一个地图数据自动获取系统;i b m 的研发机 构也进行了大量地图矢量化的试验;日本不但在字符识别方面居世界前列,对地图识 别的探索也开始较早,在1 9 8 4 年就对地图和设计草图的自动识别进行研究;n t th u m a n i n t e r f a c e 实验室也一直致力于这一课题的发展,1 9 8 7 年研制出地图识别输入系统 m a r i s 。 进入九十年代,g i s 的发展逐渐向产业化转变,如何快速高效地得到有用的空间 地理数据显得格外重要。由于扫描硬件技术在分辨率、幅面等不断提高,以及软件在 理论上和技术上的实用化,使得从地图扫描图像中自动识别和提取地理信息的方法成 为研究主流。美国工程兵测绘研究所研究了“采用模式识别的空间数据系统中的线扫 描方法 ,以及在陆地卫星像片上用混合方法检测地图制图的重要特征;德国法兰克 福应用测量研究所探索了基于模式识别方法的地图等高线自动获取;汉诺威大学开发 栅格一矢量转换软件r a v e l 和机助线状要素识别系统c a r o l 等;1 9 9 6 年,“智能地图 数字化研究”列为美国国家自然科学基金项目;近年来,加拿大、芬兰、瑞典等国也 积极参与地图模式识别的研究。 在国内,也有许多单位在从事地图模式识别方面的研究,如武汉大学、解放军信 息工程大学测绘学院、西安电子科技大学、南京理工大学、上海交通大学图像处理与 模式识别研究所,都取得了一定的研究成果。在理论研究方面,广大科研人员对自动 化的提取方法作了大量有益的探索。其中口1 黄文骞重点对地图符号的识别进行研究, 分别利用神经网络、结构分析、矩特征等方法识别地图上的符号;h 1 郝向阳着重从结 构分析及形学态方面研究地图要素如居民地等的自动提取问题;口1 付仲良从人机系统 工程角度分析讨论了全要素地形图扫描数字化和系统提取全过程机理,发展了一系列 面向地形图扫描识别的专用算法;佑1 郑华利则对彩色地形图的识别进行了有益的探 4 彩色地形图点状地物符号的提取与识别第一章绪论 索。 为了满足社会的需要,许多公司和科研机构纷纷投入大量的人力物力,利用现有 的技术开发了许多半自动化的地图数字化系统,比较有影响的如:美国的n s x p r e s 、 德国的c a r o l 、日本的m a p v i s i o n 以及国内的g e o s c a n 等,其价格大多较为昂贵。 i ;纵观国内外的发展现状,不难看出,地图模式识别是近年来地图制图领域中的一 个非常活跃的研究方向,愈来愈被人们所重视,并取得了较大的进展。地形图数字化 的全自动化是地形图数字化的最终目标,但由于地图模式识别自身难度,以及研究广 度和深度局限,当前地图信息识别与提取技术主要研究是针对提高地图矢量化作业自 动化程度和效率的环节展开的,对地形图上大量出现的地图要素识别和提取方法进行 研究,以期望把地形图信息获取自动化程度和作业效率提高到一个新的水平。 1 3 本文研究的主要内容 地图扫描影像自动识别技术是模式识别中难度较高的一个研究方向,本文对地图 扫描影像自动识别的各部分算法进行了分析和研究,设计了地形图识别的整体结构; 利用图像处理和模式识别技术,对彩色扫描地形图的平滑处理、分色和去噪方法进行 了研究;探讨了地形图符号识别的基本理论和方法,分析了点状地物符号的特点,采 用统计法和神经网络法对点状地物符号进行了识别。 = 具体工作体现在: 1 对地图扫描影像的预处理作了较深的研究,提出了适合于彩色地形图处理的 二次去噪模型,即:首先对彩色扫描图像进行彩色平滑处理:在此基础上对 数据进行分色、二值化处理;最后用数学形态学方法对分色所得的二值要素 图进行二次预处理,以提高数据处理的质量; 2 对各种颜色空间进行比较和分析,选择了适合彩色地形图分割的颜色空间, 以提高分色的效果; 3 提出了基于颜色表直方图的模糊c 均值聚类分色实现方案:运用模糊c 均值 聚类方法在颜色表的直方图上进行分色,加快了分色的速度; 4 用基于组合特征的统计法和神经网络法两种方法实现了点状地物符号的识 别,得出最后的识别结果。 第二章地图模式识别的原理和方法 彩邑地形图点状地物符号的提取与识别 第二章地图模式识别的原理和方法 地图模式识别技术是传统的地图制图技术与模式识别技术相结合而发展形成的 - - i - j 新兴科学,它利用模式识别的基本理论和技术方法,模拟了人阅读地图的整个过 程。本章利用模式识别的理论分析了计算机阅读地图的过程,在此基础上对地图识别 的总体框架进行了设计。 2 1 模式识别的原理和方法 2 1 1 模式识别 模式识别嘲是指用计算机的方法就人类对外部世界某一特定客体、过程及现象的 识别功能进行自动模拟,简单地说就是用机器来实现人脑的学习、识别和思维等智能。 模式识别包括对各种模式信息的处理、传输、识别、分类与理解。其模式信息的形式 和内容是十分广泛的,既可以是图形、图像,也可以是语音、语言文字或一般的电、 声信号。 人类的活动看来都是以模式的形式出现的,语言文字的表达( 包括说话) 、画图 以及理解图像等都涉及到模式。人类处于各种环境中,而环境是由各种模式构成的, 人类根据模式所表达、所预示的含义作出相应的反应。因而,大量的人类经验都来自 模式识别的实践活动。模式识别是人类行为的一个基本组成部分,一旦使计算机具备 了模式识别能力就可以使用机器来执行感知任务,因此模式识别的研究具有广泛的应 用领域和发展前景。目前,模式识别技术已广泛地应用于空间技术、军事侦察、高级 制导、地质探矿、气象、天文、化工生产、医疗诊断、材料分析等领域。 2 1 2 模式识别的方法 模式识别针对不同的对象和不同的目的发展了不同的研究理论、方法,主要可分 为统计模式识别、结构模式识别、模糊模式识别与智能模式识别。其中统计法和结构 法是模式识别的经典方法,而模糊识别法和智能识别法是新兴的模式识别方法,是信 息时代对传统的分析方法的进一步拓宽。 统计法也称为决策论模式识别,通过对大量的样本进行统计分析,选择抽取最有 代表性的特征作为分类决策的依据。这类识别技术理论比较完善,方法也很多,但从 根本上讲,都是直接利用各类的分布特征,即利用各类的概率分布函数、后验概率或 隐含地利用上述概念进行分类识别。其中基本的技术为聚类分析、统计判决等。 6 彩色地形图点状地物符号的提取与识别 第二章地图模式识别的原理和方法 结构法也称句法模式识别,可将复杂对象分解成若干个基元( 即基本单元) ,根 据基元及其结构关系,建立相应的文法,通过对文法的剖析产生分类决策。在较复杂 对象不能仅用一些数值特征进行描述的情况下可使用该方法进行分类。 模糊识别法是根据模式信息的隶属关系建立隶属度函数,通过计算样本的隶属 度,以及对模糊子集、模糊特征和模糊关系的分析产生分类决策。模糊识别技术运用 模糊数学的理论和方法解决模式识别问题,大致可分为根据最大隶属度原则进行识别 的直接法和根据择近原则进行归类的间接法两种,适用于分类识别对象本身或要求得 识别结果具有模糊性的场合。 智能识别法包括基于知识的逻辑推理和神经网络两种方法。基于知识的逻辑推理 是对识别客体运用一定的统计、结构、模糊识别技术或人工智能手段,获取客体的符 号性表达即知识后,通过逻辑推理步骤来确定识别客体所归属的模式类的方法。神经 网络是用大量的非线性并行处理器来模拟众多的人脑神经元,并用处理器间错综而灵 活的连接关系来模拟人脑的神经元间的突触行为,从而实现模拟人类在思维过程中的 信息处理。 上述模式识别的四种方法各有特点及应用范围,但在实际构造识别系统时,由于 现实世界的多样性和复杂性,单靠其中某一种方法往往不能达到很好的效果。一个较 完善的识别系统通常是综合利用上述各类识别方法的观点、概念和技术而形成的。 2 1 3 模式识别的过程 一个典型的模式识别系统如图2 1 所示,由数据获取、预处理、特征提取、分类 决策及分类器五部分组成。一般分为上下两部分,上部分完成未知类别模式的分类, 下部分属于设计分类器的训练过程,利用样品进行训练,确定分类器的具体参数,完 成分类器的设计。分类的决策在识别过程中起作用,对识别的样品进行分类决策晦1 。 广。一。一。4 。一。一。一。: ; 未知类别模式的分类 j l 至至垂垂三) _ 二垂圣三二 叶二至至三垂二卜叫蛩分类结果 :工:1:l:一1i 区囚 垂) 匝茎心匐 i 一工一广上_ i i r 一一_ l _ i 分类器设计 l 改进判别函数h 误差检查li i-j l - - - - - - - - - - - - - - - - - j i - j 图2 - l 模式识别的过程 7 第二章地图模式识别的原理和方法彩色地形图点状地物符号的提取与识别 2 1 4 模式识别系统的设计 一个模式识别系统的设计通常由5 个步骤实现:物体检测器设计、特征选择、分 类器设计、分类器训练和性能评估旧。 物体检测器( o b j e c tl o c a t o r ) 是一个在复杂景物中分类出各个物体图像的算法。 这种分离物体的过程称为图像分割或景物分割。物体检测器设计的目的是选择出能够 将各个物体分离开的景物分割算法。特征选择( f e a t u r es e l e c t i o n ) 确定能辨别物体类 型的最好的物体属性以及如何度量这些性质的方法,以便能够用它最好地区别各种物 体。分类器设计( c l a s s i f i e rd e s i g n ) 是确定分类算法的数学基础并选择所使用的分类 器的结构类型的过程。分类器训练( c l a s s i f i e rt r a i n i n g ) 可确定分类器本身的各种可调 参数( 决策阈值等) ,使之适应被分类的物体。性能评估( p e r f o r m a n c ee v a l u a t i o n ) 可 估计出在使用诙系统时分类错误率的期望值。 2 2 图像模式识别 模式识别中基于视觉识别的图像识别具有特别重大的意义。图像识别的目的在于 用计算机自动处理某些信息系统,以代替人去完成图像分类及辨识的任务。图像识别 的过程包括7 1 8 1 引: ( 1 ) 图像预处理 为了研究图像内容的识别,首先要对获得的图像信息进行预处理,滤去干扰、噪 声,当图像信息微弱无法辨识时,还须对图像进行增强处理,几何调整,颜色校正等, 以便人、机分析。这一过程输入是图像,输出也是图像。 ( 2 ) 图像分割 为了从图像中找到需要识别的物体,还要对图像进行分割,也就是检测出各个物 体,定位和分离出不同的待识别物体,并把它们的图像和其它景物分离。在对识别物 体的定位和分离之后还需要采用平滑处理、细化处理和边界跟踪。平滑的目的是去掉 孤立的黑点,以及边缘小的凹凸处。细化处理的目的是获得骨架或轮廓,减少信息量。 这一过程输入是整幅图像,输出是像元图像。 ( 3 ) 图像特征抽取 在需要识别的物体被分割出来的基础上,对物体进行度量。一个度量是指一个物 体某个可度量的度量值,而特征是一个或多个度量的函数。通过计算可以对物体的一 些重要特性进行定量化表示。特征抽取过程产生了一组特征,把它们组合在一起,就 8 彩色地形图点状地物符号的提取与识别第二章地图模式识别的原理和方法 形成了特征向量。这一过程输入是庞大的信息图像,输出则是少量的特征信息,而且 这些特征信息仅仅代表物体,无法还原回原物体。 ( 4 ) 图像分类 根据提取的特征值,对某些参数进行计算、测量,根据测量结果利用模式识别的 方法对物体进行分类,确定类别名称,以便对图像的重要信息得到一种理解和解释。 如果把指派物体归到一个不正确的类,就产生一个分类错误。错分类发生的概率、称 为误判率。这一过程输入是特征信息,输出是类别名称。 图像识别过程如图2 2 所示。 图像输入 图像处理 图像预处理 图2 - 2 图像识别的过程 2 3 地图模式识别 2 3 1 人类阅读地图的过程 田德森分析了阅读地图者对图像感受的心理物理因素和地图感受的效果,研究了 地图视觉感受的基本过程,提出了地图感受理论。地图感受理论认为,阅读地形图的 过程是由察觉、辨别、识别和解译四个阶段组成髓1 。 察觉是人利用眼睛从地形图上搜索目标、发现目标的存在,是地形图阅读的最初 阶段。这一过程直接利用了目标与背景在明暗和色彩等视觉信息上的差别,其结果是 组成目标的点、线或画等要素的认同。结果的正确与否取决于目标与背景的视觉信息 对比程度。 辨别就是区分两个不同的符号,形成地形图要素的分类体系,其过程比察觉更为 复杂,受人的生理和心理等因素的影响。在阅读时,人们开始注意到的只是在视觉信 息上突出的点、线或面等要素,当为寻找一特定目标时,人们才开始将在其视觉范围 内的具有相应特征的点、线或面要素通过记忆联系起来构成具有相应结构的目标。 识别是读者经过辨别后,把存贮在头脑中具有某种含义的特征与别过程中形成的 目标的描述进行比较,给出地形图上不同符号或图形的含义。辨别是识别的基础,辨 别过程中忽视细小的特征差别都会引起识别结果的错误。 9 第二章地图模式识别的原理和方法彩色地形图点状地物符号的提取与识别 解译是指对地形图内容的理解。读者根据符号和图形而获得地理现象的结论,正 是解译的结果。解译在很大程度上取决于读图者的知识水平、实践经验和思维能力。 2 3 2 计算机模拟人类阅读地图的过程 当前自动化或半自动化的地图数字化系统几乎都是仿照人工读图的过程机理。从 扫描仪所获得的地图影像到计算机显示输出之过程是一个复杂的过程。这一过程也可 以按人工阅读地形图的过程进行模块化、层次化的划分,其过程如图2 3 所示。 影像分析与形态操作 图2 - 3 计算机模拟人类阅读地图的过程 ( 1 ) 影像分割:利用地图影像的灰度或彩色信息,对影像进行分割、细化等处 理,得到灰度或色彩变化一致的线划骨架或点的中心等基本特征影像。在细化过程中, 可以同时获得线划的宽度、点的大小等信息。这一过程类似于人的察觉过程。 ( 2 ) 矢量化:对经影像分割后的骨架影像进行栅矢转换,得到构成基元模型的 点、线、面( 用轮廓线表示) 矢量。这一过程相当于经过察觉后在人脑中形成了目标 图形的基本图形元素。 ( 3 ) 影像分析:其数据源可以是栅格骨架影像,也可以是矢量化的点、线、面 数据。对于栅格骨架影像,它利用各种形态分析方法,计算出影像中骨架点或连接成 份的几何特征( 如骨架点的斜率、连接成份的拓扑特征、外接矩形大小、方向、面积 等) 和几何关系( 相邻、连通、包含) ,并根据这些特征将栅格骨架点进行综合分类, 形成一些满足各种几何约束条件的几何图形。对于点、线,面矢量数据,它计算线段 的几何特征( 如线段长度、曲率、线段与线段之间的角度等) ,利用点、线、面的拓 扑关系( 如相交、相邻) 构造出图形。这一阶段所利用的特征不受地形图图像成像过 程( 即地形图扫描) 的影响,输出为几何图形的特征参数,构成了对几何图形的描述。 它相当于人工读图时的辨别过程。 ( 4 ) 识别:利用人工智能的归纳、演绎、综合分析等推理手段,将上一层处理 所提取或构建的图形与现实模型进行匹配,赋予几何图形一定的语义。它利用了几何 1 0 彩色地形图点状地物符号的提取与识别第二章地图模式识别的原理和方法 量与语义信息的联系,是对上一级所得到的各类特征更细致的分析或综合。这一过程 相当于人工读图的识别和解译过程。 影像分割和矢量化过程属于图像处理和模式识别范畴,是一种低级处理;影像分 析过程是一种中级处理;识别过程属于人工智能和知识工程的范畴,是一种高级处理。 地图信息的自动识别与提取技术是一项涉及数字图像处理、计算机视觉、模式识 别和人工智能等多门学科的复杂技术,这些学科从不同的角度出发形成了多种各具特 色的地图信息识别与提取方法,现有的方法主要有线划跟踪方法、数学形态学方法、 统计一结构方法、神经网络方法和人工智能方法。 线划跟踪法是计算机视觉领域中最经典的算法之一,是一种根据组成线划的各 个像素之间固有的连接关系按顺序方式提取线划的方法。线划跟踪的基本过程是:首 先寻找起始点,然后按一定的策略和法则顺序地寻找下一点。其结果可用一个坐标串 来记录,采用f r e e m a n 链码来完成存储。从本质上讲,线划跟踪只是实现从栅格数据 向矢量数据转换的一种算法,本身还不具备识别地图信息的能力,一般用于交互式地 图信息获取系统和地图信息的矢量化方面。 数学形态学方法是一种并行处理的方法,其处理速度快,广泛地应用于地图信 息识别与智能化获取领域,是一种特征提取和依据特征进行目标分割的有效方法,在 对地图扫描影像的等高线处理方面获得的较好的实验结果。 。 j统计结构法是模式识别的传统方法。对于彩色地图根据地图要素不同的颜色 特征对其进行分色处理,是实现地图图像二值化和对地图要素进行粗分类的方法之 一。地图分色( c o l o rs e g m e n t a t i o n ) 本质上是一种聚类( c l u s t e r i n g ) 过程,因而可使用统 计模式识别方法中的各种聚类算法来完成。此外,地图上的点状符号由于具有固定的 形态和结构,因而比较适合于使用传统的统计结构法。 神经网络技术被应用于地图信息识别于提取始于9 0 年代初,同统计结构法一 样,其应用范围主要在彩色地图分色处理和点状地图的识别方面。神经网络方法具有 并行性和稳健性,但是随着区分类别数目的增加,网络的容量也随之迅速增加。神经 网络在进行地图分色处理方面取得了良好的实验结果,但在点状地图符号的识别问题 中,由于神经网络的本身的限制,其规模还不是太大。 人工智能是计算机科学的一个分支,是以知识为对象,研究知识的获取、表示 和利用的一门知识工程学。在地图信息识别与提取的工程中,必然要用到知识,因此 人工智能也被引入了地图信息识别与获取领域。 第二章地图模式识别的原理和方法彩色地形图点状地物符号的提取与识别 2 3 3 地图扫描图像信息自动识别和提取的总体框架 综上所述,用计算机实现地图信息自动识别和提取的过程如下:首先用扫描仪对 原始地图进行扫描,得到地图的彩色数字图像,并对其进行平滑去噪处理,由此改善 扫描所引起的中f - j 色现象,以提高彩色图像的质量;对各种颜色空间进行对比和分析, 从r g b 颜色空f q 转换到适合地形图分割的颜色空i - j ,并运用模糊c 均值聚类方法在 颜色表直方图上对其进行分色处理,得到地图的要素图;对于随之引入的孤立点、断 点、毛刺等问题,运用数学形态学原理去除噪声;对地图的要素图像进行二值化处理 后再进行细化处理;运用基于组合特征的统计方法和神经网络方法完成点状地物符号 的识别,得出最后的识别结果。总体框架设计如图2 4 所示。 匝墅困 臣垂口 臣四 薹口 臣堕口i _ j 蔓 堕口 区堕圊 图2 - 4 系统总体框架图 2 4 本章小结 本章介绍了模式识别的原理和方法,模式识别系统的设计步骤,然后在此基础上 介绍了模式识别的分支之一图像模式识别系统设计的具体过程。在分析了人类阅读地 图过程的基础上,将图像模式识别的原理应用其上,总结出了用计算机实现地图信息 自动识别和提取的流程,并介绍了常用的地图信息自动识别和提取的方法。最后说明 了设想的地图扫描图像信息自动识别和提取系统识别的总体框架。 1 2 彩色地形图点状地物符号的提取与识别第三章地图模式识别的预处理 第三章彩色地形图模式识别的预处理 3 1 彩色地形图扫描影像的获取 3 1 1 彩色地形图扫描影像的获取 专地图模式信息的获取是进行模式识别的基础。获取地图模式信息的方法可分为矢 量数字化和扫描数字化两种。矢量数字化的工作量大,所以目前常采用扫描数字化。 譬彩色地形图扫描数字化是用彩色扫描仪扫描彩色印刷地形图从而得到彩色全要 素图像的方法。在此过程中,当扫描分辨率比较低时,容易造成扫描影像线划的粘连 或断裂;而采用高分辨率进行扫描时,又产生存储空间大和计算量大的矛盾,因此必 须选择适当的分辨率。在选择分辨率时,通常在不产生扫描影像线划断裂和粘连情况 下,扫描分辨率尽可能低。保证不产生扫描影像线划断裂和粘连的条件是像元宽度( 分 辨率) 必须小于最小线宽和最小线划距离的一半。例如,在地图中,最小线宽和最小 线划距离均为0 1 m m ,则扫描分辨率至少为2 0 d o t s m m 。 3 1 2 彩色地形图扫描影像的误差分析 彩色地形图扫描后得到的全要素图像数据是整个地图信息提取和识别系统的基 本数据,是所有后续处理的基础,其质量对最终的信息提取与识别结果起到至关重要 的作用。经扫描仪扫描所得的地形图图像的颜色一般都会出现失真和畸变,如扫描黑 色时所得数据理想情况应为:( r ,g ,b ) = ( 0 ,0 ,0 ) ,然而实际上得到的数据往往是 ( r ,g ,b ) = ( t bt :,t 。) ( t 。c t 。t 。) ,影响的因素有以下四个n 们: 印刷工艺的限制 不同种类的要素在印刷过程中或多或少会产生要素重叠( 特别是普染区和它的分 界线) ;印刷过程中机械的套合精度;印刷时的随机因素所引起的随机噪音等。 纸质地图本身误差 纸张表面的呈色性;保存过程中地图颜色褪色不均匀性等。 扫描仪的误差 相对于其它的误差而言,扫描仪的误差是引起色彩发生偏差的重要因素。扫描仪 的误差主要来自于以下三个方面: 扫描仪的元器件材料本身、扫描头的机械抖动及扫描仪中光源的光照均匀程度, 扫描仪的光电稳定性能直接影响所得到的r g b 三分色单版图像的灰度; 第三章地图模式识别的预处理 彩色地形图点状地物符号的提取与识别 扫描仪滤光片的非理想性也可引起颜色误差。滤光片理想透光率与它们实际透光 率之差引起扫描数据的偏色,滤光片的透光率对其所响应的光谱范围的非均匀性 及实际滤光片影响的光谱范围的相互重叠将引起扫描数据颜色的失真; 扫描时图像边缘效应现象的客观存在,即当颜色从一种色彩过渡到另一种色彩 时,其色相呈连续性变化,而非由一种色彩到另一种色彩的实变,从而产生过渡 颜色,也称为中间色。中间色往往出现在两种或两种以上的相邻色阶相遇的跳变 点,前者为两阶中间色,后者为高阶中间色。两阶中间色扫描后所得到的三基色 图像上的灰度值可用以下公式表示为: g ,( x 。,y 。) = f f i :( x ,y ) d x d y + f f i :( x ,y ) d x d y g s ( x y ) = i :( x ,y ) d x d y + 舻:( x ,y ) d x d y g b ( x y ) = i :( x , y ) d x d y + f f i :( x ,y ) d x d y ( 公式3 - 1 ) 公式3 - 1 中i ,1 ( x ,y ) 、i 。1 ( x ,y ) 、i 。1 ( x ,y ) 为颜色为色彩l 的彩色图像经过滤光 片后的强度分布函数。不管扫描仪的分辨率有多大,中间色的现象总是存在的, 分辨率越低时,产生的中间色点越多,这一现象越为严重。 以上三种误差是由扫描仪本身的特性决定的,主要和扫描仪感光元件、透镜组等 本身特性有关,所以客观上很难消除这种误差。 扫描软件的影响 扫描软件也是影响色彩发生偏差的原因之一。扫描仪的分辨率有光学分辨率和 插值分辨率,其中插值分辨率是由扫描软件决定的。此外一般扫描软件还提供 一些对图像的处理功能,如色相的细微调整、整个图像的冷暖调的控制、对比 度的设置、扫描锐化程度等,这都会对地图要素的颜色数据产生影响。 由于上述原因,使得彩色地图扫描数据的颜色会出现失真和畸变,这些颜 色误差会对地图信息的提取和识别产生很大的影响。寻找出扫描仪误差的数学 模型,并对其进行改善,可以减小误差的产生。郑华利就这方面进行了有益的 探索,在其论文中嘲,他将扫描仪的误差模型用下面的公式表示: r 1 y g , l ,) = s i 仁0 - - s , v - - t ) x ( s ,f 协出l + 占0 , ,) ( 公式3 - 2 ) 其中x ( t ,v ) 是原有的物理量,y ( u ,v ) 是获得的观察量,h ( ) 表示扫描仪的 脉冲相应,s 表示记录介质及传感元件的非线性,( u ,v ) 表示噪声。 1 4 彩色地形图点状地物符号的提取与识别第三章地图模式识别的预处理 3 2 彩色地形图扫描影像的一次预处理平滑处理 地形图的扫描影像在生成过程中常常受到各种因素干扰和影响而使图像质量变 差。如果不经处理进行简单的二值化,一方面要素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论