(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf_第1页
(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf_第2页
(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf_第3页
(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf_第4页
(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(通信与信息系统专业论文)基于dsp的视觉系统算法的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

捧十d s p 的视觉系统算法的挫汁1 i 实虮 摘要 随着人工智能及机器人技术的迅速的发展,计算机视觉技术逐渐向多元化 发展。本论义介绍了一套比较完整的计算机视觉系统的实现过程。其中包括主要 的核心算法的介绍、分析以及系统的整个设计、实现过程。主要有如下几个方面: 首先,由于图象分割是图象处理的基础,本文主要介绍了采用不同于传统 的阶跃型直线边缘和圆弧边缘z e r n i k e 正交矩亚象素边缘检测算法。前者可以用 亚象素精度给出边缘的位置和方向信息,后者还可以亚象素地给出边缘曲率,这 样就可得到边缘点在h o u 【g h 空间中的映象,而不是仅利用位置信息时的一条正 弦曲线,这极大地提高了参数在h o u g h 空间的聚类效果。此外,值得一提的是 由于该技术的方向信息计算精度极高,使得r h t 聚类得到的参数得到了保证。 从而使我们从图象获得所需要的有用边缘点,然后对这些边缘点进行野点删除等 去噪处理,再利用所得到的有用点采用h o t i g h 或r h t 变换来拟合曲线。 其次,考虑到计算机视觉算法往往运算量都比较大,用传统的v o n n e n m a n n 结构计算机很难达到系统的实时性。所以我们在本课题中采用了d s p 作为核心处理器来实现上述的视觉算法。d s p 芯片采用的是程序总线和数据总线 分离的哈佛设计结构,可以大大提高数据的运算速度。本课题选用的d s p 芯片 是t i 公司的t m s 3 2 0 c 6 7 1 1 浮点型。在图象采集方面,本系统采用了与 t m s 3 2 0 c 6 7 1 1 芯片相匹配的v i d e ot v p 3 0 2 6 2 5 0 c p c e 型图象采集卡。 最后,我们在d s p 上采用了c 语言以及汇编语言实现了视觉系统的核心算 法,结合d s p 本身的特点,采用了内联函数,线性汇编技术优化了程序代码, 提高了算法的实时性。 实验结果表明,整个系统基本能够达到预先设计的要求,系统能够达到较 好的实时性。 关键词:d s p 实现与优化;图象边缘检测;h o u g h 变换;r h t ;线性汇编 软件流水 基十d s p 的视觉系统算法的设计2 ,实现 a b s t r a c t w i t ht h ed e v e l o p m e n to ft h et e c h n o l o g yo ft h ea r t i f i c i a li n t e l l i g e n c ea n d a u t o m a t o n ,c o m p u t e rv i s i o nb e g i n st ob ea p p l i e dt om a n yt e c h n o l o g i cf i e l d s t h i sp a p e ri n t r o d u c e sas u i to fi n t e g r a t e dc o m p u t e rv i s i o ns y s t e m i n c l u d i n g t h ei n t r o d u c t i o na n da n a l y s i so fk e r n e la l g o r i t h m 。t h ed e s i g na n dr e a l i z a t i o no f t h ew h o l es y s t e m t h em a i nw o r k si n v o l v e di ni ta r ea sf o l l o w : f i r s t ,a st h ei m a g es e g m e n t a t i o ni st h eb a s eo fi m a g em a n i p u l a t i o n ,i nt h i s p a p e r , w eu s ez e r n i k eo r t h o g o n a lm o m e n tm e t h o dt or e a l i z ee d g ed e t e c t i o no f i m a g e ,w h i c hi sh e l p f u lt oe n h a n c e t h ep a r a m e t e rp r e c i s i o no fh o u g ht r a n s f o r m i nu s eo ft h ea b o v em e t h o d ,w ec a ng e ta v a i l a b l ee d g ep o i n t s t h e n ,w ed e a l w i t ht h e s ep o i n t sw i t hd e l e t i n gt h eo u t l i e r s a tl a s t ,w ec o m b i n et h e s ep o i n t st o e x a c t l ye s t i m a t et h ec u r v ep a r a m e t e r sw i t hh o u g ht r a n s f o r mo rr a n d o m h o u g ht r a n s f o r m s e c o n d ,c o n s i d e r i n gt h a ta l m o s ta l g o r i t h m si nc o m p u t e rv i s i o na r em u c h m o r ec o m p l e xa n dc o n v e n t i o n a lv o nn e n m a n nf r a m e w o r ko fc o m p u t e rc a n t p r o c e s st h ei m a g ei n r e a lt i m e w ed e s i g na n dr e a l i z ec o m p u t e rv i s i o n a l g o r i t h mp a r tb a s e do nd s po ft i i ni m a g ec a p t u r e ,w e u s ev i d e o - r v p 3 0 2 6 2 5 0 c p c ec h i pw h i c hi sm a t c h e dw i t hd s pt m s 3 2 0 c 6 7 11 d s pt m s 3 2 0 c 6 7 11i sc h o s e na st h ep r o c e s s i n gm o d u l e ,o nw h i c ha l l p r o g r a mc o d e sa r ew r i t t e nb yc a n da s s e m b l yl a n g u a g e a l s o ,t h es o f t w a r ei s o p t i m i z e dt o u s et h ef e a t u r e so fd s ri n l i n e f u n c t i o n s ,l i n e a ra s s e m b l y l a n g u a g ea r eu s e dt oc o m p l e t er e a lt i m er e a l i z a t i o n t e s t sa n de x p e r i m e n t sd e m o n s t r a t et h a tt h ew h o l es y s t e mc a na r r i v et h e a n t i c i p a t ed e s i r ep e r f o r m a n c ea n dh a v ea b i l i t yt op r o c e s st h ei m a g ei nr e a l t i m e k e yw o r d s :d s pr e a l i z a t i o na n do p t i m i z ei m a g ee d g ed e t e c t i o n ;h o u g h t r a n s f o r m ;r h t 1 i n e a ra s s e m b l yl a n g u a g e ;s o f tp i p e l i n e i i 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文 中除了特另, t l d l :i 以标注和致谢的地方外,不包含其他人或者其他机构已经发表 或撰写过的研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作 r 明确的声明并表示了感谢。 作者签名: 雅日期: 论文使用授权声明 本人同意上海海事大学有关保留、使用学位论文的规定,即:学校有权保 留送交论文复印件,允许论文被查阅和借阅;学校可以上网公布论文的全部和 部分内容,可以采用影印、缩印或者其它复制手段保存论文。保密的论文在解 密后遵守此规定。 作者签名:二匆啦导师签名:刁玉般日期: 螭十d s p 的视觉系统算法的设计i ,实现 第一章引言 i i 计算机视觉的概述及其发展 随着电子计算机的飞速发展,让计算机能够接受视觉信息就成为了一项很有 前景的研究领域,从而成生了计算机视觉( c o m p u t e rv i s i o n ) 这门学科。 7 0 年代末、8 0 年代初,马尔( d m a r r ) 教授首次从信息处理的角度综合了 图像处理、心理物理学、神经生理学及临床神经病学的研究成果,创建了视觉计 算理论,解决了研究视觉理论的策略问题,他认为视觉是一个复杂的信息处理过 程,要完整地理解视觉,必须从三个不同的层次上对它进行解释:第个层次是 信息处理问题的计算理论,它研究对什么信息进行处理和为什么要进行这些处 理:第二个层次是算法,它研究的是如何进行所要求的计算,也就是按要求设计 特定的算法;第三个层次是执行,就是研究完成这一特定算法的具体机构。从计 算理论这个层次来看,马尔教授提出的视觉信息处理必须用三级内部表象加以描 述。这三级表象是:要素图( 图像的表象) ,2 5 维图( 可见表面的表象) 和三 维模型表象( 用于识别的三维物体形状表象) 。 到了8 0 年代后期,计算机视觉的研究领域出现了主动视觉( a c t i v ev i s i o n ) 的理论框架。它研究的是通过主动地控制摄像机参数,或者更广义地说,通过视 觉和行为的结合来获得稳定的、实时的感知。在主动视觉理论框架下,初级视觉 的许多不适定问题变得适定了,不再需要正则化理论寻找“光滑性”约束条件, 可以较容易地求解。与以往的视觉理论相比这一新的理论框架具有许多优点。首 先,主动视觉系统能进行空间搜索;其次,主动视觉系统能够运用已知的摄像机 运动信息。第三,主动视觉系统可以使用定性算法。 计算机视觉的研究目标是使计算机具有通过二维图象认知三维环境的能力, 这种能力将不仅能使计算机能感知三维环境中物体的几何信息,包括它的形状、 位置、姿势、运动等,而且能对它们进行描述、存储、识别与理解。用一句话来 概括三维计算机视觉研究的本质问题,就是利用二维投影图象来重构三维物体的 可视表面,即三维重构。现在已经发展起一套独立的理论和算法,从而能用计算 机对视觉信息进行分析和处理。目前,计算机视觉已经被用于遥感图象分析、文 字识别、医学图象处理、多媒体技术、图象数据库、工业检测与军事等领域。在 计算机视觉的发展过程中,经历了一系列基本理论框架,即m a r r 视觉计算理论 框架、基于知识的视觉框架。主动视觉框架等。 下图是一个计算机视觉系统的基本处理过程。 基十d s p 的视觉系统算法的设汁0 实现 外部 幽 原始预处理分特征匹数据高最终 象处后的图配层 - 世界采图象理象信息识描述处结果 集割别理 图1 1 计算机视觉的基本处理过程 1 2 计算机视觉系统的基本结构及相关领域 计算机视觉系统能够对输入图象进行处理之后产生有关图象内容的描述。这 些描述在一定的应用场合中,必须是足够明确的,有用的。一般来说,可以把视 觉系统看作一个反馈回路中的一个环节,它是整个回路对外界的感知环节,它所 提供的有关外界的描述可以被控制环节作为下一步决定的参考和依据,以控制执 行机构的动作。 在一定的光照( 包括可见光,红外线甚至超声波等各种成像手段) 条件下, 成像设备( 摄像机、图象采集板等) 采集到的( 数字) 图象经过视觉系统的处理, 得到一种符号描述,这种描述有可能被用于对场景施加反馈控制。 这里,再对视觉系统产生的描述做些说明。一个视觉系统对于图象的描述不 必是完全的( 由于站在不同的应用背景去看,产生的描述可能不尽相同,不可能 也没必要找到所有的描述) 。它只要能做到在相应的应用场合中给出满足用用需 要的描述就可以了。 与计算机视觉由密切相关的几个领域是:图象处理、计算机图形学、模式识 别和人工智能。 图象处理是有关如何通过一定的处理从已有的图象得到新的图象的技术。它 的许多思想方法来自于线性系统理论。通过处理产生的新图象比处理之前的图象 可能降低噪声,或减少了模糊或是增强了边缘。虽然图象处理的结果仍是图象而 不是描述。但作为计算机视觉的预处理过程,图象处理技术再计算机视觉系统的 实现中占有相当重要的地位。 模式识别主要是研究如何对输入的特征向量进行判别分类的问题,模式识别 系统的输出一般是表示类属的类号。模式识别技术主要对于计算机视觉系统产生 的描述进行分析。 人工智能的主要目标是揭示人脑神秘而复杂的思维活动。目前主要的研究方 向是使计算机能够执行某些类似人类思维的活动,如推理判断、景物理解、学习 规划和问题求解等等。在一些特定的视觉应用场合罩,必须运用场景分析等人工 智能的方法才能得到有关问题满意的解答。 皋十d s p 的视觉系统算法的改汁j 史现 以上几个领域虽然侧重点不同,但在计算机视觉系统的实现中,它们常常是 不可分割的紧密结合起来的,大体步骤如下: 步骤( 1 ) 是由成象系统( 图象采集卡) 把场景的图象采集到计算机内部。 步骤( 2 ) 是运用图象处理技术对采集到的原始图象进行预处理以得到质量 改善了的图象。 步骤( 3 ) 是运用计算机视觉技术从图象中提取感兴趣的特征,构成对图象 的描述。 步骤( 4 ) 运用模式识别技术多抽取到的特征进行分类整理。 步骤( 5 ) 运用人工智能得到更高层次的抽象描述,完成视觉系统的任务。 一般把步骤( 3 ) 之前的处理称为早期视觉或图象分析,而把其后的处理称 为高级视觉或场景分析。 1 3 课题的实用价值或理论意义以及可能达到的水平 ( 一) 实用价值 先前已经有人利用实时视觉处理器s 1 5 0 4 0 实现过一种视觉系统,这个系 统主要被应用于军事研究中。它相对的成本较高,而且需要专用的视觉处理器。 并且这个系统的处理速度,投入产品的可能性都有所局限。本课题就是想利用 d s p 6 0 0 0 这一对图像处理有相对优势的器件,实现这个视觉系统的核心算法。如 果能够实现成功,那么这样一个系统的相对成本就可以降低,尤其是其直接应用 硬件的做法,将使图像处理速度大大提高。从而更加适应当今视觉系统的发展趋 势,达到处理数据量大、计算速度快的要求。 l 一) 课题可能达到的水平 应用d s p 6 0 0 0 实现边缘提取和二次曲线提取这两种视觉系统的核心算法。然 后实现图像的轮廓线拟合。 1 4 本论文的主要工作 1 4 1 算法介绍 从算法角度看,本系统需要利用图像的边缘检测和提取以及二次曲线拟合。 对于边缘检测,在灰度图像中,图像强度以连续方式变化或者说突变的地方就叫 做边缘。对这种不连续的检测在计算机视觉领域如e l 标识别,运动分析等方面是 一个基本而重要的领域。对这一问题,人们很早就进行了广泛的研究。然而大部 分的努力都集中在象素级的边缘检测上。早期的边缘检测算法通常都是使用局部 箍十d s p 的税觉系统算法的设计1 ,实现 算子来近似计算阶、二阶导数或者图像空问域的梯度( 如s o b e l ,l a p l a c e 算 子) 。一般来说,由于数字灰度图像的病态性而在处理之前需要滤波器( 如g a u s e 滤波器) 先得进行正则预处理,同时由于常用梯度算子性能不理想而往往在处理 之后需进行一些细化、修剪和连接等后处理。实现起来步骤繁多,性能不是很理 想。相比一个z e r n i k ei 卜交矩边缘算子就有了比较好的改进。它是一个积分算子, 不存在梯度算子的病态问题,固有的具有抗噪能力。同时,其定位、定向的精度 极高,达到亚象素级,具有实现简单、结构紧凑、速度快、精度高、鲁棒性好等 优点。然后采用野点删除对检测后的图象进行关键点的提取,最后利用上述提取 的关键点利用r h t 进行轮廓线的拟合。r h t 变换即可以提高轮廓线拟合的精度又 可以提高h o u g h 变换的运算速度。 1 4 2 软件实现的框图 z e m i k e 特征 边缘图像 图象 预处正交矩提取曲线 边缘检( 直 _ 拟合 采集理 测线和 雨i 显示 椭圆) 1 5 论文选题以及内容安排 图i 2 系统软件实现过程 本设计采用了t i 第三方合作伙伴的i d k 一6 7 1 ld s k 平台来开发本视觉系统, i d k 一6 7 1 1d s k 开发板的核心处理器是t i 公司的t m s 3 2 0 c 6 7 1 l 。论文的内容具体 安排如下: 第一章简要介绍了计算机视觉系统的发展和基本构成,然后简要介绍了本论 文的主要算法、实现方案及现实意义。 第二章具体介绍了视觉系统的核心算法包括:z e r n i k e 正交矩边缘检测、直 线和曲线的提取、r t h 变换等。 第三章详细介绍了所要应用的硬件设备和i d k 一6 7 1 1d s k 开发平台。 第四章介绍了整个视觉系统的软硬件构成,以及对整个系统软件的优化过 程。 第五章实验结果和性能分析。最后,对全文做了总结,给出了设计的不足, 以及下一步研究的方向。 堆十d s p 的视觉系统算法的设计j 实规 第二章基本概念和理论分析 计算机视觉的主要目的是用机器代替人的眼睛和大脑,对客观世界进行视觉 感知和解释。这一领域的科学研究集中了信号处理、计算机科学、生物学、认知 科学等各个学科的科学家和工程技术人员,涉及许多新兴学科和技术。本章旨在 介绍计算机视觉所涉及的一些基本概念和相关技术,一些和本文密切相关的技术 在后面的章节中将会有详细的讨论。 2 1 计算机视觉的基本过程 计算机视觉的基本处理过程包括图象的采集,预处理,分割检测,匹配识别, 高级分析处理等。各部分的目的和作用如下图所示: 竺篓麟= 预处理p 后蕊 世界i 墨整j 维图象l ! :二ij 的图象_ _ ! ! ! j 特征 匹配 数据! 高级分 最终结 信息l ! ! 型j j 描述l 塑 i = 理一果数据 图2 1 计算机视觉的基本处理过程 图2 1 说明了客观世界是怎样被计算机理解和接受的,在这个过程中,我们 可以看到计算机视觉需要相当巨大的计算量,所以必须由专用硬件和通用硬件相 互配合才能完成。 2 2 计算机视觉的基本概念 2 2 1 摄象机标定 摄象机是计算机观察外部客观世界的“眼睛”,然而这个“眼睛”不但改变 了客观世界的尺寸而且是有失真的。这是摄象机固有的特征,称为摄象机的内征 参数( 非线性系数和尺度变换系数( s x ,s y ) ) 。另一方面,摄象机坐标与外部 世界坐标之问的几何变换则称为摄象机的外征参数( 旋转变换矩阵和平移变换矢 量) 。摄象机标定的目的就是得到这些参数的精确值。其实,摄象机标定得到的 参数中包含了和摄象机相连的图象采集系统的特性。换而言之,这里所说的摄象 机是广义延伸了的。 皋十d s p 的视觉系统算法的砹汁头现 2 2 2 数字图象 计算机视觉处理的图象是数字图象,而且通常是灰度图象,它一般由图象采 集系统得到,图象采集系统将摄象机的模拟图象数字化。数字图象每个象素的量 化级称为灰度级。例如,一幅数字图象的每个象素由8 个b i t 表示,我们就称之 为2 5 6 色图象,有2 5 6 个灰度级。尽管有各种狄度级的数字图象,但一般来讲, 计算机视觉处理的数字图象大多为2 5 6 级灰度。数字图象通常表示成一个矩阵, 在计算机程序中用一维或二维数组来实现。 2 2 3 图象增强和恢复 图象增强和恢复属于改善图象质量的处理,它一般位于视觉系统的前端,用 于调整图象的对比度、去除噪声、变模糊为清晰。 图象的直方图是一个重要的图象数据统计特性,它与对比度紧密相连,是图 象灰度分布概率密度函数。数字图象的灰度直方图就是这幅图象中各灰度级的象 素数。正常情况下,各灰度级的象素数分布是比较均匀的,如果象素集中分布在 少数几个灰度级上,则表明图象的对比度太差,可以用直方图拉伸的方法解决。 有时出于特殊目的,也许需要将直方图集中分布在少数几个灰度级上,极端情况, 如将直方图集中分布在二个灰度级上,我们称之为二值化。 滤波是图象增强和恢复的另一个重要方法,例如非线性中值滤波和均值滤波 可以去除图象中孤立的噪声点,高通滤波器可以突出图象细节,逆滤波,卡尔曼 滤波等方法可以恢复失真的图象。滤波同时也被广泛应用于其它场合,如边缘检 测等。 2 2 4 图象分割和检测 图象分割和检测也许是计算机视觉中最富于创造性和最关键的部分,这部分 将图象中毫无意义的各个分离象素联系起来并找到计算机感性趣的各个区域和 关键点。例如,在一幅数字图象中有两个物体,一个是球,另一个是圆柱,利用 图象分割和检测技术,我们可以找到这两个物体的边缘信息并把它们分割开来。 在这一领域,有许多成熟的技术方法,也有许多新出现的技术方法,但总的来说, 这一领域缺少有效和实用的技术方法。大部分方法的困难在于很难提高系统的鲁 棒性。而在实际应用中,系统的鲁棒性又恰恰是最关键的因素之一。 h o u g h 变换,这种精巧和通用的技术以各种不同的形式应用于计算机视觉 的各个领域,通过对h o u g h 空间的聚类分析而得到原图象中曲线的点的性质, 6 基十d s p 的视觉系统算法的设计j 实规 这种方法特别适用于图象质量较差,并且不知道物体位于图象的什么位置时的情 况,但它需要知道所检测的曲线的方程,而且当曲线的方程复杂时,计算量增长 极快。大多数情况下,h o u g h 变换被用于检测直线、圆、椭圆等相对简单的曲 线。值得一题的是h u o g h 变换的一种变种随机h o u g h 变换( r h t ) ,它能 提供非常好的鲁棒性。 最小二乘拟合,知道了一组边界点和曲线的函数模型,要拟合曲线的参数, 最常用的方法就是最小二乘拟合。最d , - 乘拟合可以使得到的结果具有最小的均 方误差。由于其算法简洁,同时又具有较好的抗噪能力,它也是计算机视觉中常 用的方法之一。 滤波的方法曾在前面介绍过,它可以用于图象的增强和恢复,而在图象检测 中,滤波则是最重要的方法。通过与经过精心计算的算子进行卷积而得到图象中 物体的边缘,成为计算机视觉中最常用的方法之一。有些算子是经典的算子,已 经计算好了的。如r o b e r t 算子、s o b e l 算子、p r e w i t t 算子等。其中四个方向的 s o b e l 算子如下: 1o一1 2 02 1o一1 21o 101 012 121 o00 12 1 012 101 210 在图象分割与检测领域,有许多新的理论和技术方法正在出现,例如神经网 络和小波变换,它们的出现也许会给这一领域带来新的观念并提供有效的处理方 法。 2 2 5 匹配和识别 图象的匹配和识别也是一个新的科学领域,位于视觉处理的后端,图象匹配 和识别的方法大多基于视觉中的不变量来实现,如刚体的旋转不变量等。传统的 图象匹配和识别方法大多具有较差的鲁棒性,目前正在迅速兴起的基于神经网络 的图象匹配和识别技术克服了这一缺点,可以得到较好的结果,但实现的代价较 高。 2 3 曲线提取和拟合 在计算机视觉中关键点、曲线、曲面等基元在进行图象的匹配、分析、理解 和描述中起着十分关键的作用a 因此曲线提取有着十分重要的理论价值和实际意 义。 皋十d s p 的视觉系统算法的设计j 实现 所谓曲线提取是要从1 幅灰度图象确定该图中存在哪些曲线,这些曲线的类 型和参数是什么。为此,我们必须首先确定哪些边缘点子集属于同一条曲线并确 定此子集中哪些点是混杂于其中的出格点( o u t l i e r ) ,还要确定此曲线的类型和它 是不是真曲线;然后对证实了的曲线用它的被精选出的内点( i n l i e r ) 集合来精确拟 合根据其识别的曲线类型所模型的曲线参数。可见,曲线提取要比曲线拟合复杂 与困难得多,它包括边缘点检测与分类、出格点检测与删除、曲线分类与识别、 和曲线证实与拟合等一系列运算,而且图象的噪声、失真、遮挡、和视点变化等 许多因素的影响使得从实际灰度图象提取曲线变得更加困难。这样,开发能有效、 精确、鲁棒和实时提取曲线的技术是很有意义的。 许多作者已对此进行了很有意义的工作。它从边缘点集随机采样一个与所选 模型的曲线相应的最小子集,并解出由该最小子集中的各边缘点的位置信息确定 相应的曲线参数的一个解,通过对这些解的聚类就可鲁棒地曲线检测与参数估 计。此过程是序贯的,即提取一条曲线后就从原边缘点集中删除所有属于此曲线 的边缘点集,然后再对剩下的边缘点集继续进行曲线提取。此过程不仅是逐曲线 地进行的,而且是逐类型地进行的,即先对边缘点集进行如上所述的直线型曲线 提取过程,然后对剩下的边缘点集进行如上所述的二次曲线提取过程直到 在最后剩下的边缘点集中不再存在任何真曲线为止。 不难理解,其计算仍然相当费时。因为,其最小子集的维数m ( 此时它为最 小子集中的边缘点个数) 等于所选模型的曲线的参数个数k ( 对直线而言,k = 2 : 对二次曲线而言,k = 5 ;。) ,使得最小子集个数为c ( n 为边缘点集中的边 缘点个数) ,其量级为d ( “) ,这意味着随机采样最小子集的次数比例等于n k , 显然当n 较大时,即使对直线此计算量仍是相当大的。这使实时实现的困难较 大。此外,该技术对所随机采样到的最小子集缺少一个简捷有效地检验其正当性 的手段。实际上它一直要到无解或解明显不合理时才判断它是不正当的,这意味 着即使对不j 下当最小子集仍要进行与对正当最小子集完全相同的计算,这显然是 很不合理的。该技术的另一个缺点是使用常规的边缘检测技术来象素级地检测边 缘点集。这不但使得伪边缘点比例d 较大,进而使边缘点总个数和出格点个数加 大,从而加重了真曲线提取的困难;而且由于检测到的边缘点的位置是以象素计 的,因此精度不很高,从而使得所拟合出的曲线的精度也受相当的限制。 我们选用在文献 2 5 1 中开发的阶跃型直线或曲线边缘的z o m 亚象素边缘检 测检测边缘点。由于与常规的微分型边缘检测算子固有的增强噪声的缺点相反, z o m 算子是个积分型算子,它固有的具有较强的抑制噪声能力,并且由于边缘 强度与偏心距的双重筛选作用大大提高了真边缘的正确检出率并大大减低了伪 8 拱十d s p 的视觉系统算法的设计1j 实现 边缘的虚警率。这样,不但可有效地把边缘点总个数n 控制在一个合理的范围, 而且大大减小了出格外点率。这意味着曲线提取的困难得到了相当的缓解。另外, 该技术能以亚象素的精度提供边缘的位置、方向乃至曲率的信息。这样,不但提 供了高精度拟合曲线的可能,而且最小子集的维数m 从原先的k 降为 【( m + 1 ) 2 l ( 当仅使用位置和方向信息时) 或 m 3 + 0 5 1 ( 当还使用曲率信息时) ,这使 得曲线提取的计算量从原先的o ( n ) 降为d ( c 垮“1 ) 或o ( c 犄”“5 1 ) ,显然其计算 速度的提高是极大的。此外,当2 k 2 + 0 5 】或3 k 3 + 0 5 k 时,我们可利用最小 子集中的冗余信息来判断随机采样到的最小子集的正当性从而避免大量的不必 要的计算并使对每个最小之集的计算都成为有价值的处理。值得注意的是由于伪 边缘率已大大地提高了,逐条曲线地提取在一般情况下已变得不那么必要了,尤 其对于常见的曲线长度( 在本文中它定义为所检测到的内点个数) 的散布较小的 应用情况而言。鉴于此考虑,我们在使用r h t 识别曲线类型并粗估曲线参数时 未采用逐曲线检测的策略来进一步减小出格点率,而仅使用逐类检测的策略。 使用r h t 进行曲线识别和粗估是保证我们的算法的检测能力和鲁棒性的关 键措施。它不但使得我们的算法有很高的检测能力和鲁棒性,而且能在一个过程 中同时进行同一类曲线的所有曲线的检测,只要这些真曲线的长度不小于所设定 的真曲线最小长度。再加上r h t 的高并行度,使得其速度能完全满足我们的应 用场合的实时要求。 使用r h t 直接完成曲线提取难以协调算法的存储空间尺寸、计算速度、参 数精度、参数重要动态范围、检测能力和鲁棒性等技术性能。例如,由于实型 r h t 精度很高但鲁棒性很差,而其量化型r h t 的鲁棒性可按设计要求来满足但 其精度就无法同时保证了。鉴于此考虑,我们把r h t 的功能仅限于曲线识别与 粗估,即我们检测能力和鲁棒性作为r h t 的最重要的技术指标。因此,我们选 用尽可能粗化的量化型r h t 技术。h o u g h 空间的尽可能粗化不仅可保证算法的 鲁棒性,而且可峰化真曲线在h o u i g l l 空间的聚类从而提高算法的检测能力和大 幅度减小存储空间的规模。 为了在保留r h t 的鲁棒地并行提取同类曲线的能力的同时使存储成本、计 算速度和提取精度都满足要求,我们采用了粗精组合式的预测一证实一精炼策 略,即首先用参数适度粗化的r h t 来分类、识别曲线并粗估曲线参数;然后用 边缘点到粗提取的曲线的距离来鉴别属于曲线的内点,同时筛选不属于曲线的野 点;最后根据每个候选的精选到的内点个数来确定它是不是一条真曲线并用其精 选的内点集合使用最优拟合技术来精确估计曲线参数。这样我们在保留正确检测 能力和鲁棒性的优点的同时,提高了曲线提取的计算速度和精度,减少了实现成 本。基于此技术对目标图象中的所有曲线的提取可以这样地进行:我们首先同时 9 基十d s p 的视觉系统算法的殴汁,实现 提取所有的直线并从边缘点集合中删去所有属于这些直线的边缘点,再从剩下的 边缘点集同时地提取所有的二次曲线并删去所有属于这些二次曲线的边缘 点,直到判断出剩下的边缘点集已不包含任何曲线为止。这是个由简到繁的 过程。此策略的f 确性和必要性是不占而喻的。 我们首先简介阶跃型直线边缘和圆弧边缘的z e m i k e 正交矩边缘检测算法。 我们直接使用了z e m i k e 正交矩边缘检测算子。下面介绍z e m i k e f 交矩亚象素 边缘检测 2 3 1 阶跃型直线边缘的z o m 亚象素检测 图象f ( x ,y ) 的n 阶m 次z o m 定义为 f n 。= f f f ( p ,。) v ( p ,o ) p d p d o p “ ( 2 1 ) v n 。( p ,8 ) = r o m ( p ) e ( 2 2 ) 这儿,卅5(训xlm”翮(-1)s(n-s)!pn-2s 眨s , n 一陋i 为非负偶数,( p , o ) 为极坐标,;号标记共轭。易证,核( p ,0 ) 为正 即妙伽k ( 舻跏日2 熹6 ”n ( 2 4 ) = 1 ,k 1 = p e 。= 2 p 2 1 ,= 6 p 4 6 p 2 + 1 ,= p 2 e 2 定理一 e ( 一m ) 。f 一m ( 2 5 ) 定理二 若占( x ,y ) 为原图象f ( x ,y ) 逆时针旋转妒角后的模本,即 若g ( p ,日) = i ( p ,0 + 妒)则瓯m2 e me ”9 ( 2 6 ) 摹十d s p 的视觉系统算法的设汁1j 实现 它叙说任何z o m 的模值都具有旋转不变性。而其相角正比于旋转角。这使 得它既可用于图象模式识别,亦可用于确定图象模式相对于模型模式的旋转角。 此定理也常被用来把图象f 进行旋转规范化,并利用规范化后的图象g 的正交矩 来计算原图象f 的正交矩。本节所述的直线边缘和下节所述的圆弧边缘就是这样 进行的。 定理三若,( 。为子图象,l ( x ,_ ) ) 的n 阶正交矩,则e m = w l f 噱 为合成图象,( x ,y ) = 。w l f ( x ,y ) 的n 阶m 次正交矩。其中,权为常数。 它叙说正交矩算子是线性算子。在实际应用中,我们利用它首先把原图象分 解成较简单的子图象,( ”,例如前景图象和背景图象,然后通过计算这些子图象 的正交矩来确定原图象的正交矩。 上述诸定理都不难由正交矩的定义直接了当地证明。由于我们使用的是数字 图象 ,因此我们用求和取代式( 2 1 ) 的积分来计算f 交矩。即 和( 。澎( 叫) 毗川 ( 2 7 ) 其中,q 为以象素( x ,y ) 为中心的单位圆;尺寸为m m 的模板形m ( i ,) 可 用式( 2 1 ) f f - i f ( x , y ) ;1 并且( p ,口) 象素( i j ) n 单位圆的情况,离散地计算出来。 注意,对m m 模板而言,象素宽相当于m 2 。 如图2 2 ( a ) 所示,设在以象素【工c ,y cj 为中心的象素坐标系中,存在一个可局 部地可用直线 x c o s q o + y s i n t p ;f ( 2 8 ) 描述的阶跃型直线边缘。把它逆时针旋转咖角后就得到如图2 2 0 9 ) 所示的规 范化图象g 。m 于g ( p ,0 ) = s ( p ,疗+ 妒) ,由定理二有 e 。= g 。e 9 即 g 。= f 。e 9 ( 2 9 ) 我们把图象g 分解为背景图象与前景 图象之和,即 g ( p ,0 ) = b g 。( p ,0 ) + 坛:( p ,0 ) 桀于d s p 的视觉系统算法的砹汁j 实现 其中,量( 。疗) ;1 ,b 为背景欢度,阶跃图象g :( p ,口) = 忙;:;,h 为 阶跃灰度。这样,当规定象素中心到直线边缘的距离f r ,阶跃灰度h 0 时, 由定理三和正交矩定义易证,规范化图象g 的正交矩满足 :舫+ 陋1 f - f 再) ,g 1 ,:孤- f 2 ) j 3 ,g m = i g ,。( 2 1 0 ) 把它代入式( 2 9 ) 易知, ,= 南拈器秘旷旧卜旧一= 南( 2 1 1 ) 这样, :习2 雨1 j j i h r e e f n 。- r i 。m e f ,1 1 n 。两1 小i h r e e f l ,1 0 亿,:, 这样,【s i n 妒j2 雨,j i h n e 。 r ef 1 ,j j 。两,j 【i i l lf 1 ,j 陀1 2 1 于是边缘的亚象素位置为象素中心到此直线边缘的垂足,即 卧瞪,p c o 。s 习( p 眨 需指出的是上式中的尺度因子m 2 是半径归一的圆转换成m m 模板时所 值得指出的是,与文献 1 】给出的算法相比,我们作出了一些有意义的改进。 首先,我们注意到j f 矗的计算仅对背景灰度作出了贡献,而在边缘检测中一般它 不起作用。因为绝大多数边缘检测技术的后处理过程中并不利用此信息。因此我 耩于d s p 的 ! ! j l 觉系统算法的设计1 ,实现 们仅计算三个( 而不是原文中的四个) 正交矩,这有利于算法的简化实现和提高 其运行速度。其次,我们显式地规定了边缘走向,使得灰度有正阶跃的法向角, 而偏心距可正可负。这样规定有利于提高系统在曲线聚类时分辨相邻平行直线的 能力。并且我们避免了涉及的反正切、正弦和余弦三个费时的三角函数计算, 而直接由e 。计算边缘的单位法矢量,这进一步减少了计算,简化了实现。最后, 我们明确地规定了用方形域来确定边缘是否落在本象素所张的区域,这是符合边 缘象素的定义的,而且能取得比圆域好的效果,我们的实践也证明了这点。 下节,我们进一步开发用正交矩亚象素地检测阶跃型圆弧边缘的技术。 2 3 2 阶跃型圆弧边缘的z o m 亚象素边缘检测 如图2 3 ( a ) 所示,设在象素( x c ,y c ) 为中心的象素坐标系中,存在着一个可局部地 、2 ,、22 可用园圆x - x c ) + 【y y c j 2r c 。描述的阶跃 型边缘,它与象素中心的距离为f ,圆弧中心轴 与x 轴的夹角为妒,把它逆时针旋转一妒角后得 到如图2 3 ( b ) 所示的规范化图象g 。因此,此 时式( 2 9 ) 仍成立。 伊q o 2 z ) ,吲,h 时,其正交矩满足 g 1 1 = 即= 叫刍( 2 ) ; 瓦1 - ( ,c + f 1 2 - j 。 钳耻 厢咪z 一错】 铲n 后卜州吾“嘲并】 这样式( 2 1 2 ) 和( 2 1 3 ) 仍然成立,但式( 2 1 1 ) 修改为f = ( g 2 2 + 3 a :o ) ( 4 6 1 1 ) 摹十d s p 的视觉系统算法的址计,实现 函扣l l i 屹氓万一面r e f z 2 = 嵩。r 躲盎) 并且 ;弓;二!:;li一,;寻(-一z:)一3x i- 2 g 1 1 并且 。乖厕一帕j l 卜。j 于是,我们有如下所示的阶跃型圆形边缘的z o m 亚象素边缘检测 算法。 生用m x m 的模板r e w 。, u i m w 。对以象素( t ,y 。) 为中心的m m 领 域加权求和得正交矩r e e ,和i i l l e ,并计算g 。= i f , 。l = ( r e e 。) 2 + ( h 1 1 ,) 2 ,i f 边缘强度g “= 五t h e n 判该点为非边缘点并对下一个象素g ot o 步1 ,e l s e 计算 式f 3 a 2 ) 并r 。t g 。1 ( s i n 妒,c o s 妒) : 步2 用m m 的模板对象素( t ,y 。) 为中心的m m 领域加权求和, 得正交矩f 2 0 并有g ”= f 2 0 ; 生土i f i i m f l l r e f l l i 3 时,正交矩算子不仅能不给边缘图象引入模糊, 而且能有效的大幅度提高输出s n r ,在m = 5 时,已经提高到4 6 d b 而在m = 7 时以提高到7 6 d b 了。这意味着正交矩算予不仅固有的具有边缘细化作用,而且 在不很小的模板尺寸就因高输出s n r 而大大提高了边缘检测的正确性和可靠 性。 5 2 经过算法处理过的图象结果 1 圆和直线 5 1 a 为圆和直线图象,5 2 b 为轮廓线提取、边缘分类和野点删除处理后的 乞o 2 托t j 0 这 r,【 , 1 4 k 牡十d s p 的说觉系统算法的设计i 实现 内点如图5 3 c 所示,由内点拟合的直线和圆如图5 2 d 所示,图5 1 e 将拟和的 图象迭加在原图象上。 图5 1a 图5 1c ,:5 二一:。氇: 。 彩纱 。 图5 1b 图5 1d 图5 1 e 2 锚雷链情况一 图5 2 a 为锚雷链图象,此时摄象机距离锚雷链较近,这使得链的斑驳情况 很严重,从而造成了边缘图( 图5 2 b ) 中大量的假边缘点,轮廓线提取、边缘 基于d s p 的税觉系统算法的吐计,实现 分类和野点删除处理后的内点如图5 2 c 所示,由内点拟合的两直线如图5 2 d 所 示,图5 2 e 将拟和的图象迭加在原图象上。 3 锚雷链情况二 图5 2 a 图52 c 图5 2e 图5 2b 图5 2d 璀于d s p 的视觉系统算法的设汁1o 实现 图5 3 a 为本系统从水下录象带上截取的锚雷链图象。此时摄象机距离锚雷 链较远,图象质量不高,锚雷链的边缘有许多局部的扭曲。图5 3 b 为经过预处 理后的边缘图象;图5 3 c 为经过轮廓线提取,边缘分类和野点删除处理后的图 象:由此拟合的直线如图5 3 d 所示,图5 3 e 将拟和的图象迭加在原图象上。 图5 3 e 图5 3 b 图5 3 d a35 图叫 攮十d s p 的说觉系统算法的吐汁j 实玑 4 池底圆球情况一 图5 4 a 为池底圆球原始图象,如由预处理系统送来的边缘图5 4 b 所示。经 过轮廓线的提取,边缘分类和野点删除处理后的图象如图5 4 c 所示,由此拟合 的椭圆轮廓线如图5 4 d 所示,图5 4 e 将拟和的图象迭加在原图象上。 图5 4 a 图5 4 c 图5 4 e o 图5 4 b 图5 4 d 鞋十d s p 的桃觉系统算法的世l 十o 实现 5 池底圆球情况二 图5 5 a 为池底圆球原始图象,如由预处理系统经过轮廓线提取送来的边缘 图5 5 b 所示,边缘分类和野点删除处理后的图象如图5 5 c 所示,由此拟合的椭 圆轮廓线如图5 5 d 所示,图5 5 e 将拟和的图象迭加在原图象上。 幽55 a 图5 5c 图55e 图5 5b 图5 5 d 綦十d s p 的视觉系统算法的设计,实现 5 3 系统处理图象的时间指标 图象处理速度是本系统的重要性能指标,本系统由于条件所限只能测试处理 一帧图象所用的时问。下表分别显示处理单幅图各个环节的运行时间。 z e r n i k e 矩边 h o u g h 变换 处理一幅图象 目标 关键点的提取 缘检测时问r h t 变换 时间 t ( 时间)1 0 5 m s6 m s 2 2 6 m s 3 4 2 m s 3 6 0 m s ;4 5 7 m s 如果能够把z e m i k e 矩边缘检测和后面的算法分开用硬件实现,那么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论