版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于霍夫变换的圆形识别目 录摘要1ABSTRACT2第一章 绪论3 1.1 论文的研究背景3 1.2 图像识别技术的现状3 1.3 本文的主要内容5第二章 图像预处理7 2.1 简介7 2.2 图像的灰度化7 2.3 二值图像8 2.4 边缘检测9第三章 圆形识别的研究13 3.1 霍夫变换简介13 3.2 标准霍夫变换检测直线14 3.3 圆检测原理15 3.4 圆形识别的研究17 3.5 本章小结21第四章 圆的拓展椭圆22 4.1 椭圆的研究22 4.2 研究成果23 4.3 本章小结25第五章 论文总结26参考文献27致谢28附录1 圆形识别的程序29附录2 椭圆的程序31摘要在计算机
2、视觉领域中,图像识别近几年受到广泛热议。随着现代科学技术的不断发展,图像识别技术的应用范围也越来越广泛,例如,人脸识别,指纹识别,车牌号的特征识别等。本文根据霍夫变换和图形的几何特征,提出了一种图像识别方法。在图像检测中,圆的检测是非常重要的。在圆形检测中,霍夫变换是使用最多的一种方法。本文介绍了霍夫变换识别圆的算法,并对椭圆进行了研究。本文给出了图像识别的四个步骤:第一,图像预处理,目的是将图形物体与背景区分开。预处理运算能够获得目标物体的信息,然后检测出图像的边缘。第二,基于霍夫变换的圆形识别的研究。第三,椭圆的研究。最后,对研究的成果进行了总结。关键词:霍夫变换;边缘检测;图像识别;圆形
3、识别。ABSTRACT In the field of computer vision, image recognition has been a hot issue for several years. With the continuous development of modern science and technology, image recognition technology has been used widely. Such as, face recognition, fingerprint recognition and character recognition of
4、license plate number. We propose an image recognition method based on the Hough transform and the geometric characteristics of graphics.Circles are very important in the image detection. The Hough transform is widely used in solving this problem. This article describes the Hough transform algorithm
5、to identify the circle and the ellipse. This paper describes four steps of image recognition. First, the image preprocessing. The purpose is to separate graphical objects from the background. Preprocessing operation can achieve the information of the target object, and we need to detect the edge of
6、the image. Second, based on the study of circular Hough transform identified. Third, study on the ellipse. Finally, summarize the results of the work.Keyword: Hough transform, edge detection, image recognition, circle recognition.第一章 绪论1.1 论文的研究背景随着科学技术和信息技术的不断发展,图像的处理与识别已经覆盖我们生活的各个方面。在日常生活中,可以通过图片获
7、取我们所需要的信息,并且在人们之间相互传递。另外,图片不受语言和地域的限制,有利于人们之间的交流。图像识别技术是人们根据图像的固有特性,先对图像进行特征提取,然后再对图像进行识别和处理的一种技术。图像识别的应用范围非常广泛,例如,能够进行指纹识别的手机,车牌号的识别,药品检测,工业生产中对原材料的检验等方面。图像识别就是借助计算机去读取图片中的信息,并根据要求作出判断。借助图像识别技术,我们可以通过对图片的搜索,快速的获取信息。在2011年,李彦宏曾说过“全新的读图时代已经来临”。有时候,我们更加倾向于通过图片获取信息。如今,越来越多的互联网行业和科技公司开始组建研发团队,从事图像识别技术的研
8、究。我们所熟悉的微软、谷歌、亚马逊等都在注入大量的资金从事这项研究,致力于往更加智能的方向发展。 现如今,图像识别技术发展迅速,引领着时代潮流。这篇论文主要是根据图像识别的理论基础,利用matlab,研究图像识别。1.2 图像识别技术的现状数字图像处理技术范围很广,主要包括图像增强、图像去噪、图像分割以及边缘检测等,它的目的主要是对原始的图像进行处理,以便于人眼的观察和机器的识别。模式识别在60年代得到了迅速发展,并取得了众多的理论研究成果,其应用领域也扩展到很多的方面,比如语音识别、图像识别、信息检索以及视频识别等领域。模式识别是利用计算机来实现人类的识别能力,该技术主要是对图像的特征进行提
9、取,并且根据图像的特征进行目标物体的分类与识别。国外对图像识别的研究主要集中在80年代以前,国内的理论研究较少。但随着计算机的的普及与发展,运算能力显著增强。图像识别的系统主要包括三个部分:图像信息的获取、特征提取和分类判决。图像信息的获取主要是把图片、文字等用扫描仪变换为电信号,再进行处理;特征提取就是找出能反映物体本质的特征;分类判决就是根据提取的特征做出分类总结的过程。我们在进行图像识别前,首先要对图像进行预处理,然后对图像的特征进行提取,进而加以判断和分类,从而达到识别的目的。常见的图像识别方法主要有四种:统计图像识别方法、结构图像识别方法、模糊图像识别方法以及神经网络图像识别方法。在
10、我们的生活中存在很多图像识别的应用,例如身份证中的人脸识别和指纹识别,交通管制中的车牌识别,工业生产中零部件的识别和分类等。图像识别技术主要是利用计算机系统对图像进行分析和处理,以此来识别不同的图像的一种技术。自图像识别诞生以来,主要经历了三个阶段:第一,是文字识别,开始于1950年,主要是对一些简单的数字、字母以及符号进行识别,是图像识别的基础,应用非常广泛。第二,是数字图像处理与识别,开始于1965年,相比于模拟图像来说,存储方便,传输过程不易失真,该研究广泛应用于企业生产和我们的生活中。第三,是物体识别,与前两者相比,较复杂,同时也存在一些不足,经常会受到噪声的干扰,检测不准确。在图像识
11、别过程中,需要有当时信息的录入和原始记忆信息的存储。只有通过对两种信息之间的比较和加工,才能实现对图像的识别。随着计算机识别技术的发展,搜索引擎逐渐完善,引擎可以给每张图片加上标签。当我们想要查找某个特定的图片的时候,输入关键字,搜索引擎就可以快速识别。另外,无人机以及自动驾驶也依靠图像识别,更加准确的识别周围的物体,对人们的生活带来便利。下面结合图片介绍两个具体的应用,图1.2.1(a)是在2012年中科院自动化研究所,研制的机器人,它能够识别不同的人。其原理主要是对机器人进行一些基本信息的录入,以及对不同人的脸进行扫描。当再次靠近机器人的时候,它就能认出靠近的这个人。另外,机器人还能根据之
12、前输入的一些基本信息与识别出的这个人进行互动。(b)图是对车牌号进行识别。车牌识别是图像识别的一个重要应用,它主要有三部分组成:图像输入、牌照定位与分割、字符识别。车辆进出停车场,不需要刷卡就能直接进出,加快了车辆进出的速度,减少了管理人员的支出。车牌识别技术的目的是从汽车牌照中提取车牌信息并识别出来。应用的主要技术包括车牌信息的提取、图像预处理、车牌特征的提取等技术,以此来识别车辆牌号和颜色等信息,方便快捷,主要应用在车辆检查、停车场管理以及高速公路的收费管理等方面。 (a) 机器人 (b) 车牌号的识别图1.2.1 图像识别直线、圆、椭圆是自然界中常见的一些基本图形,它们组成了更多复杂的图
13、形,所以研究图像识别的意义重大。另外,图像识别技术也将朝着更加精确、快速的方向发展,涉及到交通、公安、医药、农业、航天、工业等众多领域,给我们的工作、生活带来了极大便利。霍夫变换是研究图像识别的常用方法,它是在1962年提出的一种线性描述方法,主要检测图像中的直线,但直线斜率不存在的时候就无法检测出来。Duda和Hart提出了标准的霍夫变换,解决了这一问题,它的基本思想是通过直角坐标和极坐标之间的变换来检测直线和曲线,把图像空间中的每个边缘像素点映射到参数空间,进行边缘累积,最后形成峰值点。霍夫变换是进行图像识别的常用方法,应用广泛。它主要是从原始的图像中分离出相同的图形,例如,在一幅有三角形
14、、矩形、圆和椭圆的图形中,找出所有的圆。另外,与其它方法相比,霍夫变换具有独特的优点,能够减少噪声的干扰,从而减少目标的错误识别。本文研究的重点是标准的霍夫变换,它经常用来识别直线、矩形、圆、椭圆等,能够快速的识别出我们所需要的某种图形。基于霍夫变换的圆形识别的研究主要是通过霍夫变换原理来实现的。最初,通过霍夫变换对直线进行了研究,其原理是把图像空间上的每一个点映射到参数空间,形成一条直线或曲线,图像空间中的所有的像素点在参数空间形成一个交点。同理,参数空间上的一个点对应到图像空间变成一条直线,这样就可以检测出我们所需要的直线。在此基础上,把直线检测扩展到圆、椭圆等,维度增加,计算量增大。为了
15、进一步加快运算的速度,对霍夫变换做了一系列的改进,例如随机霍夫变换、基于梯度信息的霍夫变换等。1.3 本文的主要内容本文主要的研究内容是霍夫变换的圆形识别。圆的图片选取了五张,首先对图片进行灰度化、二值化,然后进行边缘检测。通过霍夫变换原理的理解和分析,进行圆形识别,最后整理效果图。本文的安排如下。第一章为绪论,阐述了论文的研究背景,总结回顾图像识别技术的现状,以及本文的主要内容。第二章为图像预处理,简单介绍了图像的灰度化、二值化以及边缘检测,目的是将目标物体与周围的环境隔离开。 第三章为圆形识别的研究,对霍夫变换原理做了简要介绍,通过对直线检测的理论推导引出圆。重点对圆检测的理论进行推导与分
16、析,借助matlab对图像进行了识别,给出了实验效果图。第四章为椭圆的研究,把图形从三维空间的圆拓展到五维的椭圆,并对相关理论及结果做了推导与分析,编写程序,给出效果图。 第五章进行了总结,得出结论。第二章 图像预处理2.1 简介在一幅图像输入到计算机的时候,由于受到了各种条件的限制和噪声的干扰,输入的图像会失真,所以一般不能直接获取原始图像。为了便于特征提取,需要对图像进行预处理。比如,在获取图片的过程中,光照强度以及照相机的不同,获取的图片存在很大的差异,影响图片的质量,为图像识别的研究带来了不利的影响。因此,在图像识别之前,必须进行预处理操作,使处理后的图像易于目标的提取和图像模式识别。
17、 图像预处理一般包括:灰度化,二值化,图像增强,图像去噪和边缘检测等,下面对预处理的过程做下简单介绍。2.2 图像的灰度化图2.2.1 图像的灰度变换灰度化是一种常用的图像处理方法,目的是将彩色图像转化为灰度图像,主要应用在图像的识别与分析中。我们在研究图像识别的过程中,对彩色图像的颜色信息进行识别,容易受到复杂背景的影响,存在缺陷,然而灰度图像是一种简单的对比度增强方法,所以图像识别的研究一般以灰度图像为研究对象。在自然界中,大多数颜色都可以看成是由红(R)、绿(G)、蓝(B)三种基本的颜色组成,不同含量的R、G、B组成不同的颜色。为了生动形象的描述灰度化,我们可以在直角坐标系中建立一个RG
18、B的空间模型,该模型的原点对应的是黑色,距离原点最远的那个顶点对应的是白色。连接原点和这个顶点,该线段对应了从黑色到白色的灰度值,也称亮度值。从图2.2.1的流程图中,我们可以看出图像的灰度变换过程。彩色图像中的每一个像素的颜色都是由R、G、B三个分量决定的,而每个分量都有255个值,在RGB彩色空间中,大约有1600万种不同的颜色。灰度图像只含有亮度信息,不含色彩信息,其亮度是连续变化的,要表示灰度图像就需要把亮度值进行量化,通常把灰度划分为256个灰度级,从0到255。灰度值越接近于0,对应像素点越接近黑色。灰度值越接近于255,对应像素点越接近白色。另外,我们称灰度图像是一种特殊的彩色图
19、像,其中R、G、B三个分量相同,并且一个像素点有255种变换。在图像识别中,为了减少图像的计算量,将各种图像转变为灰度图像。灰度图像和彩色图像都反映了整幅图像的色度和亮度等级的特征,图像的灰度化可以用多种方法来实现:第一种,先求出每一个像素点的三个分量R、G、B,然后取平均值,并把这个平均值赋给该像素的三个分量;第二种,先求出每个像素点的R、G、B三个分量,然后取三个分量的最大值,并把最大值赋给这个像素的三个分量;第三种,在YUV的颜色空间中,Y分量的意义是点的亮度,能够表示出一幅灰度图。根据RGB和YUV颜色空间的变化,建立亮度Y与R、G、B三个颜色分量的对应关系: (2-1)其中Y是灰度化
20、后的灰度值,R、G、B分别是原真彩图中的红、绿、蓝灰度分量,用亮度值来表示图像的灰度值。 2.3 二值图像图像二值化是图像处理的一种基本技术,也是图像处理技术的预处理技术,又称图像黑白化。通过二值化的处理,可以凸显出图像的轮廓。其像素点的灰度值设置为0或者255,不会出现其他的灰度值,目的是使整个图像都呈现出黑白效果。通过选取合适的阈值,将256个不同等级的灰度图像进行划分,划分结果仍然可以描绘图像的整体或局部特征,这样就实现了图像的二值化。在进行二值图像的处理与分析时,首先要对灰度图像进行处理,得到二值化图像。图像的集合性质与像素的多级值无关,只与像素值为0或者255的点的位置有关,从而简化
21、了图像处理,减少了数据的运算量。为了使输出的二值图像变得更加理想,通常采用封闭的或者连通的边界来定义两个不重叠的区域。如果像素点的灰度值大于或等于阈值,那么该点的灰度值用255表示,否则灰度值用0表示。 图像二值化是图像识别与处理中最常见的方法,图像二值化过程中可能会损失原图像的许多有用的信息,所以在进行二值化处理的过程中,关键是保留原始图像的主要特征,正确选择合适的阈值起到非常重要的作用。图像二值化的阈值选取有很多方法,主要分为三类:整体阈值法和局部阈值法。整体阈值法只使用了一个固定的阈值,大概分三种:第一,对RGB彩色图像灰度化后,扫描图像中的每一个像素值,大于或等于127的像素值设为25
22、5,小于127的像素值设为0。这种方法不仅减少了在图像识别过程中的计算量,而且加快了程序的运算速度。但是,这种方法存在很多缺点,直接设置阈值为127,并没有考虑像素的分布情况及像素值的特征,很难达到预设的要求,因此并不常用。第二,计算图像中像素的平均值,如果这个像素值大于或等于平均值,那就设为255,小于平均值,就设为0。该方法把平均值作为二值化的阈值,也可能导致部分像素丢失,不能真正的反映图片信息。第三,使用直方图的方法来确定二值化的阈值,在直方图中,我们可以看到图像的两个高峰,在两个高峰中间有个峰谷,阈值取该峰谷的值。该方法相对精准,能够较多的反映图片的信息,适用于质量较好的图片。整体阈值
23、法算法简单,对目标和背景明显分离,直方图呈双峰的图像效果较好。但是对噪声和光照的抵抗能力差,易受到限制。局部阈值法是由当前像素灰度值与该像素周围点的局部灰度值来确定,该方法的选取一般将图像划分成许多的子图像,在子图像上采用整体阈值法。例如将原始图像分成许多小块,各小块之间不相交。然后将各块图像的灰度值作为该小块的阈值。局部阈值法可以根据局部特征,自适应的选择阈值。该方法既可以有效地消除光照不均带来的影响,又能够消除伪影,提高运算速度,并有有较大的灵活性。但是局部阈值运算速度较慢。该方法实际上是在局部采用了上述的整体阈值法。局部阈值法一般处理外界干扰严重、质量较差的图像,与整体阈值法相比,应用比
24、较广泛。2.4 边缘检测边缘中包含物体的边界信息,这些信息可以用于图像分析、目标识别,并且可以通过边缘检测降低图像分析处理的数据量。边缘是指图像沿着某一特定方向发生强度变化的位置,至今为止,边缘还没有被广泛认可的数学定义。一方面是因为自然界的图像内容比较复杂,很难用数学理论进行描述,另一方面是因为人类对目标的边界认识还处在不断地完善之中。图2.4.1是边缘检测的步骤流程图,该过程列出了在图像识别前的边缘检测过程。该过程能够减少噪声的干扰,有利于后期的图像识别。图2.4.1 边缘检测步骤不同检测边缘的差异在于梯度分量以及梯度分量的滤波器类型。局部边缘变换越强,边缘特征越显著。边缘检测在图像处理和
25、识别中起着很重要的作用,检测效果的好坏将会直接影响图像识别的性能。边缘检测在1959年被提出,经过五十多年的发展变化,出现了许多边缘检测的算法。常见的边缘检测算法有Canny,Sobel,Prewitt,Roberts等算子,算子都经过四个步骤:滤波、增强、检测和定位。在边缘检测算子中,需要关注边缘的法线方向、边缘的方向以及边缘点的强度。一般而言,沿边缘方向的灰度变换比较平缓,边缘法线方向的灰度变换相对剧烈。一种好的边缘检测算子具有抑制噪声的能力,并且能够保持完整的边缘特性。为了降低噪声的干扰,用微分算子进行检测前先对图像平滑滤波,Canny算子是具有平滑功能的一阶和二阶微分算子,边缘检测效果
26、较好。下面重点讨论本文所采用的Canny算子。在使用霍夫变换之前,必须对图像进行边缘检测,这样可以增加实验结果的准确性。本文采用Canny算子对图像进行边缘检测。Canny算子是JohnF.Canny在1986年提出的一种多级边缘检测算法,其核心是一种一阶梯度方法,并使用二阶梯度的过零点来来定位边缘。Canny算子能够标出图像中的实际边缘,尽可能多地与实际图像中的边缘接近。Canny算子的边缘检测实现过程:(1)使用高斯滤波器对图像进行平滑处理,抑制了噪声,但是会使原始图像变得模糊。(2)再计算平滑后图像梯度的幅值和方向,找到梯度值最大的位置,这就是物体的边缘。Canny采用的卷积算子:其中、
27、为一阶偏导矩阵,得出梯度幅值、梯度方向的数学表达式: , (2-2) (2-3)(2-4)(2-5)求出这几个矩阵,完成进一步检测。(3)对梯度幅值进行非极大值抑制,能够更好的处理图像,细化边缘。比较各个像素点,保留每个像素点的最大值,删除其它的值,即置0。(4)最后,用双阈值算法处理图像,以检测和连接物体的边缘。设置一个高阈值和一个低阈值,高阈值可以减少假边缘,低阈值更好的使图像的边缘闭合。针对不同分辨率的图像,Canny算子使用了有向滤波器进行滤波,然后将滤波的结果融合起来构成边缘图。根据提出的不同要求,我们可以修改相应的参数,来识别不同的边缘特性,因此适用范围比较广。Canny算子在进行
28、边缘检测时必须满足以下两个条件:第一,能够有效地抑制噪声;第二,使错误的边缘点数量最少;第三,准确的找到边缘点的位置。Canny算子的核心是基于一阶导数的梯度方法,它使用二阶导数来定位边缘。基于以上原理,对圆以及椭圆的程序进行了编写,得出了一些效果图。如图2.4.2所示,选取了(a)、(c)三幅检测圆的图形,(b)、(d)是Canny算子对图像进行边缘检测得到的效果图。由于图像的质量以及外界干扰,边缘检测得到的效果图会出现模糊,但不会对图像的后续研究造成影响。 (a) 原图 (b) 边缘检测 (c) 原图 (d) 边缘检测 图2.4.2 圆的边缘检测效果图如图2.4.3所示,选取了(a)、(c
29、)两幅检测椭圆的图形,(b)、(d)是Canny算子对图像进行边缘检测得到的效果图。在后面对椭圆的研究中,使用了下面的图形。 (a) 原图 (b) 边缘检测 (c) 原图 (d) 边缘检测 图2.4.3 椭圆的边缘检测效果图第三章 圆形识别的研究3.1 霍夫变换简介霍夫变换是由Paul Hough首次提出的一种线描述方法,该方法经常用来检测图像中的直线,后来扩展到识别任意形状的物体,比如,矩形,圆和椭圆等。霍夫变换是通过直角坐标系和极坐标系之间的变换将图像空间中具有相同特征的直线或者曲线映射到参数空间中的一个点上,然后在参数空间中对点进行描述,使结果更易识别和检测,最后用累加器进行累加,从而把
30、检测图形的问题转化为寻找最大累加值的问题。设图像空间上的一条直线是y=x,我们取直线上的任意三个点:A(1,1), B(2,2), C(3,3)。我们可以得出,过A点的直线要满足方程1=k+b,过B点的直线要满足方程2=2k+b,过C点的直线要满足方程3=3k+b,这三个方程就对应着参数平面上的三条直线,这三条直线会相交于一点(k=1,b=0)。同理,图像空间上直线y=x上的其它点,例如(4,4),(5,5)等,也交于这一点。 对于图像上每一个像素点,求出参数平面中对应的直线,并统计该直线上所有的像素点出现的次数。我们需要找到参数平面上出现次数最多的点位置,那么出现次数最多的这个位置就是图像空
31、间上该直线的参数,这就是霍夫变换的主要思想。我们把图像平面上的像素点对应到参数平面上的线,然后通过统计特性来进行识别。如果在图像空间中有三条直线,那么在参数平面上就会看到统计的三个峰值点,最后通过遍历,找到峰值点对应的三条直线,这样就实现了直线的检测。霍夫变换常用来检测直线,下面就用直线来介绍霍夫变换的原理。在直角坐标系中有条直线: (3-1)其中k是斜率,b是截距。如图3.1.1所示,在直线上选取两个点A、B,带入方程(3-1),过A点的直线表示为,通过变形就可以表示为,即点确定了一条直线。同理,过B点的直线表示为,变形为,确定另一条直线。两条直线交于一点O,这个公共点就是AB所在的直线。因
32、此,我们可以知道,图像空间的一个点映射到参数平面上,就成为一条直线。图像空间中的每条直线都可以用k和b来表示,在参数空间的一个点对应到图像空间,就成为一条直线。只要找到参数空间最大累加值,就找到了图像空间中的那条直线。(a) 图像空间 (b) 参数空间图3.1.1 霍夫变换原理3.2 标准霍夫变换检测直线在上节介绍霍夫变换的理论的时候,对直线进行霍夫变换理论思想的诠释。但是,在实际操作中,当斜率趋于无穷大的时候,处理参数空间的累加值时,会出现问题。所以在这里采用极坐标的表示方法: (3-2)将x-y平面的图像变换到-平面,表示为直线相对于原点的距离,为直线的法线与x轴的夹角。霍夫变换是把-空间
33、细分为累加器单元。标准霍夫变换检测直线的步骤:(1) 首先得到边缘图像;(2) 对图像空间的每一个边缘像素,在参数空间中都可以画出一条线;(3) 对在参数空间每条线的交点进行“投票”,即累加;(4) 遍历参数空间,找出局部最大值。如图3.2.1 所示,基于霍夫变换的直线检测,在图像空间中的一条直线上有三个点,每一个点对应到参数空间都为一条曲线。在(a)中随机的选取三个点,在(b)中可以看出三条曲线交于一点。由此可以推出,在图像空间中的所有像素点,映射到参数空间都交于一点。直线上的每一个点在参数空间中变换为正弦曲线,并且都过p点,p点就是参数空间的局部最大值。(a) 图像空间 (b) 参数空间图
34、3.2.1 基于霍夫变换的直线检测3.3 圆检测原理根据上述的理论,对本次论文进行研究。利用霍夫变换进行圆检测,需要对圆及霍夫变换有一定的认识。霍夫变换圆检测的基本思想是将图像空间中的边缘像素点映射到参数空间,然后把参数空间中的坐标点元素对应的累加值进行累加,最后根据累加值确定圆心和半径。圆的一般方程可以写成: (3-3)其中(a,b)为圆心,r为半径。在直角坐标系中,将圆上的点(x,y)转换到极坐标平面中,对应的公式: (3-4)假设图像空间中的一个边缘点,以半径为映射到参数空间。将这个边缘点代入(3-4),再进行相应的变换,可以写成: (3-5)其中,由(3-5)的公式可以知道,对进行遍历
35、,那么图像空间上的点映射到参数空间为一个圆。由此我们可以推出,图像空间中的每一个边缘点对应到参数空间都是一个圆。如果我们在图像空间中取出A、B、C、D四个边缘像素点,以r为半径映射到参数空间。由图3.3.1可以看出,图像空间中的每一个点映射到参数空间都是一个圆,并且参数空间的四个圆交于点O。我们需要对参数空间中所以坐标点进行统计,找出参数空间累加值最大的点。半径已知的情况下,就存在、两个参数,在图像识别的过程中,需要求出、的值。根据下图可以得出,O点的累加值在参数空间中是最大的,也就是图像空间的圆心。(a) 图像空间 (b) 参数空间图3.3.1 二维空间效果图(半径r已知) 在实际操作中,并
36、不知道检测圆的半径,那么图像空间中的点映射到参数空间为,图像空间中的任意一点对应参数空间的一个圆锥面,这样圆的检测就从二维空间上升到三维空间,计算量明显增大。在图像空间取圆上的任意一点,由于r可以取任意值,那么映射到参数空间是一个圆锥。如图3.3.2所示,(a)为某一点在参数空间的显示,(b)为圆在参数空间的显示。从(b)中可以看出,多个圆锥交于一点,这个点反应出了圆的坐标和圆的半径。在圆形识别中,我们需要计算出最大累加值,就可以找到圆心和半径,然后通过遍历,标出所有的像素点。(a) 点在参数空间的显示 (b) 圆在参数空间的显示图3.3.2 三维空间效果图(半径r未知) 3.4 圆形识别的研
37、究在使用霍夫变换进行圆检测时,要对图像进行灰度化和二值化处理,提取图像的边缘信息,在图像识别中,使结果更加准确。圆检测的步骤:(1) 对需要检测的图像灰度化、二值化;(2) 对图像进行边缘检测;(3) 在参数空间-中建立一个累加数组,并设置该数组中的初值为零;(4) 然后对数组进行峰值检测,得到被检测直线的参数和。将参数空间等分成m行、n列,m为的等分数,n为的等分数,并设置累加值矩阵。设置半径最小刻度,角度最小刻度,半径的最大值,最小值。遍历所有的像素点,求出和的值。然后判断是否在矩阵中,如果在该范围内,累加器加1,从而获得霍夫累积矩阵。在圆的检测中需要设置阈值,最大累加值确定阈值。搜索超过
38、阈值的聚焦点,对应的参数就认为是圆的参数。阈值不同,检测的效果也不同,如果阈值设置为0.75,那么大于最大累加值的百分之七十五的累积矩阵对应的圆都可以检测出来。这次遍历目的是找出符合参数的像素,也就找到了圆的像素。根据霍夫变换的原理,编写程序,并运行。圆形识别的效果图如图3.4.1所示,(a)是原始图像,该图像中有圆、正方形和椭圆。该程序对图像中的每一个像素点进行遍历,在参数空间中进行累加,并对累加值进行分析。然后进行遍历,将参数空间中累加值最大的点对应的圆标出,从而得到(b)图。 (a) 原始图形 (b) 圆形识别效果图 图3.4.1 圆检测效果图在对圆检测的程序进行调试的时候,也出现了一些
39、问题。如果图片占用的空间比较大,那么运行的速度比较慢。在调试程序的时候需要设置阈值,不同的阈值检测效果存在很大差异,有时候阈值设置的太小,可能存在误检的现象。另外,我们需要根据数据游标估计圆的半径,设置半径的范围。检测的圆的半径必须在设定的半径范围中,否则不能识别出圆。上述的图形相对简单,接着对相对复杂的图形进行了调试、运行。在一幅图片中有许多的图形,比如正方形、长方形、圆、椭圆以及一些不规则的多边形。从图3.4.2可以看到,(a)、(c)是相对复杂的原始图像。根据上述原理,改变相应的参数,对图像进行调试,得到(b)、(d)图。由此可以得出,各图形之间不会受到相应的干扰,只检测出了圆,并没有出
40、现误检的现象,检测比较准确。 (a) 原始图形 (b) 圆形识别效果图 (c) 原始图形 (d) 圆形识别效果图图3.4.2 复杂图片的圆检测在实际操作中,为了减少运算量,我们需要设置合适的半径范围。另外,设置不同的阈值,检测结果也不同。如图3.4.3所示,(a)是原始图像,(b)是阈值为0.6的圆检测效果图,(c)是阈值为0.7的圆检测效果图,(d)是阈值为0.9的圆检测效果图。 (a) 原始图形 (b) 阈值为0.6 (c) 阈值为0.7 (d) 阈值为0.9图3.4.3 设置不同阈值的圆检测效果图由上图可知,阈值的设定对检测效果有很大的影响。当阈值设置为0.6的时候,能够检测出原始图像中
41、的三个圆,并且每个圆的边缘像素点比较多。当阈值设置为0.7的时候,能够完整检测出原始图像中的两个圆,还有一个较大的圆通过霍夫变换,只能检测出四分之三个圆,并不完整。而且每个圆的边缘像素点都比较少。当阈值设置为0.9的时候,最小的圆可以完全检测出来,最大的圆没有检测出来,还有一个圆的边缘像素点比较少,但是可以看出是圆。在圆的检测中需要设置阈值,根据最大累加值来确定阈值。搜索超过阈值的聚焦点,那么对应的参数就认为是圆的参数。阈值不同,检测的效果也不同。如果阈值设置为0.7,那么大于最大累加值的百分之七十的累积矩阵对应的圆都可以检测出来。在上图中,我们可以看出在阈值为0.9的时候,有的圆并没有识别出
42、来,这是因为该圆并没有超过最大累加值的百分之九十。相反,如果我们把阈值设置的比较小,这样检测出的图形较多。在检测圆的时候,有可能也识别出了类似圆的图形以及某些图形的边缘,造成了误识别的现象。所以在选取阈值的时候,需要根据实际情况而定。为了使圆检测便于识别,对上述的程序作了相应的改进。目的是将识别出来的圆在边缘检测的图形中凸显,易于人眼的观察与识别。图3.4.4不仅识别出了圆,而且用绿色线标出了识别的圆。从(b)、(d)三幅检测结果图片可以清楚地在看出圆与其他图形,从而达到了检测的目的。 (a) 原始图形 (b) 突出圆形 (c) 原始图形 (d) 突出圆形图3.4.4 绿色线标出圆的效果图 3
43、.5 本章小结本章主要介绍了霍夫变换检测直线的原理,并根据这一原理,分析、总结了霍夫变换圆检测的方法。在实现圆检测的过程中,根据不同的图像选取不同的阈值,参数空间的阈值选取依靠经验选取某一固定值,使检测的效果图更加明显。第四章 圆的拓展椭圆4.1 椭圆的研究圆和椭圆在使用霍夫变换进行检测时,都需要对图像进行边缘检测,提取图像的边缘信息,使图像识别更加准确。另外,圆和椭圆都是以标准方程为基础,根据推导结果编写程序,实现圆与椭圆的检测。用图像的特征把边缘像素连接起来,组成区域封闭边界,将图像空间中的点转换到参数空间。这样就能够对所有可能的边缘点进行统计,进行霍夫累积矩阵的变换,使每个边缘像素点变换
44、到霍夫空间,根据统计累加值来判断是否是我们所需要检测的图形。椭圆有5个自由参数,需要在五维的参数空间进行累加,与三维参数空间的圆相比,计算量明显增加。对于图像空间中的任意椭圆,我们可以通过对单位圆的变形得到,下面进行了一系列的推导: (4-1) (4-2)其中 是单位圆上的点,是比例因子,任意椭圆上的点。从(4-1)的公式可以看出,单位圆在比例因子的作用下,变换为圆心在原点的椭圆。然后进行旋转变换,正向旋转的角度为,最后进行上下平移。这样就得到了任意椭圆的极坐标方程。根据(4-1)和(4-2)两个公式可以得到:(4-3)对公式(4-3)变形: (4-4)通过比例因子对单位圆进行变换,成为中心在
45、原点的椭圆,然后对图形进行旋转,再进行平移,即可得到任意椭圆,如图4.1.1所示,可以看到在直角坐标系中的任意椭圆。图中的是比例因子,是椭圆的长轴,是椭圆的短轴。经过了上下左右平移,它是椭圆的中心坐标点。图4.1.1 任意椭圆4.2 研究成果圆形特征是自然界最基本的要素,在许多产品中都可以看到,在机器视觉领域得到广泛关注。圆形特征是二次曲线的一个特例,它在任意方向的投影都是一个椭圆。在数字图像中,识别出椭圆,将有利于在视觉领域中的定位。霍夫变换是一种检测曲线的方法,检测的曲线通常能够用参数表示,例如直线、圆、椭圆等。由于定义一个椭圆需要五个参数,霍夫变换需要使用五维累加器矩阵来构造参数空间。根据不同的图形,需要设置a、b的值,两个值的范围越小,图形的像素越小运行速度越快。由于椭圆用的是五维参数空间,需要较大的内存,所以在选取图片的时候,尽量取像素小的图片。具体实现过程:输入图片,对图像进行灰度化、二值化以及边缘检测,提取图像的边缘特征信息。把图像所在的参数空间等分成m行、n列,然后设置霍夫变换的累加值矩阵hough_space(p,q,a,b,theta)。设置倾斜角theta的最大值、最小值和步长,椭圆长轴的最大值和最小值,椭圆短轴的最大和最小值,令长轴、短轴和角度的步长都为1。设置参数空间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深度解析(2026)《GBT 33552-2017小型汽油机直联高速离心泵 性能评价规范》
- 深度解析(2026)《GBT 33446-2016家电物流服务通 用要求》(2026年)深度解析
- 深度解析(2026)《GBT 33381-2016汽车涡轮增压器用橡胶软管 规范》
- 任务7.3 能力诊断
- 医疗数据安全治理:区块链策略优化-1
- 医疗数据安全标准互认的技术标准推广策略
- 医疗数据安全成熟度评估模型构建
- 5G-A实训任务-专网理论课程1
- 医疗数据安全审计:区块链技术应用路径
- 胸椎解剖图课件
- 广东省湛江市2024-2025学年高一上学期1月期末调研考试物理试卷(含答案)
- 山东省济南市2024-2025学年高二上学期期末学习质量检测物理试卷(含答案)
- 2025年iba事业单位面试题库及答案
- 【《77500WDT散货船总体结构方案初步设计》18000字】
- 道路运输从业人员安全培训内容
- DB33∕T 2099-2025 高速公路边坡养护技术规范
- 2025版合规管理培训与文化深化试卷及答案
- 加盟卤菜合同范本
- 购买乐器合同范本
- 四川省成都市2024-2025学年高一上学期期末教学质量监测地理试卷(含答案)
- 2026年农产品营销技巧培训课件
评论
0/150
提交评论