(应用数学专业论文)人脸识别中的若干问题研究.pdf_第1页
(应用数学专业论文)人脸识别中的若干问题研究.pdf_第2页
(应用数学专业论文)人脸识别中的若干问题研究.pdf_第3页
(应用数学专业论文)人脸识别中的若干问题研究.pdf_第4页
(应用数学专业论文)人脸识别中的若干问题研究.pdf_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京理工大学硕士学位论文人脸识别中的若干问题研究 摘要 人脸识别是模式识别研究领域的重要课题,具有广阔的应用前景。本文以 人脸识别为主线,对人脸图像处理和识别过程中的一系列问题和方法进行了探讨 和研究。内容涉及c a n n y 算子、h o u g l l 变换、p c a 方法、形态学、肤色模型、 人脸特征轮廓的定位和提取等。基于c a n n y 算子,提出一种试探性边界提取方 法:基于h o u 【g h 变换,提出一种检测圆盘和圆的新方法;并对p c a 方法进行改 进,提出了一种边界加强的p c a 方法;同样对人脸下巴轮廓提取的抛物线方法 也进行了改进,并对正弦曲线方法提取下巴轮廓的可行性和适用性进行了探讨; 最后对“基于形状、肤色、知识和p c a 的人脸检测和识别系统”进行详细介绍, 并对某些关键部分编程实现,初步完成了正面人脸检测与识别系统。 关键字:人脸识别,人脸检测,特征提取,h o u g h 变换,c a n n y 算子,p c a ,肤 色模型,数学形态学 南京理工大学顾十学位论文 人脸识别中的若十问题研究 a b s t r a c t h u m a nf a c er e c o g n i t i o ni sa ni m p o r t a n ts u b j e c ti nt h ea r e ao f p a t t e r nr e c o g n i t i o n ,w h i c hh a s aw i d er a n g eo fp o t e n t i a la p p l i c a t i o n s t h i sp a p e rd i ds o m es e a r c h i n gi nt h er a n g eo ff a c e d e t e c t i o na n dr e c o g n i t i o n i ti n c l u d ec a n n yo p e r a t o r ,h o u g ht r a n s f o r m ,p c a ,m a t h e m a t i c a l m o r p h o l o g y , f a c ec o l o rm o d e la n df a c ef e a t u r e se x t r a c t i o n b a s e do nt h eo l dc a n n yo p e r a t o r ,w e p r o p o s e dan e we d g e se x t r a c t i o nm e t h o d b a s e do nt h er e s u l to fl i n ed e t e c t i o n ,w ep r o p o s e d an e w d i s k c i r c l ed e t e c t i o na l g o r i t h mt h r o u g hh o u g ht r a n s f o r m w ea l s op r o p o s e dan e wp c am e t h o d c o m b i n e dw i t he d g e s ,i m p r o v e dt h et o s sc u r v em e t h o de x t r a c t i n gc h i np r o f i l ea n dt r i e dt ou s es i n c u r v et oe x t r a c tc h i np r o f i l e i nt h el a s t ,w ea c h i e v e dt oc o n s t i t u t eas y s t e mu s e dt od e t e c ta n d r e c o g n i z eh u m a nf a c e k e y w o r d s :h u m a nf a c er e c o g n i t i o n ,f a c ed e t e c t i o n ,f e a t u r e se x t r a c t i o n ,h o u g ht r a n s f o r m , c a n n yo p e r a t o r , p c a ,f a c ec o l o rm o d e l ,m a t h e m a t i c a lm o r p h o l o g y 2 y 7 6 3 6 6 5 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生躲 掣 加年钼少日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:厘歪。茎 山r 年句影口日 南京理工丈学硕士学位论文人脸识别中的若干目题研究 1 绪论 人脸因人而异,绝无相同,即使一对双胞胎,其面部也一定存在着某方面的 差异。虽然人类在表情、年龄或发型等发生巨大变化的情况下,可以毫不困难地 由人脸来检测和识别出某一个人,但要建立一个能够完全自动进行人脸识别的系 统却是非常困难的。它牵涉到模式识别、图像处理、计算机视觉、生理学、心理 学以及认知科学等方面的诸多知识,并与基于其他生物特征的身份鉴别方法以及 计算机人机感知交互领域都有密切联系【”。 和指纹、视网膜、虹膜、基因、掌形等其他人体生物特征识别系统相比,人 脸识别系统更加直接、友好,使用者无任何心理障碍,并且通过人脸的表情姿态 分析,还能获得其他识别系统难以得到的一些信息。 2 0 世纪9 0 代以来,随着需要的剧增,人脸识别技术成为一个热门的研究话 题。虽然在这方面的研究已经取得了一些可喜的成果,但在实际应用中仍面临着 许多严峻的问题,人脸的非刚体性,表情、姿态、发型以及化妆的多样性都给正 确识别带来了困难。要让计算机象人一样方便准确地识别出大量的人脸,尚需不 同学科研究领域的科学家共同做出不懈的努力【1 i 。 1 1 人脸识别的研究内容 人脸识另o ( f a c er e c o g n i t i o n ) 一般可描述为:给定一幅静止或动态图像,利用 已有的人脸数据库来确认图像中的一个或多个人。从广义上讲,其研究内容包括 以下五个方面i l l 。 ( 1 ) 人脸检测( f a c ed e t e c t i o n ) :即从各种不同的场景中检测出人脸的存在并确 定其位置。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响。 ( 2 ) 人脸表征( f a c e r e p r e s e n t a t i o n ) :即确定表示检测出的人脸和数据库中的已 知人胎的描述方式。通常的表示方法包括几何特征( 如欧氏距离、曲率、角度等) 、 代数特征f 如矩阵特征矢量) 、固定特征模板、特征脸、云纹图等。 ( 3 ) 人脸鉴别( f a c ei d e n t i f i c a t i o n ) :即通常所说的人脸识别,就是将待识别的 人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当的 人脸表示方式与匹配策略。 ( 4 ) 表情分析( f a c i a le x p r e s s i o n a n a l y s i s ) :即对待识别人脸的表情进行分析, 并对其加以分类。 ( 5 ) 物理分类( p h y s i c a lc l a s s i f i c a t i o n ) :即对待识别人脸的物理特征进行分类, 南京理工大学硕十学位论文 人脸识别中的若干问题研究 得出其年龄、性别、种族等相关信息。 本文主要介绍狭义的人脸识别方法,不涉及表情识别和物理分类方面。一个 人脸自动识别系统包括三个主要技术环节,如下图所示: 图1 1 人脸自动识捌系统构成 下面就这三个过程作初步介绍: 首先是人脸检测与定位,是指对于任意一幅图片,确定其中是否包含人脸, 如果有,确定人脸的数目、位置和大小。人脸检测和定位是人脸识别的前提,它 的重要性日益受到关注。 在某些场合,拍摄图像的条件可以控制,比如警察拍罪犯的照片时要他们将 脸的某一部分靠近标尺,这时人脸的定位很简单。普通证件照片的头部占据了照 片中央的大部分地方,定位也比较容易。但在另一些情况下,人脸在图像中的位 置预先是未知的,比如在一些复杂背景中拍摄的照片,这时人脸的检测与定位将 受以下因素的影响: 人脸在图像中的位置、旋转角度和尺度不固定; 发型和化妆会遮盖某些特征; 图像中出现的噪声。 人脸检测和定位的过程可分为2 步:第一步是自动分割,即寻找人脸和眼睛、 鼻子、嘴的区域;第二步是定位,即将人脸与背景中其他种类的模式区分开。 其次是特征提取,特征提取之前一般需要做几何归一化和灰度归一化的工 作。其中前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;后 者是指对图像进行光照补偿等处理,以克服光照变化的影响。 具体的特征形式随识别方法的不同而不同。比如在基于几何特征的识别方法 中,这一步主要是提取特征点,然后构造特征矢量;在统计识别方法中,特征脸 方法是利用图像相关矩阵的特征矢量构造特征脸,而隐马尔可夫方法则是对多个 样本图像的空间序列训练出一个隐马尔可夫模型,它的参数就是特征值;模板匹 配法用相关系数做特征;而大部分神经网络方法则直接用归一化后的灰度图像作 为输入,网络的输出就是识别结果,没有专门的特征提取过程。 最后是人脸识别,是指基于己知的人脸样本库,利用图像处理和模式识别技 术从静态或动态场景中,识别或验证一个或多个人脸。数据库里预先存放了已知 的人脸图像或有关的特征值,识别的目的就是将待识别的图像或特征与库里的进 行匹配。 识别的任务主要有两个:一个是人脸辨认,即确定输入图像为库中的哪一个 2 南京理工大学硕士学位沦文人脸识别审的若干问题研究 人,是一对多的匹配过程:另一个是人脸证实,即验证某个人的身份是否属实, 是一对一的匹配过程。 根据输入图像的性质,可以将人脸识别分为静态图像的人脸识别和动态图像 序列的人胎识别两大类。前者主要是用静态图像如:从证件照片、罪犯照片、场 景照片上扫描的图像等进行识别:后者则是用摄像机摄取的时间图像序列进行识 别。 通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用 特征提取技术还可进一步抽取出更多的生物特征,如:种族、性别、年龄 人脸识别技术在国家重要机关及社会安防领域具有广泛而特殊的用途。例 如:公安系统的视觉监控、证件和各类金融卡持有人的身份验证等。 同其它人体生物特征( 如:指纹、掌纹、虹膜、语音等) 识别技术相比,人脸 识别技术的隐蔽性最好,是当今国际反恐安防最重视的科技手段和攻关目标之 一。另外,人脸识别技术还可应用于多媒体数据库的视频检索,以及多媒体制作 方面。 特别是近几年,随着计算机硬件和软件技术的发展,基于人脸识别技术的表 情信息提取也成为可能,它可用于改进人机交互方式,从而产生更加人性化、智 能化的计算机系统。 人脸识别技术的发展正是受到商业应用需求的推动,以及相关技术的发展而 得到空前的重视,成为图像识别和理解领域中的研究热点。 1 2 人脸识别的方法综述 人脸检测和识别的大部分算法可被归纳为以下两种:一种是基于特征的算 法,另一种是基于整体的算法。 基于特征的算法又称为几何信息法。人脸图像可以被看作一个椭圆中的特 征集,可用一个清楚的模型来表示。几何信息法提取人脸的各种几何特征,如五 官的空间位置分布规则、人脸的轮廓规则等。通过检测图像中是否存在满足这些 规则的图像块即可判断是否有人脸,其中:使用较多的是人脸的器官分布规则。 现有的特征点自动定位算法并没有提供一个很高的准确率,且需要相当的计算 量。 基于整体的算法是将人脸图像考虑为所有可能图像的一种特定事件,对所 得到的图像的窗口进行分析,进而确定这些窗口中是否包含人脸或部分背景。可 用概率或统计的模型来分析每个子窗口中的象素密度。而这个模型可用不同的方 法来建立,如特征脸方法、神经网络方法、支持向量机等等。 目前人脸检测和识别的主要具体方法有下面几种: 南京埋工大学硕:l 学位论文人脸识别中的若干问题研究 1 2 1 基于几何特征的识别方法 几何特征法就是用研究几何特征的方法进行人脸识别。例如计算诸如鼻子宽 度和长度、嘴的位置、以及它们的相对位置、下巴形状等作为人脸几何特征集。 然后利用这些几何特征进行定位和识别。几何特征法需要精确测量特征之间的距 离,该方法对于在大的脸部数据库中寻找可能的匹配最为有效。但在其他的应用 中,则需要首先自动定位这些特征点,而且特征定位算法的准确率决定了最后的 结果。 1 2 2 基于肤色特征的识别方法 这里首先要确定肤色的色度空问,常用的r g b 空间不是表征肤色的最佳模 型,在r g b 空间中,向量 r ,g ,b 不仅反映颜色,也反映亮度,而人类对相同 颜色不同亮度的物体视觉感知是不同的,所以通常要去掉亮度信息。 在归一化的三基色空间中: r g b f 1 + g + 功 ;f 0 i o l 0 1 皿+ g + b ) o o 0 1 限+ g + b ) 因为r + g + b = 1 ,所以可以利用来表示色度。用色度表示人脸特征具有姿态不 变性,在三维人脸的不同视平面具有相同或相近的色度分布,利用直方图模型可 以分割出人脸区域。当然也可以用h i s 空间,将图像映射到h i s 空间直接提取色调 信息h ,在h 空间分割可以不受亮度、对比度变化的影响,但是只用h 空间的信息 还是不够的。有一些色调和肤色相近但从视觉上又不属于肤色,这些色调可以从 亮度和饱和度上进行区别,所以在基于直方图模型的分割方法中可以先在色调空 间进行分割,然后在亮度空间进行分割。 基于肤色模型的识别方法比较简单、速度快,能够快速定位人脸区间,但是 它受光照条件的影响也较大,所以利用肤色模型分割时通常先用较精确的模型分 割图像,若没有发现人脸,再放宽精度再次分割,不管怎样,利用肤色像素在色 度上的相似性和空间上的相关性分割出入脸区域,都需要利用区域的几何特征或 灰度特征进行验证,所以基于肤色的分割识别算法通常作为其它统计模型的辅助 方法使用。 4 南京理工大学硕士学位论文人脸识别中的若干问题研究 1 2 3 基于特征脸的主成分分析方法 p c a 是用于特征选择和降低图像维数的一种通用方法,又称为k l 变换法。它 根据图像的统计特征进行正交变换( k l 变换) ,以消除原有样本之间的相关性, 变换得到依次递减的特征值所对应的特征向量,即特征脸。 设x 属于r n 是代表一幅图像的随机向量,其中n 为图像空间的维数,图像已被 归一化处理。x 的协方差矩阵定义为: = e 【x e ( x ) 】【x e ( x ) 】t 其中:e ( x ) 是期望算子;t 表示转置运算,且i r。随机向量x 的p c a 将 协方差矩阵分解为:中7 a 驴 其中:中= f 中“o 。一二函也i = d i a g , b j 此处驴为正交特征 向量短阵,以为对角矩阵。 p c a 的一个重要特征为当仅用主元素的一个子集来代表原始信号时,可进行 最优化信号重建。因此可得到y = p x ,低维向量y 是m 维的,它只捕捉了原始数据x 的最具代表性的特征,p 为一n 丰n 的矩阵。 首次将p c a 应用于重建人脸的是k i r b y 和s i r o v i c h ,他们指出任何人脸都可以 由特征图坐标空间来表示,而且只使用特征图的一个较小的集合及其投影便可重 建任何一张人脸。这就是著名的特征脸方法。特征脸相当于人脸协方差矩阵的主 特征值有关的特征向量。特征脸定义了一个特征空间,或“人脸空间”,它大大降 低了原始空间的维数,在这个低维空间中可进行人脸检测和识别”。 特征脸技术主要是利用样本集合整体散射来评估转换算子w ,但是考虑到整 体散射包含了样本集合中类间散射和类内散射,应该尽量降低类内散射,增大类 间散射,即不同类样本尽可能远,同类样本尽可能近。 利用特征空问变换的识别方法虽然在统计意义上可达到最优,但是应该看到 这个最优是基于有限样本空问的,不能代表整个事例空间,而且由于样本图像通 常按行列顺序展开形成一维向量,丢失了人脸的很多拓扑信息,用于识别的特征 向量不仅包含了人脸的信息而且包含了亮度信息,因而这种方法的缺点是对光照 条件的改变较敏感。如果提供了在光照条件变化下的人脸图像,则投影矩阵保留 的主要元素会因光照而改变。于是,投影矩阵中的点便不能被很好的分类,甚至 会变得轮廓不清。 1 2 4 基于人工神经网络的方法 人工神经网络方法是把模型的统计特征隐含于神经网络的结构和参数中,对 于人脸这类复杂的、难以显式描述的模型,基于人工神经网的方法具有独特的优 南京理工大学硕士学位论文人脸识别中的若干问题研究 势。 r 0 1 w l c y 建立了一种三层向| j i f 网:输入层对应2 0 2 0 像素的图像区域:隐层 分为2 6 个单元,其中4 个单元处理区域为1 0 x1 0 像素,1 6 个单元为5 5 ,6 个单元 为2 0 5 ,如下图。隐层的输出与输出层相连进行综合判断,输出区间的值表示 这个区域是否为人脸。为了解决人脸姿态的问题,r o w l e y 分别设置了三个姿态检 测器,对输入图像先进行预处理,尽量消除光照的影响,然后送入姿态检测器, 估计人脸的姿念,经校准和预处理后,送入三个检测器( 正面人脸、半侧面和侧 面) ,最后对检测器的结果进行综合判断”7 。 h i d d e nu n i t s o o _ oo 图1 2 三层向前网结构 人工神经网的方法便于建模,鲁棒性较好,但是运算速度较慢。 1 3 本论文研究的内容和要完成的工作 o u t p u t o 本文的选题初衷是想利用多年的编程经验和对图像识别的了解和把握构建 一个基本适用的正面人脸识别系统,并借此过程对一些关键问题和算法进行探 讨。因此,整个论文的主线是人脸识别,而研究的重点是对人脸图像处理和识别 过程中的一系列问题和方法的研究。 具体主要工作如下: ( 1 ) 对c a n n y 算子进行改进,提出试探性边界提取方法。( 第二章内容) ( 2 ) 基于h o u g h 变换,提出了一种检测圆盘和圆的新方法。( 第三章内容) ( 3 ) 对人脸下巴提取的抛物线方法进行了改进,并对正弦曲线方法提取下 巴轮廓的可行性和适用性进行了探讨。( 第四章内容) 6 南京理工大学硕士学位论文人脸识别中的若干问题研究 ( 4 ) 对p c a 方法进行改进,提出一种边界加强的p c a 方法。( 第五章内容) ( 5 ) 对形态学图像处理,进行了介绍,尤其对c b 形态滤波进行了介绍和探 讨。 ( 6 ) 对“基于形状、肤色、知识和p c a 的人脸检测和识别系统”进行详细 介绍,并对某些关键部分编程实现。 文中的模型和方法,除了p c a 方法用m a t l a b 实现为,其余的都用v c 6 0 编 程实现。第六章的正面人脸检测与识别系统由于时间问题,只对其中的部分 内容加以实现。在短时间内只实现了静态人脸的检测和识别。 7 南京理工大学硕上学位论文人脸识别中的若干问题研究 2 一种基于c a n n y 理论的边缘提取方法 边缘信息是图像的重要特征信息。因此,边缘检测的方法研究是图像分析 和识别领域中一个十分引人关注的课题。传统的边缘检测算子如r o b e r t s 、 s o b e l 、p r e w w i t 、k i r s c h 和l a p l a c i a n 等都是局域窗口梯度算子,由于它们对 噪声敏感,所以在处理实际图像中效果并不理想。 1 9 8 6 年c a n n y 把边缘检测问题转换为检测函数极大值的问题。指出边缘检 测算子应满足以下3 个判断准则:( 1 ) 低错误率,即要少将边缘像素漏掉,也要 少将非边缘点误判为边练点。( 2 ) 检测位置精度高,即检测出的边缘点位于真正 的边界上。( 3 1 每个边缘点的响应是惟一的,即得到的边缘宽度为单像素。 并由此推导出了最佳边缘检测算子c a n n y 算子。c a n n y 算子是一类具有 优良性能的边缘检测算子,在边缘检测方面获得了良好的效果,很快就成为评价 其他边缘检测方法的标准。并在许多图像处理领域得到广泛应用。 然而在实际应用中发现,由于要受各方面因素的影响,图像中往往存在噪 声以及模糊的边缘,或者整个图像范围内对比度不一致。在这种情况下,如果简 单的使用c a n n y 算子进行边缘检测,一方面很难设定高、低阈值参数,另一方面 无法消除局部噪声干扰,在检测出假边缘的同时还可能会丢失一些灰度值变化缓 慢的局部边缘。 为此,本文提出一种基于先验经验的指导性c a n n y 算法。它利用先验知识 和梯度直方图产生阈值;并根据低噪音图像边缘特征走向指导图像恢复边缘,从 而解决了上述问题,并在实际应用中获得了较好的效果。 2 1 传统的c a n n y 边缘检测算法 2 1 1 平滑图像 c a n n y 边缘检测算法是高斯函数的一阶导数,是对信噪比与定位精度之乘积 的最优化逼近算子。c a n n y 算法首先用二维高斯函数的一阶导数,对图像进行平 滑,设二维高斯函数为”: g ( x ,y ) = 刍e x p ( - 等) ( 1 ) 其梯度矢量为: 南京理工人学硕士学位论文人脸识另忡的若干问题研究 v g :o g 0 x 1( 2 ) 【0 g o yj 用分解的方法提高速度,把v g 的2 个滤波卷积模板分解为2 个一维的行列滤波 器: 熹一印( - 等h 割呐畎v , 等2b e 文一导) 唧( - 鲁) 吐c 咖z c x , c 。, 其中,茁为常数,盯为高斯滤波器参数,它控制着平滑程度。对于盯小的滤波器, 虽然定位精度高,但信噪比低;仃大的情况则相反,因此要根据需要适当的选取 高斯滤波器参数盯。 2 1 2 计算梯度的幅值和方向 传统c a n n y 算法采用2 2 邻域一阶偏导的有限差分来计算平滑后的数据阵列 i ( x ,y ) 的梯度幅值和梯度方向。其中,x 和y 方向偏导数的2 个阵列严只( i ,j ) , 和只( i ,j ) 分别为”7 : p :b ,j j = ( i 【i ,j + 1 卜l i ,j 】+ i t i + l j + 1 】一i f i + l ,j j ) 2 ( 5 ) p y 【i ,j 】= ( i 【i ,j 卜i 【i + l j 】+ i i ,j + 1 】一i i + 1 ,j + i j ) 2 ( 6 ) 像素的梯度幅值和梯度方向用直角坐标到极坐标的坐标转化公式来计算,用二阶 范数来计算梯度幅值为: m i ,j 】= p 。【i ,j 】2 + p ,【i ,j 】2 ( 7 ) 梯度方向为: 口【i ,j 】= a r c t a n ( p ,【i ,j 】只【i ,j 】) ( 8 ) 2 1 3 对梯度幅值进行非极大值抑制 为了精确定位边缘,必须细化梯度幅值图像m i ,j 中的屋脊带,只保留幅值 局部变化最大的点,这一过程就是非极大值抑制。在非极大值抑制过程中,c a n n y 算法使用3 3 大小,包含8 方向的邻域对梯度幅值阵列m i ,j 的所有像素沿梯 度方向进行梯度幅值的插值。在每一个点上,邻域的中心像素m i ,j 与沿梯度 方向的2 个梯度幅值的插值结果进行比较,; i ,j 是像素邻域中心处沿着梯度 方向的扇形区域,非极大值抑制在此区域进行。如果邻域中心点的幅值m i ,j 不比梯度方向上的2 个插值结果大,则将m i ,j 对应的边缘标志位赋值为0 ,这 9 南京理t 大学顾士学位论文人脸识别中的若干问题研究 一过程把m i ,j 宽屋脊带细化为一个像素宽,并且保留了屋脊的梯度幅值。非 极大值抑制( n o n 朔a x i m as u p p r e s s i o n ,n m s ) 过程的数学表示为”: n i ,j 】_ n m s ( m i ,j l ,卵,j 】) ( 9 ) 2 1 4 检测和连接边缘 双闽值算法是对经过非极大值抑制和梯度直方图分类的子图像n i ,j 分别 使用高、低2 个阕值f 、和f ,分割彳导到2 个阈值边缘图像l i ,j 和t i i ,j 。由 于图像t 。 i ,j 是由高阈值得到,因此它应该不包含有假边缘,但t h i ,j 可能在 轮廓上有间断。因此双闽值算法要在t h i ,j 中把边缘连接成轮廓,当达到轮廓 端点时,该算法就在由低阈值得到的边缘图像t 。 i ,j 的8 邻域位置寻找可以连 接到轮廓上的边缘,这样,利用递归跟踪的算法不断地在t 。 i ,j 中搜集边缘, 直到将t h i ,j 中所有的可能连接的间隙都连接起来为止。 2 2 c a n n y 算法的缺陷 传统c a n n y 边缘检测方法有以下缺陷: ( 1 ) 传统c a n n y 算子在2 2 的邻域内求有限差分均值来计算梯度幅值的算 法,对边缘的定位比较准确,但对噪声过于敏感,容易检测出假边缘和丢失一些 真实边缘的细节部分,实验效果不好。 ( 2 ) 传统c a n n y 算法的高、低门限修补不连续轮廓的思想,对整幅图像使用 固定的高、低阈值进行分割,无法顾及图像中的局部特征信息,一方面无法消除 局部噪声干扰,另一方面会丢失灰度值变化缓慢的局部边缘,导致目标物体的轮 廓边缘不连续,使分割效果受到影响。 ( 3 ) 因为传统c a n n y 算子高、低阈值的参数不是由图像边缘的特征信息决定, 而是需要人为设定,因此不具有自适应能力,自动化程度低。 因此针对上述缺陷,有些学者提出了一种基于梯度直方图的自适应动态阈 值方法。该方法将整幅图像分割为若干子图像,再根据非极大值抑制后的结果和 梯度直方图信息自适应地设定各予图像的高、低阂值,取得了一定的试验效果。 但是,直方图是一种统计信息,本身并不能排除局部噪声的干扰。因此, 自适应动态阈值方法,在当图像中存在较大噪声,以及模糊的边缘时效果并不是 非常好。 下面提出一种基于先验知识和已有轮廓的导向性c a n n y 边缘检测方法。 1 0 南京理t 大学硕士学位论文 人脸识别中的若干问题研究 2 3 导向性c a n n y 边缘检测方法 2 3 1 图像梯度直方图 梯度直方图是对整个图像边缘强度的统计信息。而在一幅图像中边缘只占很 小的一部分,因此描述图像边缘强度的梯度直方图同原图像的灰度直方图有很大 的不同。 具体表现在梯度直方图没有明显的双峰,梯度直方图只在对应图像中非边缘 部分有一个很高的尖峰,这反映了图像中非边缘的区域占了图像的绝大部分;梯 度直方图中对应原图像中边缘的区域没有显示出明显的尖峰,而是处于近似均匀 递减分布的状态;在梯度直方图中非边缘和边缘区域之问没有很明显的谷底界 限,因此不能简单地用灰度直方图判断双峰的方法分割梯度直方图。 2 3 2 某些特定图像的边缘特征 考虑到我们在对某些图像进行处理时,往往事先知道图像的整体特征。比如 在处理人脸图像时,我们对人脸的五官结构、布局是知道的。而这种先验知识对 c a n n y 算子的高、低闽值选取无疑具有指导意义。同时我们可以结合梯度直方图 对图像的信噪比有一定的了解。 2 3 3 低噪音图对高噪音图的指导性作用 c a n n y 算子在进行边缘连接时,用高噪音辅助图去修补低噪音基础图的过程, 本身可看成一种图像信息恢复的过程。这个过程当然应该受到已有边缘轮廓的影 响。因此,在图像边界提取时,可以先在高门限情况下提取低噪音基础图。利用 该基础图可以完成图像特征的基本定位工作。在对图像特征有基本了解和定位 后,再在低门限情况下提取出高噪音辅助图。然后结合图像特征和辅助图对基础 图进行修补,以进一步定位图像特征。 2 3 4 具体算法 ( 1 ) 根据具体图像,初步确定两组c a n n y 算子高、低阈值,一组用来提取 低噪音图,一组用来提取高噪音图 ( 2 ) 计算图像梯度直方图,根据直方图信息进一步调整两组高、低阈值 南京理工人学硕上学位论立人脸识别中的若干问题研究 ( 3 ) 利用低噪音图进行特征定位和提取。如在人脸识别中可用来初步检测 人脸及其特征( 如:人脸图像中的眼睛、嘴巴、下巴等) 。并根据局部区域分布, 把图像分成若干予图像。 ( 4 ) 重新统计各子图像梯度直方图,根据直方图信息和子图像的结构特征 进一步调整各子图像的两组高、低阈值。 ( 5 ) 利用高噪音图,对低噪音图进行特征修补,进一步细化局部边界。如 对眼睛区域边界细化时,可以结合眼睛的结构布局以及低噪音图的曲线走向等, 排除不可能边界。 2 4 试验结果及分析 该算法在人脸识别的具体运用中取得了较好的效果。在保持了传统c a n n y 算法优点的基础上,检测出了更多的边缘细节,假边缘更少。检测细节边缘的能 力优于传统c a n n y 算法。 实验检测结果如下图: 阁圈 图【2 1 l图【2 2 】 图【2 3 】 图【2 4 】 图【2 1 】原圈,图【2 2 】高门限图,图【2 3 】低门限图,图【2 4 】导向性加权边缘检测图 经多次实验,有下面结论: ( 1 ) c a n n y 试探性自适应算法普遍适用于各类图像的边缘检测。 ( 2 ) 本算法保持了传统c a n n y 算子的优点,提高了抑制噪声的能力。 ( 3 ) 本算法能够自适应的生成高、低阈值检测图像边缘,自动化程度高, 为实现自动匹配进行了有益的探索。 ( 4 ) 该算法也存在速度相对较慢的问题,这有待于进一步研究解决。 1 2 南京理t 大学硕士学位论文人脸识别中的若干问题研究 3 利用h o u g h 变换检测线段、圆域和圆及 其在人脸识别中的应用 圆的提取是图像理解系统中中层符号提取的重要方面,目前的圆提取算法中 用得最多的算法是随机h o u g h 变换( r h t ) 。但在处理复杂图像时,由于随机采样 仍引入大量的无效单元,从而造成大量无效累积。 h o u g h 变换的实质是将图像空间中具有一定关系的像元进行聚类,寻找能和 这些像元用某一解析形式联系起来的参数空间累积对应点。它在检测直线时,能 够巧妙地实现多到一的映射,从而避免- n 多映射的庞大计算量。 考虑到随机h o u g h 变换检测圆的局限性和h o u g h 变换检测直线时的优越性。 本文将对h o u 曲变换检测直线的方法进行拓展,提出了一种检测圆盘和圆的新 方法。 3 1 h o u g h 变换 h o u 曲变换是一种线描述方法。它可以将笛卡尔坐标空间的线变换为极坐标 空间上的点。如果用p 代表直线到原点的法线距离,0 为该法线与x 轴的夹角, 则可用如下参数方程来表示该直线。 这一直线的h o u 曲变换:p = x c o s o + y s i n o 在( x ,y ) 坐标系中通过公共点的一簇直线,映射到( d ,0 ) 坐标系中便是一个 点集。在( x ,y ) 坐标系中共线的点映射到( p ,0 ) 坐标系便成为共点的一簇曲线。 由此可见,h o u 曲变换使不同坐标系中的线和点建立了一种对应关系。 可总结h o u 曲变换的几点性质: ( 1 ) ( x ,y ) 域中的一点对应于变换域( p ,0 ) 中的一条正弦曲线。( 2 ) 变换域( p , 0 ) 中的一点对应于( x ,y ) 域中的一条直线。( 3 ) ( x ,y ) 域中一条直线上的n 个点对 应于交换域( p ,e ) 中经过一个公共点的n 条曲线。( 4 ) 变换域中一条曲线上的n 点对应于( x ,y ) 域中过一公共点的n 条曲线。 南京理工大学硕士学位论文 人脸识别中的若干问题研究 3 2 h o u g h 变换检测直线 在( x ,y ) 域中的每一离散数据点都可以变换为( p ,0 ) 域中的曲线。将p 和0 分成许多小段,每一p 小段和每一0 小段构成一个小单元( p ,a0 1 。对应于 每一个小单元可设一个累加器“”。 假设在( x ,y ) 域中有点x - ,y 1 ) ,它对应变换域上的一条曲线 p = x l c o s 0 + y t s i n o 。分别给0 。赋值使ol = 0 ,02 = a0 ,03 = 2 a0 ,o4 = 3 a0 ,相应便可求出相应的p i 值。得到( p l ,0 t ) ,( d2 ,e2 ) ,( ps ,03 ) 。 并分别在它们对应的累加器加一。 待全部( x ,y ) 域内全部数据点变换完后,可对小单元进行检测,计算落在各 小单元上的次数。这样,落入次数较多的单元,说明此点为较多曲线的公共点, 而该点对应到( x ,y ) 平面上的直线可以认为是较多点的公共直线。如果( pi ,0i ) 的计数器是n ,则说明有n 点共线。将曲线交点坐标( pi ,e ;) 代入 p = x c o s 8 + y s i n o 便可得到逼近这n 点的直线方程。 我们注意到h o u g h 变换检测直线时,只是统计了可能在同一条直线上的点, 而没有考虑点的相邻性,因此不能直接用来检测线段。下面介绍用h o u g h 变换检 测线段的具体算法。 3 3 h o u g h 变换检测线段 针对上述h o u g h 变换的局限性,对其进行改进,使检测结果不是直线,而是 具有确定长度和端点的线段。 为此,先定义用来存取线段和直线的数据结构: s t r u c tx i a n d u a n 线段的数据结构 c p o i n ts t a r t : c p o i n te n d : i n tl e n g t h : ) : c 0 b a r r a yx i a n d u a n a r r a y :用来存取共线线段的链表 然后定义下列变量: i n tt ;全局阈值,构成线段所需像素的最少个数 i n tm i n n u m b e r ;全局闽值,线段断开所需像素的最少个数 z h i x i a n z h i x i a n a r r a y pi i l a x 0m a x :存取直线的数组 1 4 南京理工人学硕士学位论文 人脸识别中的若干问题研究 具体算法步骤如下: ( 1 ) 根据x ;,y i ) 和0 。计算p 。得到所有的( p 。,0t ) ,i _ 1 ,2 ,3 ( 2 ) 对于( p 。,0 ,) ,如果z h i x i a n a r r a y 【p 。 0 。 的线段的链表x i a n d u a n a r r a y 中没有线段,或是线段已经断开( 断开点数是否大于m i n n u m b e r ) ,则在线段链 表中新增一线段节点,把x 。,y ,) 记为新线段的起始点。 ( 3 ) 对于( p 。,0 。) ,如果z h i x i a n a r r a y 【p , 0i 的线段的链表x i a n d u a n a r r a y 中有线段,且线段没断开,则把x 。,y 。) 记为线段链表末端线段的结束点。 ( 4 ) 对所有的( x ;,y i ) 重复1 、2 、3 步。 r 5 ) 统计所有线段,线段大于t 的汜为线段,小于t 的忽略不计。 3 4 h o u g h 变换检测圆盘和圆 考虑圆的的表达式: ( x + x o ) 2 + ( y + y o ) 2 = c 我们知道,确定上面方程表示的一个圆至少需要3 个参数: c 、x o 、y o 。 因此要检测一个圆将导致较大的计算量,事实上,超过两维的h o u g h 变换就已 不再具有较好的适用价值。 另外,目前较流行的方法是利用离散h o u g h ( m r r ) 变换进行圆的检测。其 主要思想是在图像空间随机选取不共线的3 个点映射成参数空间的一个点,是多 到一的映射,从而避免了传统h o u g h 变换- - 至r j 多映射的庞大计算。但在处理复杂 图像时,由于随机采样仍引入大量的无效单元,从而造成大量无效采样和大量无 效累积。 为此,我们提出一种基于h o u g h 变换检测线段的思想检测圆盘和圆。经试验, 取得了较好的效果。 算法的主要思想是:我们知道,圆盘可看成是过圆心的无数条线段组成的。 因此,我们可以在线段检测的结果基础上,对所有线段进行统计和检验。并利用 “变换域中一条曲线上的n 点对应于( x ,y ) 域中过一公共点的n 条曲线”这一性 质,就可初步检测出所有圆盘。 对于圆来说,我们可以先对图像进行反变换。这样,圆内部就构成一圆盘。 检测出所有圆盘也就检测出了原图像中的所有圆。 算法的主要步骤如下: ( 1 ) 定义存取相同跃度线段的变量数组,设m a x l e n 为所有线段的最大可能长度。则作 如下定义: c o b a r r a yx i a n d u a n a r r a y m a x l e n ; 南京理工大学硕士学位论文 人脸识别中的若干问题研究 ( 2 ) 对所有线段进行分类,线段长度相同的放在同一个堆栈里。即:如果某线段长度为 l ,线段变量指针为:x i a n d u a n l ,则将该线段存放在第l 个堆栈里。即作如下操作: x i a n d u a n a r r a y l 】a d d ( x i a n d u a n l ) : ( 3 ) 对每个堆栈里的线段交点进行统计,如果有n 条线段交于一点,且n 大于预先设 好的阈值,则认为这n 条线段构成一个圆盘。它们的交点为圆心,长度为直径。f 具体统计 方法为:对每一个可能交点作一个计数器。最后计数器计数大于闽值的交点为可能圆心1 ( 4 ) 对所有堆栈重复第3 步,直至找到所有的圆盘为止。 ( 5 ) 如果要找所有的圆而不是圆盘,则在第一步之前先对二值图像作反变换。再在变换 后的图像里找所有圆盘,找到所有的圆盘后,圆盘边线即为所求圆。 3 5 检测圆盘和圆的实验结果及其分析 用v c 6 0 进行编程实验,实验结果如下图 一 图3 1图3 2图3 3 图3 4图3 5 ( 图3 1 :待检测圆盘,图3 , 2 :圆盘检测结果) ( 图3 3 :待检测圆,图3 4 :反色结果,图3 5 :检厕结果) 经多次实验,有下列结论: ( 1 ) 该方法基于线段的检测结果,因此检测圆盘速度快,但是在检测圆时由 于反色操作使像素值为1 的点大大增加,因此速度会有所下降,但还是在可接受 范围。相对于三参数的h o u g h 变换来说,计算量还是要少得多。因为毕竟前者 是n 3 数量级,而后者是n 2 数量级。( n 为像素值为1 的像素数) ( 2 ) 对完整的圆盘和圆的检测效果好,但抗干扰性不是很强。比如,当圆盘 或圆被部分遮挡时,有可能导致检测的失败。 ( 3 ) 在编程实现的具体操作过程,要求对误差范围有较好控制。比如线段相 等的条件,和像素重合的条件等等。当然这一点在离散数字图像处理的任何算法 实现中都存在。 ( 4 ) 第( 2 ) 条可以在增加对线段的统计条件的情况下适当加以克服。 ( 5 ) 总的来说,该方法速度快,直观、实现容易。在某些特定场合下检测圆 盘和圆,是一种值得参考和使用的好方法。 南京理_ r = 大学硕十学位论文 人脸识别中的若干问题研究 3 6h o u g h 变换在人脸检测识别中的应用 h o u g h 变换在人脸检测和识别中可以用于下列特征的提取: 1 、用于下巴轮廓的提取,这一点在第四章中将有详细介绍。 2 、假设人脸的姿态比较正,那么人脸的特征是水平边缘集中的区域,经过边界 提取后,可以用h o u g h 变换检测直线的方法,检测图像中的水平边缘。利用 h o u g h 变换检测直线前面已有介绍。 3 、利用广义h o u g h 变换定位眼球,具体步骤如下: ( 1 ) 根据图像特性,初步估计眼球半径的变化范围,r e ( m i n r ,m a x r ) ,并对每 个( x ,y ,r ) 设置计数器。 ( 2 ) 对范围附近的所有像素值为l 的任意两点( x 。y k ) 、( x ,y t ) 和一个r 。 都唯一地确定两个圆:( x x 。) 2 + ( y - y 。) 2 = r 。和( x x 。) 2 + ( y - y 。) 2 = r 。并且可求出它们 的交点。 ( 3 ) 对范围附近的所有像素值为1 的任意两点对任意的r7 ( m i n r ,m a x r ) 求 出它们的交点( x7 ,y7 ) ,并在相应的计数器( x7 ,y7 ,r7 ) 上加l 。 ( 4 ) 统计所有的计算器,计数值最大的对应的圆就是要求的眼球。 1 7 南京理工大学硕士学位论文 人脸识别中的若干问题研究 4 人脸下巴轮廓检测方法探讨 在人脸识别过程中,采用合适的模板往往是保证快速有效提取轮廓和特征的 关键。人脸下巴轮廓对人脸识别尤其是初期的定位工作有着非常重要的作用。因 此,为下巴轮廓选用合适的模板也是人脸识剐的重要工作之一。传统的方法是采 用抛物线作为模板,利用h o u l 曲变换确定曲线参数。但是由于该方法是3 参数 的h o u g h 变换,计算量大,实用价值不高。本章首先对抛物线方法进行改进, 提出一种通过求交点确定抛物线参数的方法。然后对用正弦曲线作为模板的可能 性和复杂性分别进行了探讨。 4 1 抛物线方法 普通的抛物线方程是:y ;a ( x x 。) 2 + y 。曲线图像如下: 凹4 1 由h o u g h 变换可知,每个( x ,y ) 对应变换域中的一个含三参数的二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论