




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 人脸识别技术是一种依据人的面部特征来自动进行身份鉴别的生物特征识别技术。 由于人脸识别技术在生物特征识别技术中具有众多的优势( 特别是直观、非侵犯) ,决 定了其广泛的应用前景:可以用来对敏感人物( 如罪犯、恐怖分子等) 进行识别,协助 公安部门布控、海关身份验证。为各类银行卡、金融卡、信用卡的持卡人提供身份验证, 作为门禁等。 一个完整的入脸识别系统要解决的主要问题包括:入脸检测、入脸图像预处理、特 征提取、分类识别。本文主要包括分类识别算法和人脸图像预处理两方面的研究,具体内 容如下: 1 ) 基于核的大间距分类器在人脸识别中的应用 针对人脸图像这类非线性问题,本文结合了支持向量机和非线性鉴别分析的优点, 提出了一种新的非线性鉴别分析算法基于核的大间距分类器算法。该算法的主要思想 是将经过预处理后得到的样本映射到高维空间中,借助予核函数并利用再生核理论对传 统的大间距分类器算法进行改进,得到核类内散度尽可能小的核鉴别矢量集。在o r l 和y a l e 人脸库上实验表明,本方法优于传统的支持向量机算法。 2 ) 基于核的图像欧氏距离在人脸识别中的应用 引进了两幅图像之间的一种新的距离度量图像欧氏距离,该距离是利用核函数对 传统的欧氏距离进行改进而得到的。本文利用该距离设计了一种新的分类识别方法一基 于核的图像欧氏距离人脸识别。为了验证此算法的可行性,首先对入脸图像迸行d c t 变换得到预处理样本。这里有两种方法,由于图像矩阵经二维d c t 变换后得到的矩阵 其能量集中在该矩阵的左上角,所以提取该矩阵左上角的不同维数子矩阵可组成一些用 于识别的样本矩阵( 称为d c t - 1 ) ;或者,将原始人脸图像分成互不重叠的8 * 8 小块, 对每个小块做二维d c t 变换并提取所得矩阵左上角不同维数的子矩阵组成适用于识别 的样本矩阵( 称为d c 他) 。在o r l 和y a l e 人脸库上的实验表明,该方法优于其它距离 分类器算法。 关键词:人脸识别;图像预处理;核函数;大间距分类器;图像欧氏距离 a b s t r a c t a b s t r a c t f a c er e c o g n i t i o nt e c h n o l o g yi sab i o m e t r i ci d e n t i f i c a t i o nt e c h n o l o g yt oa u t o m a t i c a l l y i d e n t i f yb yf a c i a lc h a r a c t e r i s t i c s f a c er e c o g n i t i o nt e c h n o l o g yh a sm a n ya d v a n t a g e si n b i o m e t r i ci d e n t i f i c a t i o nt e c h n o l o g y , p a r t i c u l a r l yi n t u i t i v e ,n o n i n v a s i v e ,s oi ti su s e di naw i d e r a n g eo fa p p l i c a t i o n s f o re x a m p l e ,i tc a nh e l pt h ep o l i c ei d e n t i f ys e n s i t i v ec h a r a c t e r s ( s u c ha s c r i m i n a l s ,t e r r o r i s t s ) a n dc u s t o m sa u t h e n t i c a t i o n 。i tc a np r o v i d et h ea u t h e n t i c a t i o nf o ra l lk i n d s o fc a r d h o l d e ra n db eu s e df o ra c c e s sc o n t r 0 1 a c o m p l e t ef a c er e c o g n i t i o ns y s t e mi n c l u d e :f a c ed e t e c t i o n ,f a c ei m a g ep r e p r o c e s s i n g , f e a t u r ee x t r a c t i o n ,c l a s s i f i c a t i o na n dr e c o g n i t i o n i nt h ep a p e r , t w oi m p r o v e dr e c o g n i t i o n a l g o r i t h m sa r eu s e dt or e c o g n i z e t h ef o c u sf o rf a c i a lr e c o g n i t i o ni nt h i sp a p e ri sf a c i a l i m a g e sp r e t r e a t m e n ta n df a c i a lr e c o g n i t i o na l g o r i t h m s m a j o rc o n t e n to ft h i sp a p e ri sa sf o l l o w s : 1 ) t h ea p p l i c a t i o no fam a r g i nc l a s s i f i e rb a s e do nt h ek e r n e li nt h ef a c er e c o g n i t i o n f o rt h i sk i n do fn o n l i n e a rp r o b l e m so ff a c i a li m a g e s ,t h i sp a p e rp r o p o s e san o v e ll a r g e m a r g i nn o n l i n e a rd i s c r i m i n a t ea n a l y s i so fk e r n e lm a r g i nc l a s s i f i e r i tc o m b i n e st h ea d v a n t a g e s o fs v ma n dn o n - l i n e a rd i s c r i m i n a t ea n a l y s i s t h es a m p l e sa f t e rp r e t r e a t m e n ti su s e dt o p r o j e e tt h ec h a r a c t e r i s t i cm a t r i xi n t oa ni m p l i c i ts p a c ec a l l e df e a t u r es p a c eb yn o n l i n e a rk e r n e l m a p p i n g ,t h ek e r n e lt r i c ki su s e dt oi m p r o v et h et r a d i t i o n a ll a r g em a r g i nc l a s s i f i e ra l g o r i t h m , m o r e o v e r , t h et h e o r yo fr e p r o d u c i n gk e r n e li nt h en e wf e a t u r es p a c ei su s e dt oo b t a i nt h e o p t i m a lk e r n e ld i s c r i m i n a t ev e c t o r sw i t hw h i c ht h ek e r n e lw i t h i ns c a t t e ri sk e p ta ss m a l la s p o s s i b l e t h em e t h o dp r o p o s e di nt h i st h e s i si se x p e r i m e n t e do no r l a n dy a l ed a t a b a s e s t h e r e p e a t e de x p e r i m e n tr e s u l t ss h o wt h a tt h en o v e la l g o r i t h mc a ni n c r e a s et h er e c o g n i t i o nr a t e c o m p a r i n gt ot h et r a d i t i o n a ls v ma l g o r i t h m 2 ) t h ea p p l i c a t i o no fe u c l i d e a nd i s t a n c eo fi m a g e sb a s e do nt h ek e r n e li nf a c e r e c o g n i t i o n an e wd i s t a n c en a m e de u c l i d e a nd i s t a n c ei nt h ei m a g ei sp r o p o s e d ,w h i c hc o n s i s t so ft h e i d e ao fk e m e lf u n c t i o n t h ep a p e rd e s i g nan o v e lr e c o g n i t i o nm e t h o dn a m e df a c er e c o g n i t i o n o fe u c l i d e a nd i s t a n c eo fi m a g e sb a s e do nt h ek e r n e l i no r d e rt ov e r i f yt h ef e a s i b i l i t yo ft h e p r o p o s e dm e t h o d ,m s t l xi tt a k e sp r e t r e a t m e n tt of a c i a li m a g e st og e tp r e t r e a t m e n ts a m p l e s t h e r e f o r e ,d i f f e r e n td i m e n s i o n a ls u b m a t r i x e sa r ee x t r a c t e dt oc o m p o s ean u m b e ro fs a m p l e s m a t r i x e su s e dt or e c o g n i z e ( c a l l e dd c tt r a n s f o r mo n e ) ;a l t e r n a t i v e l y , p r i m i t i v ef a c i a li m a g e s a r ed i v i d e di n t o8 * 8s u b - b l o c kw h i c hi sn o n o v e r l a p p i n g t h e n ,i tt a k e sp r e t r e a t m e n tt oe v e r y s u b - b l o c ka n dd i f f e r e n td i m e n s i o n a ls u b m a t r i x e sa r ee x t r a c t e dt oc o m p o s es a m p l em a t r i x e s t or e c o g n i z e ( c a l l e dd c tt r a n s f o r mt w o ) t h er e p e a t e de x p e r i m e n tr e s u l ts h o wt h a tt h e c l a s s i f i e rw i t he u c l i d e a nd i s t a n c ei nt h ei m a g ep r o p o s e di n t h i sp a p e rh a sb e t t e rr e c o g n i t i o n r a t ee f f i c i e n c yt h a no t h e rd i s t a n c ec l a s s i f i e r s k e y w o r d s :f a c i a lr e c o g n i t i o n ;i m a g ep r e p r o c e s s i n g ;k e m e lf u n c t i o n ;m a r g i nc l a s s i f i e r ; i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特另l j 加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 签名: 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定 签名:一;师签二i 一 第一章绪论 第一章绪论 1 1 研究的背景及意义 2 l 世纪是信息技术、网络技术的世纪。随着计算机及网络的高速发展,信息的安全 性、隐蔽性越来越重要。网络信息化时代的一大特征就是身份的数字化和隐蔽化。如何 有效、方便地进行身份验证和识别,已经成为人们日益关心的问题,也是当今时代必须 解决的关键性社会问题【l 】。身份证、工作证、智能卡、口令密码、网络登录号等传统的 身份认证手段,不但使用麻烦、记忆复杂、携带不便、不易保管,而且可能被遗失、忘 记,或轻易被窃取、仿造和盗用。因此,目前广泛使用的依靠证件、个人识别号码、口 令等传统方法来确认个人身份的技术面临严峻的挑战,并越来越不适应现代科技的发展 和社会的进步 2 1 。生物特征识别( b i o m e t r i c s ) 作为一种高新技术,由于其独特的属性, 正在悄然担负起这一重要的使命。一些典型的用于识别的生物特征1 3 1 见图1 1 。 图1 1 生物特征分类图 f i g 1 1f i g u r eo fb i o m e t r i cc l a s s i f i c a t i o n 在不同的生物特征识别方法中,人脸识别有其自身特殊的优势,因而在生物识别中 有着重要的地位。 非侵扰性。人脸识别无需干扰人们的正常行为就能较好地达到识别效果,无需担 心被识别者是否愿意将手放在指纹采集设备上,他们的眼睛是否能够对准虹膜扫描装 置只要在摄像机前自然地停留片刻,用户的身份就会被正确识别。 采集设备简单,使用快捷。一般来说,常见的摄像头就可以用来进行人脸图像的 采集,不需特别复杂的专用设备。采集一般可在数秒内完成。 通过人脸识别身份,与人类的习惯一致。也就是说,人和机器都可以使用人脸图 片进行识别,这使得人和机器可以配合工作。而指纹,虹膜等方法没有这个特点。一个 江南大学硕士学位论文 没有经过特殊训练的人,无法利用指纹和虹膜图像对其他人进行身份识别。 人脸识别拥有这些良好的特性,使其具有非常广泛的应用前景,正在引起学术界和 商业界越来越多的关注。随着近十年来人脸识别技术的飞速发展,它且正在越来越多被 应用在通关,企业安全和管理,刑侦等各个领域。 1 2 人脸识别技术的研究现状 人脸识别的研究始于2 0 世纪6 0 年代末,最早的研究是b l e d s o e 【4 j 以人脸特征点的间 距、比率等参数为特征,建成了一个半自动的入脸识别系统。而且早期人脸识别研究主 要有两大方向1 5 , 6 , 7 1 :一是提取人脸几何特征的方法,包括人脸部件归一化的点间距离和 比率,以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构;二 是模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能。b e r t o l 8 】 在1 9 9 3 年对这两类方法作了较全面的介绍和比较后认为,模板匹配的方法优于几何特 征的方法。 人脸识别理论的研究发展大致可分为三个阶段: 第一阶段,以b e r t i l l o n 、a l l e n 和p a r k e 为代表,主要研究入脸识别所需要的面部特 征。在b e r t i l l o n 的系统中,用一个简单的语句与数据库中某一张脸相联系,同时与指纹 分析相结合,提供了一个较强的识别系统。为了提高脸部识别率,a l l e n 为待识别脸设 计了一种有效和逼真的摹写,p a r k e 则用计算机实现了这样想法,并产生了较高质量的 入脸灰度图模型。这样阶段工作的特点是识别过程全部依赖于操作人员,显然这不是一 种可以完全自动识别的系统。 第二阶段,是人机交互式识别阶段。代表性工作有:g o l d s t i o n 、h a r m o n 和l e s k 用 几何特征参数来表示人脸正面图像。他们采用2l 维特征向量表示人脸面部特征,并设 计了基于这一特征表示法的识别系统。k a y a 和k o b a y a s h i 则采用了统计识别方法,用欧 氏距离来表征人脸特征,如嘴唇与鼻之间的距离、嘴唇的高度等。更进步地,t k a n a d 设计了一个高速且有一定知识引导的半自动回溯识别系统,创造性地运用积分投影法, 从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。k a n a d 的系统实现了快速、实时的处理,是一个很大的进步。相比之下,b a r o n 所做的工作较 少为人知,他先将图像灰度归一,再用四个掩模( 眼、鼻、嘴及眉毛以下的整个脸部) 表示人脸,然后分别计算四个掩模与数据库中每幅标准图像的相应掩模之间的互相关系 数,以此作为判别依据。 总的来说,这两个阶段主要是在2 0 世纪6 0 年代到9 0 年代,这段时间的人脸识别 一般都需要人的某些先验知识,无法摆脱人的干预。早期的人脸识别方法有两大特点: 大多数识别方法是基于部件的,它们利用入脸的几何特征进行识别,提取的信 息是人脸主要器官特征信息及其之间的几何关系。这类方法比较简单,但是很容易丢失 人脸的有用信息,从而在视角、表情等变化的情况下,识别能力差。鉴于这种情况,后 来出现了性能较优的模板匹配方法,即根据图像库中的人脸模板与待识别人脸模板在灰 度上的相似程度来实现人脸识别,这类方法在一定时期内占据主流。 人脸识别研究主要是在较强约束条件下的人脸图像识别。假设图像背景单一或 2 第一章绪论 无背景,人脸位置已知或很容易获得,因此对现实场景产生的图像处理效果不佳。 第三阶段,主要是进入2 0 世纪9 0 年代,由于高速度高性能的计算机的出现和各方 面对人脸识别系统的迫切要求,人脸识别的研究重新变得热门起来,人脸识别的方法也 有了重大突破,进入了真正的机器自动识别阶段,同时涌现出了很多著名的人脸识别算 法,例如麻省理工学院米提实验室的t u r k 和p e n l a n d 在1 9 9 1 年提出的“e i g e n f a c e ( 特征 脸 ) ”方法,b e l h u m e u r 等1 9 9 7 年提出的f i s h e r f a c e 方法是这个时期的两个重要成果,还 有许多方法都是基于这两个方法的深入研究。再有一个重要的方法就是弹性图匹配技术 ( e l a s t i cg r a p hm a t c h i n g ,e g m ) ,还有在此技术基础上发展的一些技术,如局部特征技术 ( l o c a lf e a t u r ea n a l y s i s ,l f a ) 、柔性模型( f l e x i b l em o d e l s ) 。现在人脸识别的研究重点 主要是对光照、姿态等非理想采集条件和用户不配合的情况下的人脸识别方法的研究, 尽力克服光照、姿态的影响。非线性建模方法、统计学习理论、基于b o o s t i n g 的学习技 术、基于三维模型的人脸建模与识别方法成为备受关注的研究趋势。 目前的人脸识别研究也主要有两个方向:其一是基于整体的研究方法,它考虑了模 式的整体属性,包括特征脸方法 9 1 、s v d 分解的方法【1 0 】、人脸等密度线分析匹配方法f 1 1 】、 弹性图匹配方法【1 2 】、隐马尔可夫模型方法【1 3 】以及神经网络的方法【1 4 】等;其二是基于特 征分析的方法【l ”,也就是将人脸基准点的相对比率和其他描述人脸脸部特征的形状参数 或类别参数等一起构成识别特征向量。这种基于整体脸的识别不仅保留了人脸部件之间 的拓扑关系,而且也保留了各部件本身的信息,而基于部件的识别则是通过提取出局部 轮廓信息及灰度信息来设计具体识别算法。有文献认为基于整体人脸的分析要优于基于 部件的分析,理由是前者保留了更多的信息,但是这种说法值得商榷,因为基于人脸部 件的识别要比基于整体的方法来的直观,它提取并利用了最有用的特征,如关键点的位 置以及部件的形状分析等。而对基于整体人脸的识别而言,由于把整个人脸图像作为模 式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此如何能够有效地去 掉这些干扰非常关键。虽然如此,但对基于部件分析的人脸识别方法而言也有困难,其 难点在于如何建立好的模型来表达识别部件。近年来的一个趋势是,将人脸的整体识别 和特征分析的方法结合起来,如k i nm a nl a i n t l 6 】提出的基于分析和整体的方法,a n d r e a s l a n i t i s t l7 】提出的利用可变模型来对人脸进行解释和编码的方法。 1 3 本文主要研究内容 人脸自动识别是一种重要的生物特征识别技术,应用非常广泛。与其他身份识别方 法相比,人脸识别具有直接、有好和方便等特点。因此,人脸识别问题的研究不仅具有 重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为模式识 别和人工智能领域的研究热点。人脸识别问题的研究主要包括四个方面:人脸检测、人 脸图像预处理、特征提取、分类识别。本文主要的研究分类识别这个方面。 在分类识别阶段,本文分别尝试了两种不同的分类识别方法:基于核的大间距分类 器算法和基于核的图像欧氏距离分类器算法,算法的具体思想如下: 基于核的大间距分类器算法 针对非线性问题,对传统的大间距分类器算法进行了相应的改进,提出了一种改进 3 江南大学硕士学位论文 的非线性鉴别分析算法核大间距分类器。该算法的主要思想是将输入样本映射到高维 空间中,借助于核函数并利用再生核理论对传统的大间距分类器算法进行改进,得到核 类内散度尽可能小的核鉴别矢量集。本方法在o r l 和y a l e 人脸库上反复实验表明,本 方法优于传统的支持向量机方法。 基于核的图像欧氏距离分类算法 方法可以解决人脸识别这类非线性问题并得到了较优的实验结果。但是当待识别 的样本类别数达到一定的数目时,利用该方法并不能得到高的识别率。针对这一问题, 本文提出了利用图像欧氏距离来解决此类问题。区别与传统的欧氏距离,图像欧氏距离 考虑了图像中的任意两个象素间灰度的相关性,并引入了核函数的思想。本文利用该距 离设计了一种新的分类识别算法,该算法主要包括以下三个步骤:d c t 变换实现人脸图 像预处理、随机样本的生成、基于图像欧氏距离的分类识别。本方法在o r l 和y a l e 入 脸库上反复实验表明,本方法优于其他几种距离分类算法。 1 4 本文各章节内容安排 第一章绪论主要针对本文研究的领域一人脸识别领域的情况做了简要的介绍。主 要内容包括论文的研究背景及意义,人脸识别在国内外的研究现状。最后两节对本文的 主要研究内容以及各章所做的主要工作做了简要的概述。 第二章理论知识。主要介绍了几种人脸图像预处理技术和人脸识别阶段所采用的 识别算法。在介绍人脸图像预处理方法时,重点介绍了论文所用的d c t 预处理方法, 为了说明问题,文章给出了相应的实验。在介绍人脸识别所采用的算法时,重点介绍了 大间距分类器算法和几种距离度量。 第三章基于核的大间距分类器在人脸识别中的应用。本章主要内容包括:对于原 始的人脸图像转换成识别矩阵样本矩阵;然后利用改进的核大间距分类器算法进行识 别。文中对传统的支持向量机分类器算法进行了改进,提出了一种新的利用r b f 核函 数的核大间距分类器算法。通过与其他分类器的比较实验可以验证该方法优于其他方 法。 第四章基于核的图像欧氏距离人脸识别。本章主要内容包括:利用d c t 对人脸 图像进行预处理,提取每个子块左上角不同维数的子矩阵组成适用于识别的样本矩阵; 然后采用了一种新的距离度量图像欧氏距离算法进行识别。该算法引进了核函数的思 想,利用r b f 核函数来加强距离的度量标准。为了验证该方法,本章在o r l 核y a l e 人脸库上进行了反复的实验,证明本章方法优于其他距离分类方法。 第五章总结及展望。对论文所做的主要工作做了总结,并且简述了一下人脸识别领 域存在的问题,以及自己工作的展望。 4 第二章理论知识介绍 第二章理论知识介绍 2 1 人脸识别系统 人脸识别系统【1 8 】的基本流程如图2 1 所示。 图2 1 人脸识别系统的基本流程 f i g 2 - 1p r o c e s so f f a c i a lr e c o g n i t i o ns y s t e m 从人脸识别系统的基本流程中,也可以发现人脸识别的研究内容主要分为人脸检 测、人脸图像预处理、特征提取和人脸识别四个过程。本文的研究重点是人脸图像预处 理和人脸识别算法这两个方面,下面的两节将对与这两方面相关的内容做简要介绍。 2 2 人脸图像预处理 人脸图像预处理是人脸识别过程中的一个重要环节。输入图像由于图像采集环境的 不同,如光照明暗程度以及设备性能的优劣等,往往存在噪声,对比度不够等缺点。另 外,距离远近、焦距大小等又使得人脸在整幅图像中间的大小和位置不确定。为了保证 人脸图像中人脸大小,位置以及人脸图像质量的一致性,必须对图像进行预处理。人脸 图像的预处理主要包括图像增强,图像噪声抑制以及校正技术等。图像增强时图像预处 理中的一个关键环节,图像增强的技术很多,这里主要介绍直方图均衡化的原理及过程。 图像噪声可以理解为妨碍人的视觉感知,或妨碍系统传感器对所接收图像源信息进行理 解或分析的各种因素,也可以理解为真实信号与理想信号之间存在的偏差。在图像处理 的过程中,如何消除传输系统和外部干扰给图像造成的噪声是影响显示图像质量的关 键。这里所要介绍的中值滤波法是消除随机图像噪声的最佳方法,并能保持图像的原有 效果。 人脸图像预处理【1 9 】是对检测到的人脸图像进行大小归一化、人脸图像矫正、灰度均 衡化等操作,目的是去除图像中的噪声,加强有用的信息,增强特征信息。人脸图像获 取的数据量相当大,例如人脸图像的尺寸如果是6 4 * 6 4 象素等于4 0 9 6 象素。为了有效 地实现分类识别,就要对原始的数据进行变换,得到最能反映分类本质的特征,这就是 特征选择和提取的目的。人脸特征选择就是选择提取人脸的特征,是将现实空间的图像 映射到机器空间的过程。人脸的特征具有多样性和唯一性,这其实就是人脸共性和特性 之间的关系问题:只有保持这种多样性和唯一性,才能保证人脸图像的准确描述和识别。 人脸图像信息数据量巨大,为提高检测和识别的运算速度以及提高图像传输和匹配检索 速度,必须对图像进行数据压缩,降低向量维数,即用尽可能少的数据表示尽可能多的 信息。在提取人脸特征的同时,也实现了对原始图像数据的降维。下面详细介绍这几种 图像的预处理方法。 2 2 1 直方图均衡化 灰度直方图【2 0 】( h i s t o g r a m ) 是灰度级的函数,它表示图像中具有每种灰度级的象素 5 江南大学硕十学位论文 的个数反映图像中锋种扶度出现的频窄。如下图所示,扶度直方刚的横坐标足扶度级, 纵坐标是浚扶度级出现的频率扶度是图像蛙基木的统计特征。 卣方图均衡化娃通过扶度变换将一幅罔像转换为h 幅共有均衡直方幽,即在俅个 扶度级上部只有相州的苏奈点数的过程。改灰度受换s = ,( r ) 为斜率有| ; 的非减连续 可微函数,它将输入图像a ( x ,y ) 转换为输 | :嘲像b ( x ,y ) ,输入罔像的直方罔为h 。( r , 输出图像的直方图为h 。扛) 则它们的关系叮山如下过鞋导出: 圈2 - 2 坐标变换示意图 f i g 2 - 2f i g u r e o f c o o t d l n a t ei t a n s f o m a l i o n 根据直方图的含义,鲐过灰度变换后对应的小面积,i 相等: h 。o 扭= 。p 抄, m ,= 拶7 d = 错= 删r _、jh ( 2 1 ) ( 22 ) 其中,:车,:f 一- b ) 。此4 见,当上式中片。0 ) 的分子和分母函数只差一比例 甜 常数时它就为常数即 ,( r ) = 鲁p 。p 如硼 ) 其中甩) = 了1 h a p 如 o 0o 结论:使直方j 耋| 均衡化的扶度变换函数是岽积分椎函数( 概率分布喃数) 。出散情 况下 ,o ) = 只,尸k ) ,( 24 ) 其中嘲= 喜詈。 下图为直方图均衡化后的觳粜。 日1 ;地i ,坦 图2 - 3 灰度图像及其相应的直方固 f i 9 2 - 3 g r a y s c a l e i m a g e sa n d c o n e s p o n d i n g h i s t o g r a m 第一章理论知i f 介鲥 。e = :一 图拍灰度图像经过直方田均嘶化之后的图像厦其相应的直方图 f 嘻2 4 h j n o g 栅r e + q m d i z a t l o na 晡t h e c o r r 骷p o n d i n g h i s + o g r a m 2 2 2 中位游波 中值滤波口l 】的原理是把序列或数字图像中一点的值,用该点邻域中各点值的中值柬 替代对于数字图像而言,中值滤波做如下定义:设k ,o ,j ) e1 2j 袭示数字图像各点的 灰度值滤波窗口为a ,虬为窗口是a 在h 点的中值,则 蜥= 掣k j = m e d r ( ,m 。l ,( r s ) e 一,i , ej 2 ( 2 5 ) 式( 2 5 ) 为窗r 7 是a 的 点的中值表达式二二维中值滤波的窗c l 可以取方形,也可以取 近似圆形或十字形。 中值滤波的过程:针对图像的巾值滤波的过程为,首先将模板内( 窗口) 所涵盖的 象索按灰度值由大到小捧列,再取序列中间点的值作为中值,并以此值作为滤波器的输 出值。在有很强的胡椒粉式( 或脉冲) 干扰的情况下,园为这些灰度值的干扰值与其邻 近象素的灰度值有很大的差异,因此经排序后取中值的结果是强迫将此干扰点变成与其 邻近的某些象素的灰度值一样,从而达到去除干扰的效果。应当注意的是中值滤波的过 程是一个非线性的操作过程,它即能保持图像的轮廓,又能消除强干扰脉冲噪声。中值 滤波除直接采用蹦像苏豢作中值外,还可采用其他的方法,例如平滑锐化滤波就含有取 中值和样点计算的过程。另一种方法是先计算j 耐边霰素灰度的平均值,若所考虑象素的 狄度与此平均值的差异超过一定临界值时,则判定此象索为干扰,该点的值应采用先前 计算所得的平均值来替代,若不超过临界则用该点实际象索的灰度值作为滤波器的输 出此种方法更接近于人眼的实际感觉。 利用中值滤波法消除图像噪声要经过如下过程:输入图像,加入模拟噪声,中值滤 波。中值滤波的效果如下图所示。 冒冒雹 ( a ) ( ”( c ) 图2 - 5 中值滤波:( a l 原壬旨图埠( b ) 加噪之后的图像忙) 中值嚣泣之后的图像 f i g2 s 伯) o 吨i n a l i m a g e ( b ) t h e i m a g e a h r a d d i n g n o i s e ( c ) t h e l i m 自g e a l t e r m e d i a n f i l t e d n g 2 2 3 几何畸变校正 图像在生成过程中,由于系统本身具有非线性或拍摄角度不同,会使生成的图像产 江南大学硕士学位论文 生几何失真。几何失真分为系统失真和非系统失真。系统失真是有规律的,能预测的, 非系统失真则是随机的。 当对图像做定量分析时,就要对失真的图像先进行精确地几何较正( 也就是将存在 几何失真的图像校正成无几何失真的图像) ,以免影响分析精度。基本的方法是先建立 几何校正的数学模型,其次利用已知条件确定模型参数,最后根据模型对图像进行几何 校正。通常分为两步:第一步,图像空间坐标的变换;第二步,确定校正空间各象素的 灰度值( 灰度内插) 。 对图像进行几何校正就是利用图像几何变换的基本原型2 3 1 ,将原始数字图像i ( x ,y ) 几何变换成数字图像g ( u ,) 。假设变换关系为 y x - = - p q ( ( u 甜, ,v v ) ) ,l y = q ( 甜,v ) , ( 2 6 ) 校正公式。司定义为 , jx - - c o + c 1 甜+ c 2 v ( y = d o + q 甜+ d 2 v 。( 2 7 ) 这里采用灰度差值法做几何畸变的校正。校正过程可以分为两步来进行。第一步: 灰度值的重采样:利用式( 2 7 ) 进行几何校正时,由于象素映射关系可能不是一一对应的, 即g ,y ) 坐标值不一定是整数了。而非整数的g ,y ) 坐标,在原图上的值厂g ,y ) 是没有定 义的,即没有灰度值。如图2 7 中的点a 1 为此引入插值的概念来解决计算中出现的分 数坐标象素的象素值j 即根据原图像上( 五y ) 点相邻整数坐标象素值,内插计算出该点 灰度值厂g ,y ) 。然后将点a 1 g ,y ) 上的内插灰度值厂g ,y ) 赋给点a 2 0 ,v ) ,就完成了一个 象素点的几何校正。 图2 - 6 灰度重采样示意图 f i g 2 6s c h e m a t i co fg r a yr e s a m p l i n g 最近邻法是比较常用的灰度插值方法。最近邻法是将与0 。,v 。) 点最近的整数坐标 。,v 。) 点的灰度值取为0 。,v 。) 点的灰度值,这种方法是一种简单快速的方法。变换时 使用最近邻法公式: ;辎。 亿8 , 使用最近邻方法进行灰度插值就可以得到满意的效果。几何畸变校正效果如下图所 示。 8 第章理论知识介蜊 豳糊 ( a )( b ) 田2 - 7 ( 曲为发生几何畸变的图像( 吣经过,乙何校正的田像 f i 9 2 - 7 ( 劬i m a g e w i t h g e o m e l r i c d i s t o r t i o n ( b ) i m a g e a f t e r g e o m e t r i c a l l y c o n 州e d 2 , 2 4 边缘检测 图像的边缘是图像的晟基本特征。罔像的边缘部分集中了图像大部分的信息,图像 边缘的确定与提取对于整个图像场景的识别与理解是非常重要的。 图像的边缘是以图像局部特征不连续的形式出现的也就是指图像局部亮度变化最 显著的部分。由于图像物体中的边缘表现为灰度变化因此,可通过计算灰度的不连续 性来增强和提取边缘。边缘提取的方法很多,本文的实验巾主要使用了边缘检测【“l 微分 算子方法r 选取c a n n y 算子。j o h nc a n n y 提出的边缘检测算子结合了以下三个准则:信 噪比准则、定位精度准则、单边缘响应准则。将以上三个准则相结合可以获得最优的 捡测算子,c a n n y 设计的边缘检测算法的具体步骤如下: 首先用2 d 高斯滤波模板进行卷积以平滑图像; 利用微分算子。计算梯度的幅值和方向; 对梯度幅值进行非极大值抑制。即遍历图像,着某个象索的灰度值与其梯度方向 上前后两个象素的灰度值相比不足最大那么这个象素值置为0 ,即不是边缘。 使用双阔值算法检测和连接边缘。即使用累计直方图计算两个阈值,凡是大于高阈 值的一定是边缘;凡是小于低阐值的一定不是边缘。如果检测结果大于低阐值但又小于 高阚值,那就要看这个象豢的邻接致素中胄没有超过高阈值的边缘象素,如果有,则该 象素是边缘,否则就不是边缘。 一 ( 劬( b )( c ) 图2 - 8 迪蜱辁测:( a ) 原图像( ”c a n n y 算子( c ) s o b e l 算子 f i g 2 - 8e d g e d e t e c d o n :( a ) o d g i n a l i m a g e ( b ) c a n n y o p e r a t o r ( c ) s o b e l o p e r a t o r 2 2 5 人脸图像d c t 预处理 离散余弦变换1 2 3 2 4 1 ( d i s c l t ec o s i n et r c n s f o x t n 。d c t ) 的变换系数是一种较好的变换 系数特征。离散余弦变换的变换核为实数的余弦函数当信号的统计特性符合一阶平稳 马尔可夫随机过程,埘且相关系数接近1 时,可以证明,d c t 魁仅次于k - l 变换的最 优变换。另外,因为离敞余弦变换与离敞傅单叶变换很相近,所以可以对它进行有效的 江南大学硕士学位论文 计算。基于这两个特性,可以用离散余弦变换预处理之后的特征矩阵作为人脸的特征。 下面看一下d c t 的理论基础。 对于一幅m 率n 的灰度图像,x g ,j ,) 表示灰度图像中坐标g ,j ,) 处的灰度值,其离散 余弦变换伫3 ,2 4 】定义为 盹咖啪) m 萎- 1 黔n - i 加s 訾 c 。愕赳亿9 1 j = oy = 0l 二1 w jl 二 j ,q 、 其中u = o ,1 ,2 ,影一1 ;v = o ,1 ,2 ,一1 ,被称为频域变换因子。】,材,v ) 为变换结果,也 称为d c t 变换系数。 分析离散余弦变换的定义可知:当频域变换因子较大时,d c t 变换系数】,( 甜,v ) 的值 较小。d c t 变换系数较大的数值主要分布在系数矩阵的左上角区域,而能量信息主要集 中在左上角区域。即左上角区域的少量系数是能量的集中体现。本文利用了这一特点, 提取d c t 变换之后左上角区域的少量系数作为特征进行识别。 离散余弦变换的逆变换定义为【2 3 斟j : m 小萋孔v 脚m 学 c o s 学 , 亿, 其中x = o , 1 ,2 ,m 一1 ;y = o ,1 2 ,n 一1 。 为得到低维的人脸特征矢量,必须在大量d c t 系数中选出包含分类信息的有用成 分,这些信息主要是离散余弦变换的低频分量,对应于图像的左上角区域。为了说明 d c t 变换后的主要信息集中在左上角区域这里以j p e g 图像的压缩及解压缩过程【2 5 】为 例。 1 ) j p e g 压缩编码 j p e g 是联合图像专家小组( j o i n tp h o t o g r a p h i cc o d i n ge x p e r t sg r o u p ) 的缩写。j p e g 已作为i s o 标准于1 9 9 2 年发布,是国际上静止彩色图像和灰度图像的第一个国际标准, j p e g 提供了压缩静态图像的方法和语法。j p e g 压缩采用了有损压缩的方法,它是目 前静态图像中压缩比最高的一种压缩方法,因此它主要应用于以压缩的形式存储和传输 静态图像,它在数字图像、网页嵌入式图像和其他众多领域中有着广泛的应用。在确定 其目的是静态图像压缩的同时,j p e g 也是动态图像( m o t i o nj p e g ) 的一种简单而有效 地方法。j p e g 标准是为基本档次的编解码器定义了一个语法和编码过程,包括为了适 合广泛应用而设计的一组特性,进一步地,可选模型被定义用于扩展基本档次编解码器 的性能。 j p e g 压缩编码的主要流程图下图所示。 图2 - 9j p e g 压缩编码流程图 f i g 2 9f i g u r ea b o u tj p e gc o m p r e s s i o nc o d e 1 0 第二章理论知识介绍 2 ) d c t 变换 前向d c t 变换的作用是将一幅图像采样点( 空间域) 转换成一组变换系数( 变换 域) ,这里是一个8 * 8 块的变换域。经过d c t 变换后,8 * 8 图像的低频分量都集中在左 上角,高频分量分布在右下角。由于低频分量包含了图像的主要信息( 亮度) ,而高频 分量与之相比,就不那么重要了,所以可以忽略高频分量,从而达到压缩的目的。下面 是从l e n a 图像的一个平坦区域取一个8 * 8 子块为; 6 97 17 5 7 98 4 8 99 1 6 97 0 7 3 7 68 3 9 09 5 7 7 7 4 7 67 4 8 58 99 5 7 17 37 67 98 69 19 3 7 47 7 7 7 8 2 8 89 19 3 7 8 7 6 8 08 4 8 89 29 5 7 6 7 8 8 08 5 9 39 49 5 7 4 7 98 1 8 5 8 69 49 4 图2 1 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高端商务酒店长期租赁及品牌管理合作协议
- 数字化转型行政人事经理专项技能聘用协议
- 酒店式公寓租赁合同范本及租赁双方信息保密条款
- 中央推广项目管理办法
- 群众文保员管理办法
- 个人房屋修缮管理办法
- 设计院车辆管理办法
- 酒吧服务员劳动合同制员工职业规划与晋升路径协议
- 群成员等级管理办法
- 集中业务活动会议参会人员签到与资料收集服务合同
- 现代教育技术说课
- 部编版五年级上册语文单元教学计划
- DB42T 1319-2021 绿色建筑设计与工程验收标准
- 产品经理绩效管理制度
- 2025年烟台市中考历史试卷真题(含答案)
- 2025四川产业振兴基金投资集团有限公司招聘12人笔试参考题库附带答案详解析集合
- 自愿放弃购房合同范本
- 风湿免疫病患者结核病诊治及预防实践指南(2025版)解读课件
- 膜结构车棚安装合同协议
- 五金材料采购合同范本大全5篇
- 山东省2016年安装定额解释
评论
0/150
提交评论