




已阅读5页,还剩48页未读, 继续免费阅读
(计算机应用技术专业论文)奇异值分解的人脸识别算法.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 f 随着信息技术的发展,社会管理曰趋电子化,自动化。在这样一个庞大的社会网 络体系中,系统安全十分重要。准确地鉴别个人身份是各安全系统的必要前提。人脸 是区别人的重要器官,利用人脸特征进行身份验证又是最自然直接的手段,相比其它 人体生物特征它具有直接、友好、方便的特点,易于为用户所接受。因而在公安( 罪 犯识别等) 、安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互系 统等方面有着巨大的应用前景,人脸识别越来越成为当前模式识别和人工智能领域的 一个研究热点。 人脸识别的研究涉及模式识别、图像处理、生理学、心理学、认知科学等领域, 早在二十世纪六七十年代即引起了研究者的强烈兴趣。人脸识别可以分为:人脸的 检测与定位、特征提取和识别三部分。 一、一 本文中在人脸的检测与定位部分,首先根据人脸图像的边缘检测图中的人脸内轮 廓线进行垂直定位。然后在垂直定位后的灰度图中根据人眼的水平结构特征进行人脸 以及人眼的水平定位。接着根据人眼的水平位置剪切, 眼部分的二值化图像对它进行 垂直投影,定位出人眼的精确位置;根据人眼信息得到标准化的图像。实验证明本方 法正确定位率可达8 8 6 。 在特征提取部分,采用的是基于奇异值分解的特征提取办法,将人脸图像矩阵的 奇异值作为特征向量。 在识别部分,构造了一个层次的距离分类器进行人脸的识别。设y 为待识图像, 首先求y 的特征向量记为y ,计算第f 类样本图像特征向量的中心记为爿,求出这两 个向量的距离。根据计算出的距离进行判定,我们就把待识图像归为距离最小的那一 类。实验证明该方法可以取得7 6 的识别率。 c ,y 关键字人脸识别 人脸定位 边缘检测;遁垂i i 爹奇异值分解; a b s t r a c t w i t ht h e d e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g y ,s o c i a lm a n a g e m e n tt e n d s t ob e e l e c t r i c i z e da n da u t o m a t e d i ns u c hal a r g es o c i a ln e t w o r ks y s t e m ,s y s t e ms e c u r i t yi so f v i t a l i m p o r t a n c ew i t l l t h e p r e m i s et o m a k eo u t p e r s o n a l i d e n t i f i c a t i o n a sf a c ei sa n i m p o r t a n tp a r tf o ri d e n t i f i c a t i o n ,i ti sm o s t d i r e c ta n dn a t u r a lt oi d e n t i f ya p e r s o nb ym e a n s o ff a c ef e a t u r e s t h i sk i n do fw a yi sc h a r a c t e r i z e d b y c o n v e n i e n c ea n df r i e n d l i n e s s c o m p a r e dw i t ho t h e rm e a n sa n dw i l lb ee a s i l ya c c e p t e db yw i t h o u ts t i r r i n gu pd e f e n s e n a t u r a l l y ,f a c e i d e n t i f i c a t i o nh a s b r i g h ta p p l i c a t i o n f u t u r ei nt h ef i e l do fc r i m i n a l d i s t i n g u i s h i n g ,s a f e t yc h e e ks y s t e m ,c r e d i tc a r di d e n t i f i c a t i o n ,m e d i c i n e ,f i l em a n a g e m e n t , v i d e om e e t i n g ,p e o p l e m a c h i n ee x c h a n g es y s t e m ,a n dw i l lb e c o m ea h o t s p o ti nt h er e c e n t r e s e a r c ho f p a t t e r nr e c o g n i t i o na n da r t i f i c i a li n t e l l i g e n c e f a c er e c o g n i t i o n ( f r ) ,h a v i n ga r o u s e dg r e a ti n t e r e s to ft h er e s e a r c h e r si nt h ee a r l y 19 6 0 s ,i n v o l v e sp a t t e mr e c o g n i t i o n ,i m a g ep r o c e s s ,p h y s i o l o g y , p s y c h o l o g y ,r e c o g n i t i o n s c i e n c ea n ds oo n i tc a nb es e p a r a t e di n t ot h r e ep a r t s :f a c ed e t e c t i o na n do r i e n t a t i o n , f e a t u r ee x t r a c t i o na n dr e c o g n i t i o n i nt h ep a r to ff a c ed e t e c t i o na n do r i e n t a t i o n ,v e r t i c a lo r i e n t a t i o nw i l lb em a d e a c c o r d i n g t oi n n e ro u t l i n ew i t h i ne d g ee x t r a c t i o np i c t u r eo ft h ef a c ei m a g e a f t e rt h a t ,a c c o r d i n gt o t h eh o r i z o n t a ll e v e lf e a t u r e so fh u m a ne y e ,f a c ea n dh u m a ne y e sw i l lb eh o r i z o n t a l o r i e n t a t e di nt h eg r a yi m a g e t h e n ,t h eb i n a r yi m a g eo ft h ee y ew i l lb ec u ti na c c o r d a n c e w i t ht h ee y eh o r i z o n t a ll e v e l ,w h i c hw i l lb ev e r t i c a l l yp r o j e c t e dt oo r i e n t a t et h ea c c u r a t e p o s i t i o no f h u m a n e y e s t h eh u m a ne y e sw i l li nt u r na c c u r a t e l yp o s i t i o n t h ef a c et of u r t h e r g e ts t a n d a r di m a g e e x p e r i m e n t sp r o v e t h ea c c u r a c yr e a c h e st o8 8 6 f a c ef e a t u r ee x t r a c t i o nw i l la p p l yt h em e t h o db a s e do ns i n g u l a rv a l u ed e c o m p o s i t i o n w h i c ht a k e ss i n g u l a rv a l u ed e c o m p o s i t i o no f t h em a t r i xa sf e a t u r ev e c t o r ad i s t a n c ec l a s s i f i e rh a sb e e nb u i l tu pf o rf a c er e c o g n i t i o n i fyi sa l l i m a g et o b e r e c o g n i z e d ,t h ef e a t u r ev e c t o r yw i l lf i r s tb ew o r k e do u la n dt h ef e a t u r ev e c t o rc e n t e ro f i s a m p l ec l a s sw i l lb en o t e da s x 。t h e nt h ed i s t a n c eb e t w e e nt h o s et w ov e c t o r sc a nb e c a l c u l a t e df o r j u d g e m e n t s w e c l a s s i f yt h ei m a g e i n t ot h es a m p l ec l a s st h a th a st h es h o r t e s t d i s t a n c es u c hk i n do fm e t h o dh a sp r o v e d7 6 a c c u r a c y h u i l i nz h a o d i r e c t e db y :l i n q u a nw a n g k e yw o r d s :f a c er e c o g n i t i o n ,f a c eo r i e n t a t i o n ,e d g ee x t r a c t i n g ,i n n e ro u t l i n e ,s i n g u l a r v a l u ed e c o m p o s i t i o n 论文独创性声明 j c 3 7 2 7 , 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文 中除了特别加以标注和致谢的地方外,不包含其他 或其他机构已经发表或 撰写过的研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作 了明确的声明并表示了谢意。 作者签名:茏髫淋 本人同意上海海运学院有关保留、使用学位论文的规定,l l l l 学校有权 保留送交论文复印件,允许论文被查阅和借阅;学校可以上网公布论文的全 部或部分内容,可以采用影印、缩印或者其它复制手段保存论文。保密的论 文在解密后遵守此规定。 丛 奇异值分解的人脸识别算法 1 1 模式识别简介 第一章引言 人能够听到走廊里的脚步声,就知道谁来了;在人群中掠过一个人的背影,就能 认出这人是谁;笔记本上的字,尽管写的龙飞风舞,也能认出写的是什么。人的这 种能力就是人的识别能力。用计算机来实现人的这种能力就是模式识别这一学科的 研究内容。 模式是对感兴趣的客体的定量的和结构的描述;模式类是具有某些共同特性的 模式的集合。模式识别就是研究一些自动技术,计算机依靠这些技术自动地把待识 模式分到各自的模式类中。例如对于人脸识别而言,每张输入的人脸图像就是一个 模式,每个人的图像集就是一个模式类。人脸识别就是把输入的人脸图像正确地分 到其对应的模式类中去。 模式识别是诞生于2 0 世纪2 0 年代,6 0 年代迅速发展起来的、与高技术的研 究开发有着密切联系的一门学科。它所研究的理论和方法在很多科学和技术领域中 得到了广泛的应用,推动了人工智能系统的发展,扩大了计算机应用的领域。几十 年来取得了大量的研究成果,在很多方面得到了成功的应用,例如应用于遥感数据 分析、地震波解释、自动视觉检测、非数字系统中的故障检出和分析、医学数据分 析、文字识别、语音识别以及人脸识别等领域。 在模式识别中,有两种经典的模式识别方法: ( 1 ) 统计方法又称定量方法,就是用一组数据来描述模式。基于统计方法 的模式识别系统主要由五部分组成:数据获取、预处理、特征抽取、分类器设计和 分类器。 ( 2 ) 结构方法又称句法方法,对模式进行结构描述和分析,把一个复杂模 式分化为若干较简单子模式的组合,并模仿语言学中句法的层次结构,运用形式语 言和自动机技术识别。 随着基础理论及相关学科的发展,目前发展较快的识别方法还有: ( 1 ) 模糊识别方法采用模糊数学的理论方法来实现模式识别,适合带有模糊 性的模式识别问题; ( 2 ) 基于神经网络的智能模式识别由于神经网络在自学习、自组织、自联想 及容错等方面的非凡能力,以及从神经网络模型可以得到最灵活的联想存储器,所 奇异值分解的人脸识别算法 以神经网络也用来解决模式识别问题。 1 2 人脸识别 人脸识别就是利用计算机分析人脸图像,从中提取出有效的识别信息,用来鉴 别身份的一种技术。与指纹、虹膜识别相比,具有直接、友好、方便的优点。近年 来越来越成为一个热门的研究热点,有很广的应用领域。例如公安系统的罪犯身份 识别、驾驶执照及护照等与实际持证人的核对、银行及海关的监控系统及自动门卫 系统等。虽然人类的人脸识别能力很强,可是让计算机来识别人脸就困难多了,表 现在:人脸表情丰富;人脸随年龄增长而变化;人脸所成图像受光照、成像角度、 成像距离等影响。另外,人脸识别还涉及到图像处理、计算机视觉、模式识别及神 经网络等学科,也和人脑的认识程度紧密相关。这诸多因素都给人脸识别带来了困 难。 人脸识别的研究始于6 0 年代末,b e d s o e 在文献 1 中首先提出人脸的半自动 识别系统,它用于分类的参数包括一些人脸脸部特征归一化的点间距离和比率,如 眼角、嘴角、鼻尖等部位。 人脸的识别包括三个步骤:人脸的检测,人脸特征的提取以及人脸的识别。 一、人脸检测 人脸检测的目的是将人脸图像从景物中分离出来,从而缩小特征提取处理的图 像范围,通常需要对提取出的人脸图像作标准化处理,生成规范化的人脸图像。然 而人脸作为人类自身再熟悉不过的一个组成部分,其检测问题却是一个极富挑战性 的课题。首先人脸是一个包含五官、毛发等的极不规则的复杂待铡目标,不同的人 脸在形状、大小、颜色、质地等方面都有很大的变化性;其次为了实现检测方法的 鲁棒性,我们要考虑人脸在各种复杂的背景中,不同的方向、角度、尺度等情况下 所展现出来的不同表象;再次,我们所基于的检测对象或称环境大多是由图像捕捉 设备所采集的数字图像或视频流中的数字图像序列,所以采集条件特别是光照条件 包括光源的方向、明暗、色彩等都会对图像的效果产生很大的影响,进而影响我们 对人脸的检测:另外,人脸上还可能长有胡须、戴有眼镜或其他装饰品等,这些也 同样是我们设计种有效的人脸检测算法时不可忽视的因素。人脸检测问题在近十 年中得到了广泛的关注和长足的发展,国内外很多研究人士提出了很多方法,在不 同的领域取得了定的成果。 下面从方法论的角度概要性的总结一下现有的几种主要的人脸检测思想。 1 基于知识的自顶向下的方法 这种方法是基于我们在认识人脸的过程中所总结出来的些先验知识,把它们 奇异值分解的人脸识别算法 归结成为一些复杂程度由简而繁的规则1 2 3 1 。例如:“正面人脸都包括两只位置相互 对称的眼睛”、“灰度图像中眼睛要比脸上其他地方暗”等。找到一系列规则后,把 它们应用到输入图像中,搜索出符合规律的人脸区域。 2 基于人脸特征的自底向上的方法 这种思想首先用各种数字图像的处理办法对输入图像进行处理,根据处理结果 提取出来的某些特征与人脸的某些共性特征进行比较,借此来判断某一区域是否为 人脸h 】。举例来说,我们可以用数字图像处理中常用的提取边界的方法在输入图像 中寻找边界,然后试探哪些边界能像正面人脸的左边线、右边线和发誓线那样构成 人脸轮廓:还可以利用从图像中提取出来的色彩和纹理信息与人脸的色彩和纹理模 型进行比较,得出可能的人脸区域。当然各种人脸特征的综合运用对于提高检测算 法的性能会有很大帮助。 3 模板匹配的方法 首先,建立并存储一些人脸模板作为标准,可以包括正面人脸或是单独的眼睛、 鼻子、嘴。利用一些算法来计算各待测区域与标准模板的相似程度或称相关性。利 用这一相似程度来判决某一区域是否为人脸口,6 】。 4 基于人脸外观的方法 这种思想是指通过搜集大量的人脸和非人脸样本作为训练集,用人工神经元网 络、支持向量机( s v m ) 等方法训练出一个分类器来检测人脸【7 】。这种思想与其他 思想的不同之处在于,它并不首先人工的对入脸进行分析或是抽取模板,也不对输 入图像进行复杂的处理;而是利用大量的人脸整体外观用结构化的方法来训练出人 脸检测的分类器。在这一类方法中,特征向量、统计学、信息学等思想也得到了运 用。 上述各种方法都存在着自身的优缺点和适用领域,很多学者在各自所面临的问 题的范围内不断探索,也发明了许多卓有成效的检测算法。但我们不得不承认,各 种检测算法都存在着效率与性能上的矛盾,也即在正确率、鲁棒性等方面较好的算 法往往会花费更多的时间及系统消耗。效率与性能在某种程度上说是本质上对立 的、不可调和的一对矛盾,但我们应该在对立的前提下尽可能的寻找统一,也即力 争找到效率与性能的最佳结合点,使检测系统从整体上达到最优。 二、特征提取 人脸特征的提取是从人脸图像中提取出一组反映人脸特征的数值,以便利用这 组数值来进行人脸识别。在人脸特征提取中,根据提取特征的不同,可以分为几何 特征提取和代数特征提取两大类。 前者提取的特征对应着人脸的特征器官,如人的眼睛、鼻子、嘴巴、下巴、眉 奇异值分解的人脸识别算法 毛等1 8 , 9 , 1 0 】,用于几何特征提取的方法有:人脸图像的投影分析,梯度图像分析,动 态模板等。其中投影分析可以用于提取眼睛、鼻子、嘴的特征,梯度图像可以用于 分析各特征器官的轮廓曲线,动态模板可以用于提取眉毛的特征。 在提取代数特征时就不如几何特征那么明显,它提取的是图像的内在特征,一 般具有较好的鲁棒性,这种特征提取的方法有: ( 1 ) 基于k _ l 变换的特征提取方法( 又称之为主元分析法) i v j 2 1 ;是先求得 平均脸,即设训练集中有m 幅图像 x 1 ,x2 ,x ”) ,则 靠 = ( 1 1 ) 。 m 、 。 协方差矩阵 足:至:,! :竺:竺 ”:) 矗= l l 一 l l 一, 求r 的特征值丑和特征矢量仍,选取较大的l 个特征值五对应的特征矢量仍( i = 1 ,2 ,l ) 。这些特征向量所形成的向量空间就可表示为人脸图像的主要特征信 息。 从压缩角度的能量来看,k l 变换是最优的。它不仅使得从n 维空间降到m 维空间前后的均方误差最小,而且变换后的低维空间有很好的人脸表达能力,但并 不是说有很好的人脸辨别能力。选择训练样本的散布矩阵作为k 一乙变换的生成矩 阵,是由于其最大特征向量抓住了该样本集合的主要分布,但这是图像统计,而不 是人脸统计方法。它虽然统计了图像间的所有差异,但由于它不管这样的差异是由 于照明、发型变化或背景所致,还是人脸的内在差异,因此本方法随着光线、角度 及人脸的尺寸等因素的引入,识别率急剧下降。 ( 2 ) 通过对图像作奇异值分解( s v d ) ,用经奇异值分解获取的奇异值( s v ) 来代表人脸图像的代数特征 1 3 , 4 1 ;a er ”“为一幅人脸灰度图像,它有s v d 分解 a = u v( i - 3 ) 其中 u = ( “l ,“2 , , “。) , v = ( v l ,v 2 ,v 。) , = d j a g ( 五,旯2 , ,o ,o ) ,l = r a n k ( a ) , 如丑 o ,五;是从。和a 。a 的特征值,兄,是a 的奇异值。a ( i = l ,2 ,f ) 接近零的项较多,去掉它们 得到 j :y 五“v j ( 1 4 ) t i l 爿可以看作a 在特征图像v j ,“:v :t ,d r v j 上的投影的叠加。 ( 3 ) g a b o r 小波分解来提取人脸图像的特征点1 1 5 :它用的2 dg a b o r 函数及其 4 奇异值分解的人脸识别算法 f o u r i e r 变换为: g ( x ,y :“o ,v o ) = e x p 一i x2 2 盯:+ y 2 2 i f ) i + 2 n , “o x + v o _ y 】) g ( u ,v ) = e x p 一2 丌2 【盯: 一u 0 ) 2 + 仃:( v v 0 ) 2 】) ( 1 - - 5 ) 其中盯,盯,代表g a u s s 空间宽度,( “。,v 。) 为复正弦曲线的频率。 g a b o r 函数构成了一个完备非正交基集,其小波表示如下: 中 ( 工,y ,护) = e x p - 五2 ( x 2 + y 。2 ) 】+ i a x 工= x c o s 8 + y s i n 8 ( 1 - - 6 ) y = x s i n 0 + y c o s o 其中0 为择优空间位向, 为g a u s s 形态化。通常设x = 1 ,0 取等分四个取 向,得到的小波族为: m 【口。( x x 。) ,口。( y y o ) ,曰女】)d r ,= 0 ,一1 ,一2 ,) 其中0 。= k x n ,n = 4 ,k = - 0 ,1 ,2 ,3 ) ,口,z ,频率响应,。( x ,y ) 及小波变换 j ( x ,y ,臼) 分别为: j ,。( x ,y ) = m a x g ,( x ,y ,臼) 一n p 。( 工,y ,护) i i ) w i ( x ,y ,口) = ,o 中( a ,x ,口,y ,目) ( 1 7 ) 其中g 为s 型非线性函数;f 为输入图像;,为归一化因子,且m 聊。 设( x ,y ) 的邻域为。,特征点即为其中最大的频率响应点。 ( 4 ) n i x o n 提出的用h o u g h 变换提取特征胛】。变换位于由梯度算予提供的利用 梯度的大小和方向所得到的形状附近。有两个参数被用来识别眼精:虹膜和白眼球 的周长。虹膜具有如下特点:它是圆形的且在每个象限有期望的梯度方向,同时还 有较亮的白眼球背景。用椭圆来模拟眼睛似乎是比较好的,但它不适于离眼睛较远 的那部分。梯度用s o b e l 算子计算然后利用由方向决定的四个不同的阈值进行闽 值化。 三、人脸识别 在人脸的识别算法中,迄今为止已形成了几十种较为成熟的识别方法,它们的 主要区别在于所用特征和测度准则的不同。 t u r k 和p e n t l a n d l l 7 用本征图像进行人脸检测和辨别。通过简单的内积运算, 将原始图像投影到本征图像中得到权矢量,数据库中的每幅人脸图像及测试图像 ( t ) 都可用权矢量来表示,计算t 与每幅图的欧式距离,最小的即为识别出的图 像。p e n t l a n d 等人进一步完善了这种方法。他们从3 0 0 0 人的不同表情、发型等共 7 5 6 2 幅图像中随机选取了1 2 8 幅计算了2 0 个特征矢量,同时加入注释信息,实现 交互式查寻。本征脸方法存在如下弊病:首先,由于作为一种图像的统计方法,图 像中所有的象素被赋予了同等的地位,可是角度、光照、尺寸及表情等干扰会导致 识别率急剧下降。因此较好的识别算法都对人脸进行了矫正处理,并只考虑裸脸; 奇异值分解的人脸识别算法 其次,根据文献 1 8 ,人脸在人脸空间的分布近似高斯分布,且普通人脸位于均值 附近,而特殊人脸则位于分布边缘。由此可见,越普通的人脸越难识别;本征脸虽 反映了特定库的统计特性,但不具有普遍代表性,而广泛的应用,则需要训练出的 本征脸具有普遍意义;采用此方法的重要假设是人脸处于低维线性空间,即人脸相 加和相减后还是人脸,显然这是不可能的,因为即使在定位和尺寸相同的情况下, 由于部件的相对位置不同,相加、相减后的人脸也一样存在模糊。总之,有效的本 征脸识别方法需要做大量预处理,以减少干扰。而如何表达,去除表情因素是识别 的另一关键。 a k a m a t s u 等人提出的k l i p a t k l - - f a s t 标准化k l 系数不仅可用于特征提取 中,在识别中也得到了较好的效果。将输入图像x 投影到特征脸( 仍,仍,人,妒;) 上,生成一个l 维的特征向量y = y 】,y2 ,a ,y 。) ,y 一妒j ( x 一) ,求d m = l l y y “l , 利用最小距离判别准则识别输入图像。 s v d 奇异值分解法也可有效地用于人脸识别技术中。z q h o n g ”1 用普通模式 的最佳判别式平面及二次分类机制构成4 5 个s v 特征矢量,对1 3 幅图像进行检测, 错判率为4 2 6 7 h o n g 认为这是因为训练样本集的数目太小产生的统计局限造成 的。y q c h e n g 等人也是利用s v 在最佳判别式平面上进行人脸识别的。如将图像 彳”用n 维s v 特征矢量表示,就可以在n 维特征平面上进行图像识别,但由于所 用的特征平面维数高达几十维,必须利用某些数学变换降低维数,基于f js h e r 准 则的最优判别式变换较为常用。 f i s h e r 半0 别式准则为 地) = 舞 5 ) 其中s 。,s ”分别为类间和类内散度矩阵,可通过s v 特征矢量求得,使上式最 大的单位矢量即为f i s h e r 最优判别式矢量,它表示图像集在p 方向上的投影,且 在由妒构成的一维子空间上产生最大的类间散射和最小的类内散射。通过正交性约 束计算使f i s h e r 准则最大的最佳判别矢量可以构成最佳判别式变换。 文献 2 0 提出了一个形状和灰度分离的模型,即从形状、总体灰度、局部灰度 分布3 个方面来描述一个人脸。其中,点分布模型用来描述人脸的形状特征,它是 用每点的局部灰度信息来描述人脸的局部灰度特征;然后用点分布模型将图像进行 变形,以生成形状无关人脸,再做特征脸分析,从而得到人脸的总体灰度模式分布 特征。这种三者相结合的方法,识别率为9 2 ( 3 0 0 个人脸) 。该方法首先循序取 每点的坐标位置信息,并将其排列成待训练数据以生成形状特征子空间;然后对点 分布模型的每点取局部投影信息来代表该点的局部灰度特征再通过训练后生成 与该点相对应的局部灰度分布特征子空间。若将所有人脸的关键点都变形到规定位 奇异值分解的人脸识别算法 置,则生成形状无关人脸,然后对所有的形状无关人脸进行特征脸分析,以生成特 征脸子空间。虽然每一个特征子空间都可以单独用来识别人脸,但若要完整的描述 一个人脸,则需要3 个特征子空间的人脸参数。 基于小波变换的弹性图匹配是在二维的空间中定义了这样的个距离,它对通 常的人脸变形具有一定的不变性,也不要求样本库中人脸和待识别人脸的维数相 同。可用属性拓扑图来表达人脸,其拓扑图的任一顶点均包含一特征矢量,它记录 了人脸在该顶点位置的分布信息。如文献 2 1 中介绍的二维拓扑图的顶点矢量就是 人脸经小波变换后的特征矢量。用拓扑图分别代表已知和待识别人脸,根据匹配拓 扑图算出它们的距离,作为人脸的相似度准则。根据j u nz h a n g 在同一图像库上分 别用k l 方法和弹性匹配方法进行识别的实验比较,所得的识别率分别为6 6 和 9 3 。 人工神经网络的方法也可以用于人脸的识别,比如单层适应性神经网络陋】、 h y p e r b f 网络【2 3 】。 人脸检测是识别技术中最关键的第一步骤,对于i d 卡、驾驶执照类的图像, 由于背景简单而便于分割,但对有胡须、戴饰物的人脸图像进行分割就相当困难, 因此有待研究适应性强、分割精度高的快速分割算法。本文提出的定位算法就对有 胡须、戴饰物的人脸图像可以达到8 8 6 的正确定位率,定位时间为1 2 秒。 特征提取技术发展较为成熟,特征描述一般包括整体和局部特征描述,整体描 述通常是基于k l 分解的,局部描述则用于眼睛、嘴、鼻等区域,所用方法包括: 可变模板、特征分解等。今后还应研究一些用整体和局部变换提取特征的新方法。 人脸识别技术( f r t ) 在过去几年的研究成果中主要采用k l 变换、奇异值分解 以及神经网络法等方法,但这些方法大都仅在少于1 0 0 幅图像的识别系统中有较高 的识别率,对有成千上万幅图像的图像检索系统则不大适用,因此有待于研究新的 适应性强、实时性好的识别方法。此外,对于f r t 的定量评估,是否有更好的性能 评价标准? 如何运用这样的规则来定量评价现有的方法? 这将是今后进一步研究 的另一个重要课题。 奇异值分解的人脸识别算法 1 3 识别流程 本文的识别流程如图1 1 所示 图1 1 人脸识别流程图 其中人脸定位部分的流程图如图l _ 2 预处理 基于轮廓 线的垂直 定位 萋磊票荤譬l - ) 亘至虽咂 征的水平定l 一眼睛定位l 一标准化 位l 一一 图1 2 人脸定位流程图 8 奇异值分解的人脸识别算法 2 1 图像格式 第二章图像格式及其常用操作 图像分为物理图像和数字图像。我们处理的是数字图像,即物理图像的数字表 示形式。 2 1 1 数宇图像的表示 数字图像的表示方式有可以分为两类:位图方式、矢量方式。 位图方式该方式将一副图像划分为一张栅格,格中每一部分( 象素) 的光度 或色彩单独记录。位图中的一个数据点的位置决定了该数据点所代表的象素,即数 据点( 位) 与图像对应,“位图”由此而来。位图适用于色彩、阴影或形状变化复 杂的图像,如照片、绘画、或数字化视频等。 矢量方式这种方式用一系列线段或其他造型描述- n 图像,它适合于线型图 等简单的图形或图像。 2 1 2 灰度图 灰度又称为“g r a y s c a e ”,它代表象素的亮度值( 象素“p i x e l ”一词由p i c u r e e 1e m e n t 缩合而成,它是图形单元的意思。象素对应着计算机屏幕上的一点或数字 图像中的一点) 。在一副黑白照片中,不是简单的非黑即白,而是逐步过渡的,它 们可区分为不同的亮度等级即灰度级。灰度划分越细,越能准确的再现原稿。目前 普遍采用的是2 5 6 灰度级,即每个象素的灰度用一个字节( 8 位) 表示,其中0 表 示全黑,2 5 5 表示全白。 2 1 3t i f f 格式与p g n 格式 t i f f ( t a gi m a g ef i l ef o r m a t ) 由a l d u s 和m i c r o s o f t 联合开发和积极支持。 t i f f 图像文件主要由三种数据组成:表头、标识信息区和图像数据区。表头指出 了标识信息区在文件中的起始位置;标识信息区由一些标志信息组成,表示了t i f f 图像的属性并且指明了图像数据区的地址;图像数据区将图像的象素数据以自上而 下、自左到右的顺序依次存放。若标识信息区的最后一个表项为四字节的0 ,则表 明该文件只存储了一幅图像。否则该表项就指出了下一个标识信息区的地址,该文 件就存储了多幅图像。 奇异值分解的人脸识别算法 p g m 是灰度位图的p b m ( p o r t a b eb 1 t m a pu t l j t i e s ) 。p g m 图像文件由两部 分数据组成:文件头和数据区。文件头表明该图像的用象素表示的高度和宽度以及 最大的灰度值。数据区按从上到下、从左到右的顺序存储象素值。 2 2 图像库 人脸识别系统处理的图像可以是包含正面人脸的图像、人脸侧面轮廓图,也可 以是人脸距离图。本文处理的图像是包含正面人脸的图像,实验建立在个包含 4 0 人,每人1 0 张人脸图像的图像库o r l ( 0 1 i v e t t if a c ed b ) 上,所有图片采用 p g m 格式存储。图像中人脸大小、表情、光线角度都有一定变化,人脸有一定的偏 转,有的还带眼镜、有胡须。但每张图像中只含一个人脸,且背景较单一。图2 】 为其中的一些图像: 图2 1 人脸库图像举例 我们要根据图像格式来提取出图像数据的矩阵表示,设图像的宽度和高度分别 为w 、h ,则得到的矩阵可以用二维数组来表示: p x y ,0 9 工形a 0 j ,何 我们处理的图像均为2 5 6 色灰度图,所以p x 儿y 的取值范围为 0 ,2 5 5 。 2 3 常用的图像操作 本节介绍后面会用到的一些通用的图像操作,包括图像的剪切、缩放、旋转以 及灰度调整。 2 3 1 图像的剪切 图像的剪切操作比较简单,我们只要确定要剪切的左上角位置以及新图像的宽 度和高度信息,用函数p l a n a r l m a g ec r o p ( s o u r c e i m a g e ,l e f t ,t o p ,n w i d t h ,n h e i g h t ) 来实现e 其中( 1 e f t ,t o p ) 为新图像在原图像中左上角的位置,n w jd t h ,n h e i g h t 为新图像的宽度和高度。 奇异值分解的人脸识别算注 2 3 2 图像的缩放 缩放属于图像处理中的几何变换,这些变换采用矩阵来计算是非常容易的。图 像的缩放倍数f a c t o r 由下式决定: 三= f a c l o f x , _ h :f a c t o r y w门 ( 2 一1 ) 式中w 、h 、w 、h 。分别表示为:缩放前图像的宽、高,缩放后图像的宽、高。 缩放前图像中的任意点p ( x ,y ) ,经过缩放后其坐标变为尸( x 。,y ) 。如果该几何变换 用矩阵表示,则为: k y o h y 0 】 c t 眦0 0 o m 砂0 o01 ( 2 2 ) 由于缩放图像时运用了浮点数运算,所以得到的坐标可能不是整数。如果采用 取整处理,即寻找最接近的点,会带来一些误差,如图像会产生锯齿。本文采用了 插值( i n t e r p o l a t i o n ) 方法,即利用邻域的象素值来估计新的象素值。取整数处 理也是一种插值,称为最邻近插值( n e a r e s tn e i g h b o ri n t e r p o l a t i o n ) 。本文采 用的是更精确的插值方法双线性插值方法。 图2 2 是双线性插值法求象素灰度的示意图。p ( x ,y ) 表示由点( i ,j ) 、( i ,7 + 1 ) 、 ( + l ,) 以及( f + 1 ,_ ,+ 1 ) 组成的网格内任意一点的位置,则称p ( x ,y ) 为局部坐标, 在该局部坐标的灰度由( f ,j ) 、( f ,j + 1 ) 、( i + 1 ,j ) 以及( i + 1 ,j + 1 ) 四个象素的灰度进 行计算。 x。x e ( x ,y ) l f h 一 y l ( j ,j 十1 )( i + 1 ,j + 1 ) y 图2 2 双线性插值示意图 1 1 奇异值分解的人脸识别算注 双线性插值需在水平和垂直两个方向上进行,因此用双线性插值法求网格内任 意一点p ( x ,y ) 灰度的计算公式可写为: g ( x j ,) = 口+ 6 x + 叫+ 西哆, ( 2 - 3 ) 式中,g ( x ,y ) 表示为p ( x ,y ) 点的灰度值,将由插值公式计算产生:d 、b 、c 、 d 为待定常数。利用四个顶点的灰度值g ( f ,j ) 、g ( i + 1 ,j ) 、g ( i ,j + 1 ) 和g ( i + 1 + 1 ) 可计算四个待定常数的值,计算公式为: a = g ( i ,j ) b = g ( i + 1 ,j ) 一g ( i ,j ) c = g ( i ,j + 1 ) 一g ( i ,j )( 2 - 4 ) d = g ( i ,j ) 十g ( i + l ,j + 1 ) 一g ( i + 1 ,j ) 一g ( i ,j + t ) 从计算插值函数所需常数及计算公式可见,双线性插值的计算是非常方便的。 通过四个顶点的灰度值的简单的加、减运算即可求得插值系数。用双线性插值方法 可以得到满意的插值结果,没有灰度不连续的缺点。但是,线性插值是基于一个假 设:原图像的灰度在两个象素之间是线性变化的,一般情况下,这种插值的效果还 可以。如果想更精确的话,需要采用曲线插值( c u r v i l i n e a ri n t e r p o l a t i o n ) ,即 认为象素之间的灰度变化规律符合某种曲线,如抛物线,但它的缺点是:计算量很 大。 2 3 3 图像的旋转 我们通过函数p l a n a r i m a g er o t a t e ( s o u r c e l m a g e ,a n g l e ) 来实现,s o u r c e i m a g e 为原图像,a n g l e 为旋转的角度,该角度用弧度来表示。变换矩阵为 彳:fc o 昭- 3 m 口1 ls i n 口c o s 口j 设变换前图像中任意一点坐标为( 了,) ,在旋转口后其坐标变为( z 。,y ) ,原图像 的宽度和高度分别为w i d t h 、h e i g h t ,则有变换公式 阱c o s a - s i n :口炒( x - 吨w i d 圳t h7 2 :j + w i d t h 2 :) o _ a o ,p x y + 1 o 奇异值分解的人脸识别算法 则 p x y = ( p x 一1 y + p 【x + 1 y + p x y i + p x y + 1 ) 4 ( 2 - 7 ) 旋转处理的效果如下图2 3 所示 ( a ) 原图( b ) 未平滑的旋转图( c ) 平滑后的旋转图 图2 3 旋转效果图 2 3 4 图像的灰度调整 灰度分布标准化时使用了两个参量:灰度均值和灰度方差。灰度分布标准化的 思想就是将它们调整到定值,以消除由于采集图像时光照等因素对人脸图像造成的 影响。 在这里将图像看作是一个二维矩阵d 【卅嘲,其中w 和办为图像的宽和高,则 该图像的灰度平均值和灰度方差可表示为: f 万。蠹i 萎荟d 【司眇 o - - - j 2 去萎驴州小- ) 2 ( 2 - 。) 式中d x m 表示点【x ,y 】处的灰度值。对于输入的尺度标准化人脸图像,将它 的灰度均值和方差变换到一个灰度均值风和方差c r o ,则对图像中的每个象素的灰 度值进行如下的变换: d 纠= 粤( d y 卜互) + 。 ( 2 9 ) 【x _ y 】= = 旦( d 【x 】【y 卜) + 。 ( 2 9 ) 本文中胁取经验值1 2 8 ,c r o 取经验值4 9 ,效果参见图2 4 奇异值分解的人脸识别算法 图2 4 灰度分布标准化的人脸图像 1 4 奇异值分解的人脸识别算法 第三章图像预处理 图像在生成、传输或变换过程中会受到各种因素的干扰和影响,从而产生噪声。 预处理的目的是去除图像中的噪声,加强当中的有用信息,并对输入仪器或其它因 素造成的退化现象进行复原。本文对输入图像的预处理包括平滑和二值化两部分。 3 1 图像平滑 输入图像中一般都存在一定程度的噪声,而这些噪声对于人脸的定位及特征的 提取乃至识别都有较大的影响。平滑的目的是为了消除噪声。平滑的方法很多,可 分为空间域或频率域,亦可分为局部处理或全局处理,亦可以按线性平滑、非线性 和自适应平滑。从信号频谱分析的知识,我们知道
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能信息聚合平台创新创业项目商业计划书
- 汽车车载充电器快充电子创新创业项目商业计划书
- 量子安防监测系统创新创业项目商业计划书
- 短信自动回复规则设置工具创新创业项目商业计划书
- 输卵管造影影像课件
- 2025年教育信息化基础设施建设:现状与未来规划研究报告
- 河南省夏邑一高2026届高一化学第一学期期末考试试题含解析
- 民法典物权编培训课件
- 《ISO 37001-2025 反贿赂管理体系要求及使用指南》专业深度解读和应用培训指导材料之1:2范围+3术语和定义(2025A1)(可编辑!)
- 现代物流知识培训课程课件
- 初中七年级下册语文阅读理解十篇(含答案)
- 高考必背72篇古诗词
- 高分子材料专业英语最终稿省公开课一等奖全国示范课微课金奖课件
- 《数据库应用基础(Access 2010)》中职全套教学课件
- ISO 55013-2024 资产管理-数据资产管理指南(中文版-雷泽佳翻译-2024)
- 耳穴贴压技术操作评分标准
- 大学生安全教育课件(共41张)
- 幼儿园爱卫领导小组责任分工方案
- 假的体检报告单模板
- Facebook广告操作流程和广告效果数据
- 投资意向协议书2篇
评论
0/150
提交评论