已阅读5页,还剩62页未读, 继续免费阅读
(计算机软件与理论专业论文)基于主元分析和小波变换的人脸识别方法研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东北大学硕士学位论文 摘要 基于主元分析和小波变换的人脸识别方法研究与实现 摘要 生物识别技术是二十世纪最为热点的技术,人脸自动识别技术是生物特征识别 技术的重要组成部分,在近三十年星得到了广泛的关注和研究,已经成为计算机视 觉、模式识别领域的研究热点。身份识别及鉴定是保证系统安全的重要前提,在国家 安全、公安、司法、电子商务、电予政务、安全检查、保安监控等应用领域,都需要准 确的身份识别及鉴定。人脸识别被一直被认为最易被接受的身份鉴定方法之一。 本文对静止图像的多姿态人脸识别进行了研究,主要内容如下; ( 1 ) 利用图像处理的方法对图像做最初的处理,尽量使用于识别的照片的干扰因 素减少到最少,通过图像处理的方法也可以使图像的特征得到明显的突出而弱化其 不具有特征的部分。只有经过处理的图像才可用于识别,识别率的高低在很大程度 上也是受图像处理质量的影响。 ( 2 ) 本文首先使用主成分分析、镜像主成分分析、核主成分分析进行特征提取, 用基于欧式距离度量的最近邻分类器和相关性的方法进行识别。这种方法的计算速 度快,识别率很好但是对戴眼镜和有胡须的图像效果不理想。 ( 3 ) 小波变换的方法对人脸图像进行特征提取。在对小波变换后的图像形成模板 脸然后计算与模板脸的交叉距离,然后再将距离送入神经元网络进行训练最后用训 练好的网络来进行识别。对戴眼镜和有胡须的图像的识别率很高。 关键词:人脸识别;主成分分析;镜像主成分分析;核主成分分析;小波变换 神经元网络 东北大学硕士学位论文a b s t r a c t r e s e a r c ha ndr e a l i z a t i o ni nf a c e r e c o g n i t i o n m e t h o d sb a s e do np r i n c i p a lc o m p o n e n t a n a l y s i sa n d w a v e l e tt r a n s f o r m a b s t r a c t a u t o m a t e df a c er e c o g n i t i o nt e c h n i q u ei so n eo f t h em o s ta t t r a c t i v eb r a n c h e so f b i o m e t r i c s a n di ti sa l s oo n eo ft h em o s ta c t i v ea n dc h a l l e n g i n gt a s k sf o rc o m p u t e rv i s i o na n dp a t t e m r e c o g n i t i o ni nr e c e n t3 0y e a r s f o rt h eb e t t e rs e c u r i t y , r e l i a b i l i t y , a n dv a l i d i t y ,i ti sn o to n l y w i d e l ya p p l i e dh aav a r i e t yo fp e r s o n a li d e n t i f i c a t i o ns y s t e m s ,b u ta l s oc a l lb eu s e di nt h ef i e l d o f h u m a n - c o m p u t e ri n t e r f a c ea n dv i s u a lc o m m u n i c a t i o n t h i sd i s s e r t a t i o nm a i n l ys t u d i e st h ea p p r o a c h e st of r o n t a lf a c er e c o g n i t i o ni n 掣a yi m a g e s t h em a i nc o n t e n t sa r ea sf o l l o w s : ( 1 ) t h ei m a g em u s tb ep r o c e s s i n gb yt h ew a yo fi m a g ep r o c e s s i n g t r yb e s tt or e d u c e a l lt h ed i s t u r b i n gf a c t o r u s et h em e a n so fi m a g ep r o c e s s i n gt om a k et h ef e a t u r e sm o r e e x t r u s i v et oi m p a i rt h er e s tt h a ti sl i t t l eo ft h ef e a t u r e s 。t h er a t eo fr e c o g n i t i o ni sd e c i d e d b yt h eq u a l i t yo ft h ei m a g ep r o c e s s e d ( 2 ) t h i sp a p e ru s et h em e a n so f p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) 、s y m m e t r i c a l 、 p r i n c i p a lc o m p o n e n ta n a l y s i s ( s p c a ) 、k e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s ( k p c a ) 、 i nf e a t u r e se x t r a c t i o n t h e nu s et h em e a n st or e c o g n i z et h ef a c ew h i c hi sb a s e do ne u c l i d e a n d i s t a n c en e a r e s t - n e i g h b o rc l a s s i f i e rw h i c hp r o v e st ob ef a s ti nc o m p u t i n gs p e e da n dh i g hi n r e c o g n i t i o nr a t ee x c e p ti nt h er e c o g n i z i n gs u c hp e o p l ea sw a r eg l a s s e sa n db e a r d ( 3 ) t h ei m a g e sw h i c hh a v eb e e nw a v e l e tt r a n s f o r m e dt u r no u tt ob et e m p l a t ef a c e s t h e np u tt h ed i s t a n c eb e t w e e nt h er e s ti m a g e sa n dt e m p l a t ef a c e si n t ot h ea r t i f i c i a ln e r v en e tt o b et r a i n e d a f t e rt r a i n i n g ,u s et h ew e l l - t r a i n e dn e tt or e c o g n i z et h ei m a g e s t h i sr e c o g n i t i o n r a t ei se v e r yh i g h ,s p e c i a li ng l a s s e sa n db e a r d k e yw o r d s :f a c er e c o g n i t i o n ;p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) :s y m m e t r i c a l 、 p r i n c i p a lc o m p o n e n ta n a l y s i s ( s p c a ) ;k e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s ( k p c a ) w a v e l e tt r a n s f o r m ;a r t i f i c i a ln e r v en e t 独创声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加 以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为 获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论 文中作了明确的说明并表示诚挚的谢意。 学位论文作者签名:春五 签字日期:,身h 目消 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即 学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交 流。 ( 如作者和导师同意网上交流,请在下方签名:否则视为不同意) 学位论文作者签名:导师签名 签字日期:签字日期 东北大学硕士学位论文 第一章绪论 第一章绪论 在计算机及网络技术高速发展的现代社会中,信息安全显示出前所未有的重要性。 身份识别及鉴定是保证系统安全的重要前提,在国家安全、公安、司法、电子商务、电 子政务、安全检查、保安监控等应用领域,都需要准确的身份识别及鉴定。目前,个人 身份鉴别主要依靠i d 卡( 如身份证、工作证、智能卡和储蓄卡等) 和密码等手段,然而这 些手段存在携带不便、容易遗失、由于使用过多或不当而损坏、密码易被遗忘和破解等 诸多问题。由于技术的发展,犯罪分子伪造假证件的手段越来越高明,如假身份证、假 工作证、假文凭等在现实社会中也不时发生;在信息界,黑客攻击别人的计算机系统, 破译计算机口令亦常有之。美国每年在福利发放、信用卡交易、移动电话以及a t m 交 易方面由于身份诈骗而造成的经济损失高达6 0 亿美元口】。因此,目前广泛使用的依靠证 件、个人识别号码( p b d 、口令等传统方法来确认个人身份的技术面临着严峻的挑战,已 不能适应现代科技发展和社会进步的需要。 人们希望有种更加方便可靠的办法来进行身份鉴别,生物特征识别技术给这一愿 望带来了实现的可能。早在古埃及时人们就开始通过人体生物特征的测量( 如人脸、人手 等) 来鉴别人的身份;在刑侦领域,人们也早己使用最有效的人体生物特征之一指纹 来确定罪犯。人们可能会遗忘或丢失他们的卡片或密码,但绝不会遗忘或者丢失自己的 生物特征,如人脸、指纹、虹膜、掌纹等。因此基于生物特征识别技术的个人身份识别 系统具有更好的安全性、可靠性和有效性,正越来越受到人们的重视,并开始进入人们 社会生活的各个领域,迎接新时代的挑战。美国政府在“9 1l ”事件以后连续签署了三 个国家安全法案,要求采用生物识别技术。2 0 0 3 年6 月,联合国国际民用航空组织公布 了其生物技术的应用规划,将在个人护照中加入生物特征如指纹、虹膜、人脸特征等, 并在入境时进行个人身份确认。据国际生物集团的统计,到2 0 0 5 年底,全球生物特征认 证技术市场将达到2 2 亿美元,并以每年超过8 0 的速度增长。业内专家估计,未来5 年,我国也将形成近百亿元的市场。 目前,所有基于生物特征的自动识别系统都有大体相同的工作原理和工作过程。首 先是采集样本,这些样本可以是人脸图像、声音、指纹等;其次是进行特征提取,即提 取样本的某些特征,用某种算法为其分配一个特征代码,这一代码被存入数据库。最后 当需要对某人进行身份鉴定时,再用某种特征匹配算法将存入数据库的特征代码与被识 别人的特征相匹配,从而查明其身份。 1 东北大学硕士学位论文 第一章绪论 1 1 生物特征识别技术 生物特征识别技术是利用人体特有的生理或行为特征来进行身份识别。人的生理特 征是与生俱来的,而行为特征通常则是后天习惯养成的。从理论上说,任何人体的生理 或行为特征,只要满足一定要求,如普遍性、唯一性、稳定性、取样方便性、用户可接 受性、样本防伪性、计算复杂性等条件,都可以用来作为识别个人身份的特征1 2 3 】f 4 】。 生物特征识别技术可分为基于生理特征的生物识别技术和基于行为特征的生物识别 技术【1 】【3 】f 5 】【哪。目前,研究比较深入,应用比较广泛的有指纹、人脸、人脸温谱、虹膜、 视网膜、手型、声纹以及签名等。指纹、人脸、人脸温谱、虹膜、视网膜和手型为生理 特征,声纹和签名为行为特征。生物特征的详细分类如图1 1 所示。 图1 1 生物特征分类 f i g 1 1t h ec l a s s i f i c a t i o no f b i o m e t r i cf e a t u r e 1 1 1 人体生物特征识别技术简介 比尔盖茨认为,“以人类生物特征( 指纹、语音、人脸识别等方式) 进行身份 验证的生物识别技术,在今后数年内将成为i t 产业的最为重要的技术革命”。如果 将生物识别技术成功运用于监控系统当中,必将引发监控行业的技术革命。 由于生物特征识别技术使用人体唯一的、可靠的和稳定的生物特征来鉴别人的 身份,目前人体生物特征识别技术仍然处于发展阶段,一个有效的生物识别系统, 首先要解决好以下几个关键技术问题: ( 1 ) 生物特征信息的获取 2 东北大学硕士学位论文 第一章绪论 生物特征信息的获取可以有多种方法,但目前其获取质量仍然不能达到令人满 意的程度,如虹膜信息的提取,目前还没有一个完整的实用的提取方法。相对虹膜 信息的提取,人脸信息的获取比较容易实现。 ( 2 ) 生物特征数据库建立和管理 如何有效地将生物信息组织在数据库中,实现快速检索和匹配是一个值得深入 研究的课题。人的生物特征信息数据量大,数据维数高,尤其是在大规模应用中, 如何建立和管理生物信息数据库目前还存在很多问题。随着多媒体数据库技术的发 展,人脸信息的存储、管理目前相对成熟,但人脸的匹配由于数据量特别巨大,匹 配算法复杂,不能达到实时检测的目的,因此,快速实时匹配算法一直是研究的重 点和难点。 ( 3 ) 生物特征的提取和匹配 生物特征提取就是选择一个能最好的表示个体的最优特征集。例如关键特征点、 纹理特征、形状特征、线条特征等,特征提取不仅是进行数据压缩,还要剔除对识 别无关的冗余信息,以便于快速识别和匹配,提高系统实时性。 1 1 2 生物特征识别技术 ( 1 ) 指纹识别 基于指纹的生物识别技术应用最早、比较成熟,人们利用指纹进行身份识别已经有 好几个世纪了。指纹识别( f i n g e r p r i n t r e c o g n i t i o n ) 的优点在于:指纹的独特性非常强, 同卵双胞胎的指纹也不相同;每个人的指纹是相当稳定的,很难发生变化;指纹信息的 复杂度足以适合大规模的身份识别;同一个人的不同手指的指纹不相同且不具有相关性, 可以方便地利用多个指纹构成多重口令,提高系统的安全性;指纹采集头可以更加小型 化,并且价格会更加的低廉。指纹识别的不足之处在于:指纹传统上被用于罪犯鉴别, 因而比较不容易被一般用户所接受:活性判别和人造指纹判别等反欺诈技术有待进一步 的发展;皮肤干澡、污垢、割伤和疤痕等因素会影响识别效果;并且指纹识别需要相当 大的计算资源。 ( 2 ) 虹膜识别 虹膜是位于瞳孔与巩膜之间的有色环状区域。大量的临床观察和研究发现组成一个 虹膜的可变项不少于2 6 6 项,这使得虹膜的结构千奇百怪,能够成为独一无二的标识, 与其它的生物特征相比,虹膜具有非常高的独特性;虹膜结构的生成过程被称为“混沌 的形态形成( c h a o t i cm o r p h o g e n e s i s ) ”,不受遗传影响,即使是同卵双胞胎的虹膜也各不 相同,并且人在出生两年以后,虹膜便基本不再发生变化。虹膜识别( i r i sr e c o g n i t i o n ) 3 。 东北大学硕士学位论文 第一章绪论 具有很强的反欺诈性,用外科手术改变虹膜纹理结构极其困难,而判别人造的或者死亡 的虹膜却非常容易。 尽管虹膜扫描识别系统能够取得很高的识别率,但也存在缺点:很难将图像获取 设备的尺寸小型化:需要昂贵的高分辨率摄像头;镜头可能会使图像畸变而使得可 靠性大为降低:黑眼睛极难读取;需要一个比较好的光源等等。这些缺点限制了它 的应用范围。 ( 3 ) 语音识别 在语音识别( v o i c er e c o g n i t i o n ) 中,需要说话人讲一句或几句测试短旬,对它 们进行某些测量,然后计算量度矢量与存储的参考矢量之间的一个( 或多个) 距离函 数,最后进行模式识别。 语音信号获取方便,需要时还可以通过电话进行鉴别;不依赖于特定文字的语 音鉴别方法具有很高的安全性。但在有噪声的环境中如公共场所或经过电话传输时 带来的声音畸变以及人们在生病尤其是感冒时都可能使识别率明显下降。尤其是人 们故意改变自己或模仿他人的声音或者经过某种特殊处理的录音不但可能使识别率 明显下降,甚至可能欺骗语音识别系统。这些原因使语音识别系统的应用范围受到 很大的限制。 ( 4 ) 签名识别 签名识别( h a n d w r i t i n gr e c o g n i t i o n ) 是一种行为识别技术,目前大多用于身份验 证。签名识别的困难在于,签名的动态变化范围大,即使是同一个人的两个签名也不相 同。签名验证技术根据数据的获取方式可以分为在线验证和离线验证两种。离线验证的 对象是写在纸上的字符,通过扫描仪和摄像机转化为计算机能处理的数字图像;在线验 证利用数字写字板和压敏笔等传感器记录签名过程的加速度、速度、压力、方向等动态 特性。签名的动态特性非常难以模仿,因此在线签名比离线签名更具安全性。 ( 5 ) 人脸识别 人脸是人类视觉中最为普遍的模式,人脸所反映的视觉信息在人与人的交流、 交往中有着重要的作用和意义。计算机人脸识别技术试图使计算机具有人的识别能 力,由于其广泛的应用领域,人脸识别( f a c er e c o g n i t i o n ) 技术在近三十年里得到 了广泛的关注和研究。依托于图像理解、模式识别、计算机视觉和神经网络等技术, 人脸识别技术在一定应用范围内获得了成功,并且正在被推向应用领域。 1 2 人脸识别的研究内容 人脸自动识别的研究大致可以分为人脸检测、人脸表征、人脸识别和表情分析等几 4 。 东北犬学硕士学位论文 第一章绪论 具有很强的反欺诈性,用外科手术改变虹膜纹理结构极其困难,而判别人造的或者死亡 的虹膜却非常容易。 尽管虹膜扫描识别系统能够取得很高的识别率,但也存在缺点:很难将图像获取 设备的尺寸小型化:需要昂贵的高分辨率摄像头:镜头可能会使图像畸变而使得可 靠性大为降低;黑眼睛极难读取;需要一个比较好的光源等等。这些缺点限制了它 的应用范围。 ( 3 ) 语音识别 在语音识别( v o i c e r e c o g n i t i o n ) 中,需要说话人讲一句或几旬测试短句,对它 们进行某些测量,然后计算量度矢量与存储的参考矢量之间的一个( 或多个) 距离函 数,最后进行模式识别。 浯音信号获取方使。需要时还可以通过电话进行鉴别;不依赖于特定文字的语 音攀别方法具有很高的安全性。但在有噪声的环境中如公基场所或经过电话传输时 带来的声音畸变以及人们在生病尤其是感冒时都可能使识别率明显下降。尤其是人 们故意改变自己或模仿他人的声音或者经过某种特殊处理的录音不但可能使识别率 明显f 降,甚至町能欺骗语音识别系统。这些原因使语音识别系统的应用范围受到 很大的限制。 ( 4 ) 签名识别 签名识别( h a n d w r i t i n gr e c o g n i t i o r t ) 是种行为识别技术,目前大多用于身份验 证。签名识别的困难在于,签名的动态变化范围大,即使是同一个人的两个签名也不相 同。签名验证技术根据数据的获取方式可以分为在线验证和离线验证两种。离线验证的 对象是写在纸上的字符,通过扫描仪和摄像机转化为计算机能处理的数字图像;在线验 证利用数字写字板和压敏笔等传感器记录签名过程的加速度、速度、压力、方向等动态 特性。签名的动态特性非常难以模仿因此在线签名比离线签名更具安全性。 ( 5 ) 人脸识别 人脸是人类视觉中最为普遍的模式,人脸所反映的视觉信息在人与人的交流、 交往中有着重要的作用和意义。计算机人脸识别技术试图使计算机具有人的识别能 力,由于其广泛的应用领域,人脸识别( f a c er e c o g n i t i o n ) 技术在近三十年里得到 了广泛的关注和研究。依托于图像理解、模式识别、计算机视觉和神经网络等技术, 人脸识别技术在一定应用范围内获得了成功,并且正在被推向应用领域。 1 2 人脸识别的研究内容 人脸自动识别的研究大致可以分为人脸检测、 人脸自动识别的研究大致可以分为人脸检测、 d 人脸表征、人脸识别和表情分析等几 人脸表征、人脸识别和表情分析等几 东北大学硕士学位论文第一章绪论 个方面【7 】o 计算机人脸识别问的研究内容从广义上讲大概包括以下几个方面的内容: ( 1 ) 人脸检测 人脸检测( f a c ed e t e c t i o n ) 就是从各种不同的场景中检测出人脸的存在并确定其位 置。在某些情况下由于图像( 照片) 的获取环境是可以人为控制的( 如身份证照片等) ,因而 人脸的定位可以轻易地做到;但在大多数场合中由于场景较复杂,人脸的位置是预先不 知道的,因而首先必须确定场景中是否存在人脸,如果存在人脸,再确定其位置。脸部 毛发、化妆、光照、噪声、面部倾斜和人脸大小变化以及各种各样遮挡等因素会使人脸 检测问题变得更为复杂。 ( 2 ) 人脸表征 人脸表征( f a c er e p r e s e n t a t i o n ) 就是采取某种表示方法表示检测出的人脸和数据库 中的已知人脸。通常的表示法包括几何特征( 如欧式距离、曲率、角度等) 、代数特征 ( 如矩阵特征矢量) 、固定特征模板、本征脸、云纹图等。 ( 3 ) 人脸识别 人脸识别( f a c er e c o g n i t i o n ) 就是将待识别的人脸与数据库中的已知人脸比较,得 出相关信息。这个过程是选择适当的人脸表征方式与匹配策略。整个识别系统的构造与 人脸的表征方式密切相关。 ( 4 ) 表情姿态分析 表情姿态分析( e x p r e s s i o ng e s t u r ea n a l y s i s ) 就是对待识别人脸的表情或者姿态信息 进行分析,并对其进行分类。 ( 5 ) 生理分类 生理分类( p h y s i c a lc l a s s i f i c a t i o n ) 就是对待识别人脸的生理特征进行分析,得出其 年龄、性别等相关信息。 人脸检测,人脸表征,人脸识别是通常意义上的建立人脸自动识别系统的三个方面。 人脸自动识别系统包括两个主要的技术环节,首先是人脸的检测和定位,即从输入图像 中找到人脸存在的位置,并将人脸从背景中分割出来( 即人脸检测) ,然后才是对归一 化的人脸图像进行特征提取与识别( 即人脸表征与人脸识别) 。 1 2 1 人脸识别技术简介 人脸识别的研究5 始于6 0 年代末,b l e d s o e 以人脸特征点的间距、比率等参数为特 征,建成了一个半自动的人脸识别系统。而且早期人脸识别研究主要有两大方向:一 是提取人脸几何特征的方法,包括人脸部件归一化的点间距离和比率以及人脸的一些 5 东北失学硕士学位论文 第一章绪论 特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构;二是模板匹配的方法, 主要是利用计算模板和图像灰度的自相关性来实现识别功能。 目前的研究主要有两个方向:一是基于整体的研究方法,它考虑了模式的整体属 性,包括本征脸( e i g e n f a c e ) 6 1 主成分分析( p c a ) 、奇异值分解( s i n g u l a rv a l u e d e c o m p o s i t i o n ) 1 7 j 、人脸等密度线分析匹配、弹性图匹配( e l a s t i cg r a p hm a t c h i n g ) 、 隐m a r k o v 模型( h i d d e nm a r k o vm o d e l ) 【8 1 以及神经网络【9 】方法等;二是基于特征分 析的方法,也就是将人脸基准点的相对比率和其它描述人脸脸部特征的形状参数或类 别参数等一起构成识别特征向量。这种基于整体脸的识别不仅保留了人脸部件之间的 拓扑关系,而且也保留了各部件本身的信息,而基于部件的识别则是通过提取出局部 轮廓信息及灰度信息来设计具体识别算法。 近年来的一个趋势是将人脸的整体识别和特征分析的方法结合起来,如 k i n m a n l a m 提出的基于分析和整体的方法,a n d r e a sl a n i t i s 提出的利用可变形模型 ( f l e x i b l em o d e l s ) 来对人脸进行解释和编码的方法。 从目前的研究成果来看,就二维图像而言,成功的人脸识别至少需要考虑以下 几个方面: ( 1 ) 由于外部干扰不可避免,预处理的效果将会影响到识别结果,好的人脸模型 应能够在识别的同时,抑制并分离外在干扰的影响。 ( 2 ) 细节是区分不同人脸的关键,因此很多识别方法都十分注重细节,如弹性模 板匹配中的局部细节,就是通过节点的小波变换特征加以表达,而在灰度形状分离 的可变模型中,局部灰度投影分布也描述了人脸细节,另外,传统的点和曲线的方 法更是直接从局部细节入手。 ( 3 ) 在匹配的时候,不仅要考虑各种因素所导致的人脸微小变形,而且在容忍变 形的同时,还不能损害到人脸识别的有效性。 ( 4 ) 对于表达人脸的各种特征需要进行比较和选择,以找出人脸最活跃的特征。 这可以通过如下两种途径:一是比较同一个人的多张图片,以得到稳定的特征;另 一种方法就是比较不同人的图片,以得出该人最“与众不同”之处。 ( 5 ) 使用的识别系统还必须考虑计算复杂度。 1 2 2 常用的人脸检测和识别方法 目前常用的人脸检n t l o 】和识别方法可以归纳为四大类: ( 1 ) 基于知识的方法 基于知识的方法( k n o w l e d g e b a s e dm e t h o d s ) 将基于规则的方法将典型的人脸形成知 6 东北大学硕士学位论文第一章绪论 识库编码人脸。一般比较容易提出简单的规则来描述人脸特征和它们的相互关系。例如, 在一幅图像中出现的人脸,通常具有互相对称的两只眼睛、一个鼻子和一张嘴。特征之 间的相互关系可以通过它们的相对距离和位置来描述。 ( 2 ) 特征不变方法 特征不变方法( f e a t u r ei n v a r i a n ta p p r o a c h e s ) 这些算法的目的是即使姿态、视角或光 照条件改变,也能找到存在的结构特征,然后使用找到的特征确定人脸。常用的人脸特 征和方法如下: 面部特征 面部特征( f a c i a lf e a t u r e s ) ,l e u n g 等人开发一种基于局部特征检测器和任意图匹配 的概率方法在复杂场景中定位人脸。其目标是找到确定的面部特征的排列。典型的人脸 用5 个特征( 2 只眼睛、2 个鼻孔和鼻子与嘴唇的连接处) 来描述。对于任何一对相同类型 面部特征( 如左眼和右眼) ,计算它们的相对距离,图像的整体距离用g a u s s i a n 分布建模。 人脸模板通过多方向、多尺度g a u s s i a n 滤波器( 砸部特征内部的象素数) 在数据集中通过 的人脸像素的平均响应进行定义。 纹理 人脸有着明显的纹理( t e x t u r e ) ,可以用来分开人脸和其他的对象。这种方法采用 的是颜色信息和人脸纹理结合的模型,其优点是可以检测到不是垂直的或存在一些类似 胡须和眼镜等特征的人脸。 皮肤颜色 皮肤颜色( s k i n c o l o r ) 已经被使用并已被证明是很有效的特征。虽然不同的人有不 同的皮肤颜色,几项研究已经表明主要的不同在于它们的亮度而不是它们的色度,比较 常用的标注皮肤像素的颜色空间包括r g b ,h s v 等。皮肤颜色通常不能独自有效地检测 和追踪人脸。近年来,基于肤色的人脸识别被扩展到形状分析、颜色分割和运动信息结 合的模块化系统,并且已经获得了很好的识别效果。 多特征 多特征( m u l t i p l ef e a t u r e s ) 方法是利用全局特征如皮肤、大小和形状找到人脸候选 区,然后利用局部的、详细的特征如眼眉、鼻子和头发检验这些候选区。 ( 3 ) 模板匹配方法 模板匹配方法( t e m p l a t em a t c h i n gm e t h o d s ) 这种方法存储几种标准的人脸模式,用来 分别描述整个人脸和面部特征,通过计算输入图像和存储模式之间的相互关系,对人脸 图像进行检测。这些方法主要用来进行人脸定位和检测。 这种方法使用眼睛、鼻子、嘴和人脸轮廓等子模板建模人脸。每一个子模板按照线 东北大学硕士学位论文第一章绪论 分割定义。在输入图像的线是基于最大梯度变化提取的,然后与子模板匹配。首先计算 子图像和轮廓模板之间的相互关系检测人脸的候选区域。然后完成用其它子模板在候选 区的匹配。 可变形模板:使用可变形模板建模人脸特征,拟合先前的用于人脸特征的( 如眼睛) 弹性模型,人脸特征通过参数化的模板描述。在追踪非刚性的特征上有好的性能,但这 种方法的缺点是必须在重要的对象近邻初始化。 ( 4 ) 基于外观的方法。 基于外观的方法( a p p e a r a n c e b a s e dm e t h o d s ) 是模板匹配中的模板是由专家预定义 的,和模板匹配中的方法不同,基于外观方法中的“模板”是通过训练图像中的样本学 习得到的。再将这些学习到模型应用到人脸图像的检测和识别中。 通常,基于外观的方法依赖于统计分析和机器学习技术找到不同的人脸图像之间的 特征差别,在不同类的人脸之间找到判别函数( 也就是决策面、分隔超平面、闽值函数) 。 基于外观的方法主要有以下几种: 主元分析的方法 主元分析的方法属统计分柝的范畴,将表达人脸的大量图像数据降维后进行模式分 类。 神经元网络 神经元网络( n e u r a ln e t w o r k s ) 已经成功地应用到许多模式识别问题,对于人脸识 别使用神经元网络的优点是:训练获得的人脸模式的复杂类条件密度系统的可行性。而 缺点是通常需要将人脸作为一个一维向量输入,因此输入节点庞大,其识别改进的一个重 要目标就是降维处理。 支持向量机 大多数训练分类器的方法( 如b a y e s i a n 、神经元网络或径向基函数r b f ) 是基于最小 化训练的错误,也就是经验风险的。支持向量机( s u p p o r t v e c t o r m a c h i n e ) 1 8 1 操作是另一 个指导原则,称作结构风险最小化,其目的是最小化期望的推广性错误上界。s v m 分类 器是线性分类器,其分类超平面接近未知测试样本的最小化分类错误。所谓最优分类就 是要求分类不但能够将两类无错误的分开,而且要使两类分类间隔最大。无错误分开是 保证经验风险最小,而使分类间隔最大实际上就是使置信范围最小,从而使真实风险最 小。通过对样本的训练构造最优分类超平面,从而将学习到的训练机用于未知样本的检 测中。 ( 5 ) 隐m a r k o v 模型 隐m a r k o v 模型( h i d d e nm a r k o vm o d a l ,h m m ) 假设模式可以被刻画成参数的随机 8 东北大学硕士学位论文 第一章绪论 过程,这个过程的参数可以被精确地、很好地定义的方式估计。在h m m 用于模式识别问 题时,首先需要确定许多隐藏的状态形成一个模式。然后,可以训练h m m 从样本中学习 传统状态间的概率,每个样本被表示为观察序列。训练删模型以后,观察的输出概 率确定了其所属的类别。 1 2 3 人脸识别研究的难点 人脸识别是一项极具挑战性的任务,影响识别效果的相关因素主要表现为以下 几个方面: ( 1 ) 姿态:人脸图像是变化的。由于相关的照相机一脸姿( 正面的、4 5 度、侧面、颠倒 的) 不同,而一些脸部特征如眼睛或鼻子可能部分地或全部被遮挡。 ( 2 ) 组件的存在和不存在:面部的特征如胡须和眼镜等可能存在也可能不存在,有很 大的变化,这些组件包括形状、颜色和大小。 ( 3 ) 面部表情:人脸表情直接影响人的外观。 ( 4 ) 图像的方向:照相机光轴的不同旋转直接改变人脸图像。 ( 5 ) 图像的条件:当图像产生时,一些因素如光( 光谱、光源分布和强度) 和照相机 的特性( 传感器的响应、透镜) 影响人脸的外观。 然而,人脸识别的复杂性和挑战性并没有影响人们对这一课题的研究热情,这 与人脸识别潜在的应用价值和重要的理论意义是分不开的。 1 2 4 人脸识别的应用前景 人脸识别技术在国家安全、军事安全和公共安全,智能门禁、智能视频监控、 公安布控、海关身份验证、司机驾照验证等领域得到了广泛的应用;在民事和经济 领域,各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证,社会保险人的 身份验证等具有重要的应用价值:在家庭娱乐等领域,人脸识别也具有一些有趣有 益的应用,比如能够识别主人身份的智能玩具、家政机器人,具有真实面像的虚拟 游戏玩家等等。 1 3 人脸数据库 任何人脸识别系统的开发都需要建立一个包含人脸图像或图像系列的数据库。 人脸数据库的设计对系统的识别率影响是至关重要的。开发一个在所有可能的变化 情况下都能正确进行人脸识别的系统是非常困难的。因此几乎所有人脸识别的研究 都是在一定约束条件下进行的,如光照、表情和姿态变化等受到一定限制,大部分 9 东北大学硕士学位论文 第一章绪论 系统都未考虑长期变化,如年龄的变化等。所以有必要建立适合不同需要的人脸数 据库,以下介绍一些典型的标准数据库。 ( 1 ) 英国o r l 入脸数据库。 英国o r l ( o l i v e r ir e s e a r c hl a b o r a t o r y ) 人脸数据库包括从1 9 9 2 年4 月到1 9 9 4 年4 月拍摄的一系列人脸图像,由4 0 个人的4 0 0 幅灰度图像组成,图像尺寸为 1 1 2 9 2 ,图像背景为黑色。其中人脸脸部表情和细节均有变化,例如笑与不笑,眼 睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达 2 0 度,入脸的尺寸也有最多1 0 的变化。这是目前使用最广泛的人脸数据库。 ( 2 ) 英国m a n c h e s t e r 人脸数据库。 该数据库由3 0 个人的6 9 0 幅图像组成。其中训练集和测试集分开,有不同的光 照和背景特征,而且对于每个人而言,前后两张照片之间的时间间隔至少有3 周。 训练集对光源有一定的约束,而在测试集中则变化多端。测试集还增加了两级难度: 其一是对于其中的相似人脸,仅有发型,背景以及戴眼镜等变化;其二是特征遮挡, 如头发,黑眼镜,手臂等。 虽然m a n c h e s t e r 数据库远比o r l 数据库测试更为全面,但因发表的比较结果 不够多,从而远不如o r l 使用广泛。 ( 3 ) 美国f e r e 人脸数据库 美国f e r e t ( f a c er e c o g n i t i o nt e c h n o l o g y ) 人脸数据库是目前最大的人脸数据 库,由美国军方研究实验室提供,其中每人8 张照片,两张正脸,3 张从右到左不 同侧面角度的照片,有些人还提供了更多不同视点和不同表情的照片。该数据库中 不包含戴眼镜的照片,拍摄条件也有一定的限制,人脸大小约束在规定范围内。到 1 9 9 6 年6 月,该数据库已存储了1 1 9 9 个人的1 4 1 2 6 幅图像,而且逐年增加。但到 目前为止,该数据库并未提供运动图像系列或包含语音信息。f e r e t 数据库的最大 缺点是非美研究机构的获取不便。 ( 4 ) 日本a t r 数据库。 该数据库考虑了除人脸特征外的其他信息在人脸识别中的作用,提供人脸和语 音的合成,由6 0 人组成。但其中人脸图像是静止的而非运动图像序列。 ( 5 ) 欧洲m 2 v t s 多模型人脸数据库。 该数据库用于测试多模型身份鉴别。目前该库由3 7 人组成,每人有5 个图像序 列,拍摄时间间隔一周左右。其中至少有个序列提供合成语音。 其他数据库还有:c m u ( c a r n e g i em e l l o nu n i v e r s i t y ) i e 面人脸数据库,m i t 单人 脸数据库等。o r l 人脸数据库仍是目前使用最广泛的标准数据库,它含有大量的比 1 0 东北大学硕士学位论文第一章绪论 较结果。本文所使用的是o r l 人脸数据库。 1 4 本文的安排 目前人脸识别常用的方法为特征脸( e i g e n f a c e s ) 、小波变换( w a v e l e tt r a n s f o r m ) 、 离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ) 、支持向量机( s u p p o r tv e c t o rm a c h i n e ) 等方法综合实现对人脸图像的识别。本文侧重于人脸图像的特征提取,主要针对主 元分析( p c a ) 、镜像主元分析( s p c a ) 、核主元分析( k p c a ) 、小波变换进行 特征提取并将两种特征提取方法进行比较得出两种特征提取的方法使用的目标的特 点,然后采用的是距离和距离加神经元网络的的方法进行识别。 其中小波变换的识别方法,先计算距离,然后再将距离值放入神经元网络训练 进行二次识别是本文创新的识别方法。全文共分为五章。 ( 1 ) 第一章绪论:概述了生物特征识别技术及其发展方向、应用背景和研究意义, 重点描述了人脸识别技术的研究内容、研究方法、难点以及应用前景,对人脸自动 识别技术进行了综述。并介绍了广泛应用在人脸检测和识别领域的人脸数据库。 ( 2 ) 第二章人脸识别中常用到的图像处理的方法:本章主要总结了该数字图像处理 与识别系统中用到的一些基本的数字图像处理方法,主要包括图像的增强、图像复原、 图像正交变换、图像腐蚀膨胀细化算法、图像边缘检测与提取及轮廓跟踪。 ( 3 ) 第三章基于主成分分析方法的人脸识别:介绍了p c a 、s p c a 、k p c a 在生 物识别上的历史以及它卓越的性能。根据其特征提取的结果进行识别取得了很好的 识别率,并对试验结果作进一步的分析得出这样个结论:对于标准正态图像基于 p c a 的特征提取识别的方法识别率特别好而且识别速度快。但是对于有干扰因素的 图像结果不能令人满意。 ( 4 ) 第四章基于小波变换方法的人脸识别:系统而且全面的介绍了小波变换的特 点以及它在特征提取并将其用到人脸识别中。第三章的研究提出了这样一个问题: 如何才能有效的对有干扰因素的图像进行更好的特征提取并找到一种好的识别方法 使识别率更好。根据各种试验最后采取这样一种方法用小波变换形成模板脸然后计 算与模板脸的交叉距离,并将结果进行神经元网路训练形成判别网络,最后用训练 好的网络进行识别。这也是本文在识别方法上的尝试并且取得了良好的识别效果。 ( 5 ) 第五章总结与展望:人脸识别是一个跨学科极富挑战性的前沿课题。但目前人 脸识别还只是处在研究阶段,尚不是实用化领域的活跃课题。因此,在总结了本文所做 的工作和取得的成绩之后,对接下来的工作方向和本文进一步需要完善之处进行分析展 望。 1 1 东北大学硕士学位论文 第二章人脸图像预处理的常用方法 第二章人脸图像预处理的常用方法 本章主要总结了该数字图像处理与识别系统中用到的一些基本的数字图像处理方 法,主要包括图像的增强、图像复原、图像正交变换、图像腐蚀膨胀细化算法、图像边 缘检测与提取及轮廓跟踪。编程实现语言为v c + + 6 0 。 2 1 图像增强 各类图像系统中图像的传送和转换( 如成像、复制、扫描、传输以及显示等) 总要 造成某些图像的降质。例如:在摄像时,光学系统的失真、相对运动、大气流动等都会 使图像模糊:在传输过程中,由于嗓声污染,图像质量回有所下降,必须对这些降质的 图像进行改善处理。通常的方法有两类:一类是不考虑图像降质的原因,只将图像中感 兴趣的特征有选择的突出,而衰减其次要的部份:另一类是针对图像降质的原因。设法 去补偿降质因数,从而使改善后的图像尽可能的逼近原始图像。第一类方法能提高图像 的刻度性,改善后的图像不一定逼近原始图像,如突出目标的轮廓,衰减各总噪声,将 黑白图像转换成彩色图像等,这类方法通常称为图像增强技术。第二类方法能提高图像 质量的逼真度,一般称为图像复原技术。 图像的增强技术通常有两类方法:空间域方法和频率域方法。空域法主要是针对图 像相灰度直接进行运算处理。例如:将包含某点的一个小区域内的各点灰度值进行平均 运算,用所得的平均值来代替该点的灰度值,这就是通常所说的平滑处理。空域的图像 增强技术可以用下式来描述: g ( x ,) = 厂( 工,y ) h ( x ,y )( 2 1 ) 其中f ( x ,y ) 是处理强的图像;g ( x ,y ) 是处理后的图像:h ( x ,y ) 为空间预算函数。 图像增强的频率域法就是在图像的某中变换域中( 通常是频率域中) 对图像的变换 值进行某种运算处理,然后变换回空间域。例如:可以先对图像进行傅立叶变换,在对 图像的频谱进行某种修正( 如滤波等) ,最后在将休整后的图像进行傅立叶反变换回空 间域中,从而增强该图像。它是一种间接处理方法。 2 1 1 直方图均衡化 直方图表示数字图像中每一灰度与其出现频度间的统计关系,直方图能给
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年考研数学一对一协议合同
- 2025年外贸咨询服务合同协议合同
- 采购2025年服装辅料采购协议合同
- 2025年唐卡画师考试题目及答案
- 基于精细化管控的东电F事业部售后服务项目成本管理创新与实践
- 基于粗糙集神经网络的软件测试外包成本预测模型:理论、构建与实践
- 基于粗糙集与多级支持向量机的汽轮机故障智能诊断研究
- 基于第三方反担保的信用担保定价:理论、模型与实践分析
- 2025年小学音乐沪教版四年级上册国测模拟试卷附答案
- 2025年环境保护知识题库及答案
- 经济与社会:如何用决策思维洞察生活(复旦大学)【超星尔雅学习通】网课章节答案
- 微生物基础知识培训新员工
- 比熊犬的饲养要点
- 传统教师批改作文的弊端和学生互评作文的可行性分析,作文教学论文
- YY/T 0310-2015X射线计算机体层摄影设备通用技术条件
- GA/T 148-2019法医学病理检材的提取、固定、取材及保存规范
- 《智慧机场发展研究(论文)》
- DB4401-T 102.1-2020 建设用地土壤污染防治+第1部分:污染状况调查技术规范-(高清现行)
- 低压电力电缆招标技术规格书
- 小学道德与法治人教六年级上册第四单元法律保护我们健康成长-《专门法律来保护》教学设计
- 中国债券市场投资手册(2022)
评论
0/150
提交评论