




已阅读5页,还剩53页未读, 继续免费阅读
(计算机应用技术专业论文)智能人脸识别技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要摘要本文深入探讨了人脸识别的理论,分析了特征提取和分类器设计的主要方法,请就各方法优缺点和适用范围给出了评价。在分析传统的识别方法基础上,重点讨论了智能人脸识别方法。我们改进了一种基于矩理论的识别方法,给出了计算公式和证明过程,可用于解决小规模人脸识别问题;我们将智能方法应用到人脸识别中,分别利用自组织特征映射和次分量方法抽取人脸的整体特征和局部特征,依据特征融合理论,重新组合为新的复合特征,为压缩特征数据,我们首次引入克隆选择算法自动进行特征优化选择,最后,利用支持矢量机构造多分类器进行分类识别在不同规模人脸识别库上仿真结果表明,该系统自适应能力强,分类识别精度高,适用于大规模复杂人脸识别问题。采用增量式学习算法后,系统还具有自适应增量学习能力。关键词:人脸识别特征提取分类器设计支持向量机垒里! ! 坠竺!a b s t r a c ta u t o m a t i cf a c ei d e n t i f i c a t i o nh a sr e c e n t l yu n d e r g o n ea ni n c r e a s i n gd e m a n d t h e s ef a c er e c o g n i t i o nh a st h eb e n e f i to fb e i n gap a s s i v ea n dn o n i n t r u s i v es y s t e mf o rv e r i f y i n gp e r s o n a li d e n t i f y m a n yt e c h n i q u e sf o rf a c er e c o g n i t i o nh a v eb e e nd e v e l o p e dw h o s ep r i n c i p l e ss p a ns e v e r a ld i s c i p l i n e s ,s u c ha si m a g ep r o c e s s i n g ,p a r e mr e c o g n i t i o n ,c o m p u t e rv i s i o na n dn e u r a ln e t w o r k s e a r l i e rr e s e a r c ho nf a c er e c o g n i t i o nw a sm a i n l yb a s e do nt r a d i t i o n a lm e t h o d s ,s u c ha st h ee x t r a c t i o no ff a c i a lf e a t u r e sa n dt e m p l a t em a t c h i n g ,e i g e n f a c e sa n dd e f o r m a b l et e m p l a t e sh a v e b e e nu t i l i z e d i na d d i t i o n ,s o m eo ft h e s ea p p r o a c h e su t i l i z ee x a m p l e - b a s e dl e a r n i n gt e c h n i q u e s ,s u c ha sn e u r a ln e t w o r k s ( n n ) a n dr a d i c a lb a s i sf u n c t i o nn e t w o r k s h o w e v e r ,s o m co ff a c er e c o g n i t i o np r o b l e m ss t i l tr e q u i r ef u g t h e rd e v e l o p m e n t ,t h i si st h ec a s ef o rp r o b l e m so fr e c o g n i t i o nf a c ei m a g e sc o n v e y i n gc h a n g e si ni l l u m i n a t i o n ,f a c i a le x p r e s s i o na n dc h a n g e sd u et ot h et i m ed e l a yb e t w e e nt h ea c q u i s t i o no ft h er e f e r e n c ea n dt e s t e df a c ei m a g e s 0 0 rm a i nw o r ki st oa n a l y s i sm e t h o d so fe x t r a c t i o nf a c ef e a t u r e sa n dc o n t r a c t i o no fc l a s s i f i e r t h ew o r kp r e s e n t e di nt h i sp a p e ri st oa p p l ys e l f - o r g a n i z i n gf e a t u r em a pa n dm i n o rc o m p o n e n tt oe x t r a c t i o nf e a t u r e sf r o mm u l t i - v i e wf a c ei m a g e s ,t h e nc o m b i n et h o s ef e a t u r e sa san e wc o m b i n e df e a t u r es e t ,i no r d e rt or e d u c er e d u n d a n c yd a t a ,w ea p p l yc l o n ea l g o r i t h m st or e d u c ed a t at h r o u g hr o t a t i o ni ni n p u ts p a c e i na d d i t i o n ,w ec o n s t r u c tm u l t i c l a s sc l a s s i f i e rt h r o u g hm i x t u r eo fs e v e r a ls u p p o r tv e c t o rm a c h i n e s s i m u l a t i o nr e s u l t si n d i c a t et h ep e r f o r m a n c eo f o u rc o m b i n e dm e t h o di sh i g h l yi m p r o v e dt h a np r i n c i p l ec o m p o n e n ta n a l y s i sm e t h o da n df i s h e rm e t h o d k e y w o r d :f a c er e c o g n i t i o nf e a t u r es e l e c t i o np c as v m创新性声明y 5 8 3 4 4 7本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名拯彝关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期帕j 论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安f 乜子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文:学校可以公稚论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在解密后遵守此规定)本人签名:导师签名:同期婴垒! :至同期釜! ! 生! ! :生第一章绪论!一一第一章绪论1 t 生物特征识别的历史与现状根据生理认知学理论,人们在解决温饱问题之外最重视的莫过于人的安全问题。从原始社会躲避猛兽,到封建社会保护私有财产,再到现代社会个人隐私的捍卫。从古到今,由于社会和人类自身的安全需要,产生了各种安全需求,特别是随着信息时代的发展,人类活动流动性增强,人类对安全认证提出了更迫切要求。如何有效保护私有数据不被非法获得。是近年来安全领域研究的热点之一。在现代社会中,随着计算机及网络技术的高速发展,信息安全显示出前所未有的重要性。身份鉴定是保证系统安全的必要前提,在金融、国家安全、司法、电子商务、电子政务等应用领域,都需要准确的身份鉴定。如某人是否有权进入安全区域( 安全系统) ,是否有权进行特定交易,是否是本国居民,为了安全在公司计算机网络和因特网上单独设置口令或密钥进行保护等。当前,用于个人身份鉴别主要依靠i d 卡( 如身份证、工作证、智能卡、计算机标志卡和储蓄卡等) 和密码等手段,然而这些手段存在携带不便、容易遗失,或者由于使用过多或不当而损坏、不可读和密码易被破解等诸多问题。因此,目因此基于生物特征识别技术的个人身份识别系统具有更好的安全性、可靠性和有效性,正越来越受到人们的重视,并开始进入我们社会生活的各个领域,生物测定学( b i o m e t r i c s ) 是通过利用个体特有的生理和行为特征来达到身份识别和个体验证的一门科学,生物测定学在司法、访问控制、考勤、银行和通信安全等方面有着非常广阔的应用前景。基于人体生物信息的安全认证,如指纹识别、唇纹识别、掌纹识别、姿态识别、人脸识别和虹膜识别等是研究的重点,如指纹识别技术已经成功应用于门禁安全系统,美国自9 1 1 以后,也把人像识别技术应用到机场等重要场所的安全检验。由于生物识别技术提供了一种基于唯一的、高可靠性和稳定性的人体生物特征身份鉴别途径,因此,基于生物特征识别技术地身份鉴别系统的研究就成为一项非常现实和急迫性地任务。人脸识别由于其良好的被动性检验,更容易为人们所接受,越来越受到人们的重视,已经有部分技术得到实际的应用,如美国国会安全检查部分就采用了面相识别技术。6智能人脸识别技术研究表一:各种生物识别技术的比较生理特征唯一性永久性可接受性模扳大小f n r ( )f m r ( 量)面郫识别5 0 01 0l断 ;i :温应n n n 指纹3 0 0 一8 0o li o 一6乖儿何尺寸1 0 - 3 00 808视网膜模式4 0 - 舳0 0 0 51 0 e9l 【睡2 赫一1 0n a1 0 e 1 0拧为特缸语音识别i o o 1 0 0 0li蕺键动作n amm瑚拳签名4 0 一1 0 0 0l0 5+ + 高+ 中等- 低f l 、r r 锚误不匹配f m r 错误匹配串n a 不适用表1 是各种生物识别技术的综合比较,可以看出人脸识别方式是一种更友好、更隐蔽更容易为人们所接受的验证方式,具有直接、友善、方便的特点被广泛应用于1 、自动门禁安全系统2 、身份鉴别和认证3 、银行、海关的智能监控和鉴别4 、失踪人口调查和罪犯追踪5 、智能人机接口6 、其他重要场所的安全检测1 2 生物特征识别的关键技术由于生物特征识别技术使用人体唯一的、可靠的和稳定的生物特征来鉴别人的身份,目前人体生物特征识别技术仍然处于发展阶段,一个有效的生物识别系统,首先要解决好以下几个关键技术问题:( 1 ) 生物特征信息的获取。生物特征信息的获取可以有多种方法,但目前其获取质量仍然不能达到令人满意地程度,如虹膜信息的提取,目前还没有一个完第一章绪论整的、实用的提取方法。相对虹膜信息的提取,人脸信息的获取相对容易实现。目前许多厂商已经开发出了各种生物信息采集器,如p r e c i s eb i o m e t r i c s a b 公司生产的指纹智能卡读卡机,运用低功耗的红外激光和照相机可以检测视网膜特征。而人脸的图像采集可以采用高清晰度c c d 解决。( 2 ) 生物特征数据库建立和管理。如何有效的将生物信息组织在数据库中,实现快速检索和匹配是一个值得深入研究的课题。人的生物特征信息数据量大,数据维度高,尤其是在大规模应用中,如何建立和管理生物信息数据库目前还存在很多问题。随着多媒体数据库技术的发展,人脸信息的存储、管理目前相对成熟,但人脸的匹配由于数据量特别巨大,匹配算法复杂。不能达到实时检测的目的,因此,快速实时匹配算法一直是研究的重点和难点。( 3 ) 生物特征的提取和匹配。生物特征提取就是选择一个能最好地表示个体的最优特征集,例如关键特征点、纹理特征、形状特征、线条特征等,特征提取不仅是进行数据压缩,还要剔除对识别无关的冗余信息,以便于快速识别和匹配,提高系统实时性。1 3 人脸识别的主要特点人脸识别技术的研究始于六十年代末七十年代初。其研究领域涉及图像处理、计算机视觉、模式识别、计算智能等领域,是伴随着现代计算机技术、数据库技术发展起来的综合交叉学科。根据人脸识别应用的领域以及识别过程和技术的差异可以把人脸识别细分为两种l 、人脸鉴别( f a c er e c o g n i t i o n ) 。其过程是从已处理过的人脸数据库中,根据一定的匹配法则,查找与待测人脸最相似的人脸图像,再依据存储的相关信息,进一步确认待测人脸的真实身份。其识别过程设计人脸数据库的构造、快速查询、模式匹配技术。特别是当人脸数据库达到一定的数蜃级时,其识别难度增加,正确识别率明显下降。发展新型的增量式的训练和识别新算法,可望有效解决此问题。目前大多数人脸识别技术都属于此类。2 、人脸确认( f a c e a u t h e n t i c a t i o n ) 。其过程是用待识别图像与数据库内图像进行比较,确认待测图像是否在数据库内或待测图像是否与真人身份相符,其测量结果只能有是、否两种结果,相对于人脸鉴别而言,人脸确认其匹配过程相对简单,匹配次数也明显减少,对数据库规模限制、匹配算法的速度要求相对要宽松。但如何选定置信阈值,确保“拒绝非法,接纳合法”,是目前实际应用的一个难题。目前大多数图像门禁安全系统属于此类。智能人脸识别技术研究人脸识别有其先天的易于为人们接受的优点。但由于人脸的独特的生理构造,给识别带来一定的难度。人脸识别的主要难点在于:1 、姿势( p o s e ) :在人脸像摄取中由于照相器材或人的主观因素或实际条件艰制,很容易造成人的姿势的变化,进而影响了人脸的姿势差异。2 、脸部结构成分缺损:鉴于各种实际需要,人脸可能佩戴眼镜、蓄留胡须、化妆等,而人脸的这些外部结构成分是不固定的、随意的,对人脸识别造成很大的困难。比如识别留有胡须的拉登与剃光胡须的拉登是有困难的。3 、面部表情:人体喜、怒、哀、乐、鬼脸状等面部表情的变化会造成人脸特蔷;e 的显著改交,对识别算法提出了更高的要求。4 、特征遮掩:人脸全部、部分遮掩将会造成错误识别。5 、人脸图像的畸变:由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像的质量,增大了识别难度。1 4 人脸识别的测试平台人脸识别是近年来研究的热点,不少文献提出了各种新的识别算法,为测试和比较各种识别技术的优缺点及其识别率高低,世界各研究机构相续建立了通用的人脸测试和测评数据库。l 、f e r e t 数据库l lj 是由美国国防部建立的,包含了5 0 0 0 多幅不同视角的正日日人脸黑白像,每幅图像都具有单纯的背景色。常用于测试不同人脸识别方法的1 0 缺点,非常适合建立和测试人脸识别算法,可惜的是此数据库只能在美国本土范围内使用。部分人脸样本见附录a 。2 、a t & t 数据库1 2 】是由英国剑桥大学人工智能实验室建立的,包含不同的正面j 人脸图像,图像取自不同的时间、不同的光照条件、不同的人脸表情,面部细r 均有一定的差异。a t & t 数据库共有4 0 人x1 6 幅图像,由于人脸像基本上均是司:面像,没有较显著的面部特征遮掩,因此一般的识别算法均可获得较高的识别嗣i 。部分人脸样本见附录a 。3 、h a r v a r d 人脸库p j ,有短发、光照条件变化较为明显的正面人脸像组成,常舅j 来测试不同的光照条件对识别算法的影响。4 、y a l e 人脸库1 9 】,包含1 6 个人的,每人1 0 幅人脸像,其图像差异在于变化舒1 人脸表情,是否带有眼镜( 透明镜) 、不同的光照条件。5 、m 2 v t s 人脸库i lo j ,是从欧洲a c t s 项目发展起来的多模态数据库,用以测试访问控制试验的,它包含3 7 个人的一系列图像,每幅图像拍摄的时间间隔为一周,其视角角度从右侧面( 负9 0 度) 到左侧面( 正9 0 度) ,是识别难度较高的第一章绪论!数据库,常用于测试复杂的算法。6 、u m i s t 人脸库i “1 包含有2 0 人共5 6 4 幅不同姿态图像,其姿态变化从右侧面到正面,u m i s t 库较m 2 v t s 库识别相对较为简单。7 、p u r d u ea r 人脸库踟,包含有1 2 6 人( 7 0 男,5 6 女) 共3 2 7 6 幅彩色正面图像此数据库主要是为在人脸表情、光照环境变化条件下,测试人脸识别试验。所有的图像有不同表情( 自然、微笑、愤怒、冷酷) 、光照( 左光源、右光源和双测光源) 和面部遮掩( 戴未戴太阳镜) ,并且图像拍摄时间间隔为两周,此人脸库主要应用于图像和视频中人脸识别,还常用来进行表情区分试验。表1 2 为常用的几种人脸数据库及简单描述。表1 2 常_ i :i j 的人脸数据库及描述数据库位置简单描述f e r th t t p :w w w n i s t g o v h u m a n i d f e r e r大型数据库,含有男女表情各异的图像a t th t t p :w w w u k r e s e a r c h a r t ,c o m4 0 入1 0 幅正面像,人脸面部无显著遮掩。表情略有变化h a l v a r df l p :l f l t p h r l h a r v a r d e d u p u b f a c e s 光照、表情变化的正面人脸像y a l eh t l p :c v c y a l e e d u光照变化较为显著,且有面部部分遮掩m 2 v t sh t t p :u p o s e i d o n c s d a u l h g r m 2 v t s i包含不同人脸序列的多模态人脸n d e x p a t m l库识别难度较大u m l s th t t p :i a m f l p u n i b e c h 2 0 人共5 6 4 幅图像,姿态变化范围从侧面到正面p u r d u ea rh t t p :r v | 1 e c n p u r d u e e d u 一a l e i x a l e i不同表情、光照和遮掩的3 2 7 6 幄x - f a c e - p b h t m l彩色人脸像通常情况下。由于某些人脸识别算法需要训练样本,因此在选择测试库平台是,应尽量采用国际通用的大型测试人脸数据库,其训练用样本和测试用样本要合理划分,在测试系统正确识别率时,应在测试样本集中进行,这样便于公正、公平的比较各种算法的识别率。特别的,在能获得的样本图像数量有限时,可对训练样本采取加噪方法、小波分解方法等人工产生一定量的训练样本,可有效扩充现有人脸图像,以解决调练样本不足问题。智能人脸识别技术研究1 5 人脸识别发展现状早期的人脸识别方法多是基于人脸部件的【3 1 ,其主要思想是把整个人脸图像根据认知学理论划分为发际、眼部、脸颊部、嘴部、下巴等大致区域,然后利用各部件的参数和部件关键点的相对距离进行识别。这类识别方法思想较为简单,算法构造亦不复杂。但人体解剖学表明人脸的结构不仅包括骨骼框架。更重要的是由几十万条肌肉运动形成的丰富的面部表情,一定程度上,人脸之间最重要的区别在于表情的变化。这种简单的比较方法,很容易丢失人脸的灰度、纹理、表情变化信息,对光照、视角变化非常敏感。9 0 年代以来,人们意识到单纯依靠人脸某些器官的相对位置并不能有效区分a 脸细微的差异,于是,更多的学者将研究重点放在了基于整体方法的研究,如特征脸方法( e i g e n f a e e ) 【6 j ,弹性模板匹配( e l a s t i cm a t c h i n g ) 方法【7 l s v d 分解方法1 8 l ,人脸等密度分析匹配方法p j 、隐形马尔可夫模型( h i d d e nm a r k e l m o d e l ) 以及壤近发展的神经网络为代表的智能识别方法。这些新方法更多地考虑了模式的整体属性,把人脸当作系统看待,特别是智能方法地引入,将对人脸的认识由感官试识上升到数学理性的分析,可以预见,智能方法和组合模式人脸识别将是模式议别领域研究的新的方向。1 6 本文的主要工作及章节安排本文分析了人脸识别的各种主流算法,并就其优缺点和适用范围作了总结。在模式识别中,特别就特征提取和分类器设计作了详细的分析,并提出了新的改遴算法。在参考各种文献和分析经典算法的基础上,我们提出了两个新的改进算法。一个是根据人脸不变性特征。提出了一种改进的基于z e m i k 不变矩识别方法,该方法计算简单,识别率较高,但随着人脸规模增大,由于其识别特征的单一性葜识别率下降很快,因此,该方法适用于小规模数据库人脸识别方面。另一种,疆们应用自组织特征映射和次分量方法分别提取人脸的整体和局部细节特征,组合成新的复合特征矢量,然后利用克隆算法的自动寻优能力,自动进行特征的优化选择,最后我们组合多个支持矢量机组成多类分类器。仿真结果表明,我们的智能识别方法不仅可以识别正面人脸像,还可以对侧面人脸图像进行识别,其识别率高,应用范围广,具有自动学习、自动调节的能力,特别适应于大型数据库中人脸识别。第一章绪论本论文章节安排如下:第一章绪论部分,重点分析了人脸识别的历史发展及现状,特别就人脸识别中存在的难点进行了分析,指出了目前主要识别算法存在的不足。还就人脸识别算法建立和测试的平台数据库进行总结分析,指出了测试中应注意的问题。第二章论述了人脸识别的一般过程,分析了人脸特征提取中各种常用判据和常用的p c a 和i c a 以及k l 提取方法,目的是分析各种特征提取算法存在的闯题,及比较各种算法对识别率的影响,最后我们论述了分类器设计的技术,重点分析了目前公认的性能最好的支持向量机分类器。第三章列举了目前人脸识别的主要算法。特别是对特征脸方法、f i s h e r 方法、p c a 方法进行理论分析和仿真试验对比。找出其不足之处,为避免各种算法的缺点合理组合各种算法打下良好的基础。第四章分析了改进的z e r n i k 矩人脸识另【j 算法,并就其矩不变性进行了证明,仿真结果表明,该方法适用于小规模识别问题。第五章详细论述了我们提出的基于特征融合的多视角人脸识别方法,并进行了各种测试试验结果表明,我们算法的识别率和识别效率是令人满意的。第六章总结和致谢参考文献: 1 f e r e tp j p h i l l i p s ,h m o o n ,s s r i z v i ,a n dp j r a u s s t h ef e r e te v a l u t i o nm e t h o d o l o g y f o rf a c er e c o g n i t i o na l g o r i t h i n y i e e et r a n s a c t i o n so np a t t e r na n a l y s i sa n dm a c h i n ei n t e l l i g e n c e 。2 2 ( t o ) :1 0 9 0 - 1 0 3 4 。2 0 0 0 2 a t & td a t a b a s ea c h i e v a l b ef o r mh t t p :w w w , ,u k ,r ,e s e a r c h , a t 。t c ,o m f a c e d a t a b a s e , h t m l 3 p b e l h u m e u r,j h e s p a n h a 。a n dd k r i e g m a n e i g e n f a c es v sf i s h e r f a c e s :r e c o g n i t i o nu s i n gc l a s ss p e c i l i d1 i n e a rp r o j e c t i o n i e e et r a n so np a t t e r na m a l u s i sa n dm a c h i n ei n t e l l i g e n c e ,1 9 ( 7 ) :7 1 1 - 7 2 0 ,1 9 9 7 4 a m a r t i m e za n dr b e n a v e n t e t h ea rd a t a b a s e t e c h i n c a lr e p o r tc v c2 4 p u r d u eu n i v e r s i t y ,1 9 9 8 5 0 n a k a m u r a ,s w a t h u r ,t m i n a m i i d e n t i f i c t i o no fh u m a n f a c e sb a s e do n2智能人脸识别技术研究i s o d e n s i t ym a p s j p a t t e r nr e c o g n i t i o n ,1 9 9 1 ,2 4 ( 3 ) :2 6 3 2 7 2 6 3 m t u r k ,a p e n t l a n d f a c er e c o g n i t i o nu s i n ge i g e n f a c e s c p r o co fi e e ec o n fo nc v p r ,1 9 9 1 :5 8 6 5 9 1 7 3 m l a d e s ,j v o r b u g g e n ,jb u h m a n ne ta 1 d i s t o r t i o ni n v a r i a n to b j e e tr e c o g n i t i o ni nt h ed y n a m i c1 i n ka r c h i t e c t u r e j i e e et r a n so nc o m p u t e r s 1 9 9 3 :4 2 ( 3 ) :3 0 0 3 l i 8 z i q u a nh o n g a l g e b r a i cf e a t u r ee x t r a c t i o no fi m a g ef o rr e c o g n i t i o n j p a t t e r nr e c o g n i t i o n ,1 9 9 1 :2 4 ( 3 ) :2 1 卜2 1 9 【9 y a l ea v a i a l b ef r o mh t t p :i c v c y a l e e d u 1 0 a v a i l a b l ef r o mh t t p :p o s e i d o n c s d a u t h g r m 2 v t s i n d e x h t m l 1i a v a il a b l ef r o mh t t p :i a m f t p u n i b e c h 一兰三兰堕望型塑堡塑垦薹壁垫查:! ! :。_-_-_-_-_-_-_-_-_一第二章人脸识别的框架及关键技术2 1 人脸识别的通用框架人脸识别按其过程,大致可分为4 个部分,如图2 1 所示输出结果圈2 1 模式识别的一般过程l 、图像获取。图像获取主要包括图像库中人脸像和待测人脸图像的获取,其获取方法可采用照相机、摄像机等,也可采用其他技术手段,如采用人脸检测技术,从复杂图像或视频流中分离出人脸图像。一般讲,人脸图像在图片大小、分辨率,根据不同的应用要求也有一定的质量要求。为便于识别,减少图像识别复杂度,在采集时,对图片明暗度、灰度等进行统一规格,防止出现人为的或意外的原因造成图像畸变。2 、图像( 预) 后处理。在图像获取时,由于条件的限制或人为等意外的因素,获取的图像尺寸、光照条件和分辨率等可能达不到要求,对下一步的特征提取和最终分类造成不良影响,因此有必要对图像进行技术处理,如尺度校正、灰度校正,以及边缘增强、图像二值化等。通常,常用的图像处理技术都可运用于此过程。3 、图像特征提取及优化选取。对处理过的图像,一般要进行提取图像的特征,其目的有二:一是减少图像的计算和存储,一副9 2 9 2 象素的人脸灰度图像,直接存储就占用8 4 6 4 个存储空间,而经过特征提取和优化选择后,一般讲,存储量仅为直接存储的凡十分之一左右,这在大规模识别问题中就十分重要:二是人脸图像大部分象素对区分人脸并没有太大贡献,经过特征提取和优化选择后讲剔除冗余信息对分类的影响,提高分类的速度和识别率,因此特征提取一定程度上可提高正确识别率。4 、分类器设计及识别:对提取到的图像特征集,运用某种度量标准,对图像差异进行度量最终取得分类结果。常用的分类方法有h a u s d o r f f离方法1 1 - 州以及改进的h a u s d o r f f e 巨离方法9 1 、支持向量机方法、学习矢量量化( l v q ) 法 4 1 等。特征提取过程和图像差异度量方法常常结合使用,一般讲特征提取的依据主要依据是使同类图像差异最小,异类图像差异量最大化原则。智能人脸识别技术研究近年来,随着统计学习理论的发展,在此基础上新发展的智能分类方法,同时具有特征提取、分类的双重功能,这类方法常常需要通过一定的训练,运用算法自调节功能,自动调节系统的参数,使系统自动抽取人脸的最优表达特征,从而较好地适应了人脸的灰度畸变、光照、姿势等变化,达到自动人脸识别的目的。若将图像看作灰度矩阵,常利用奇异值分解、k l 变换方法,也可直接将灰度值矩阵按行或列转化为特征向量,然后按照数学的方法处理人脸图像。另外,也有学者引入物理学概念,将人脸图像看作是x o y 平面上2 d 物体,直接提取其不变性,如旋转矩不变性特征、纹理不变性特征等,然后利用这些不变性进行直接识别。具体的图像提取技术及方法见下一节。2 2 可分性判据特征提取的目的是找出一组对分类最有效的特征集,因此需要一个定量的准则来衡量特征对分类的有效性,用以指导我们进行特征提取工作。理论上讲,使分类错误率最小的特征集就是最优特征集,在实际应用中,由于计算的复杂度而难以实行,不少学者根据最小错误率上限理论,提出了简单而实用的判据准则。2 2 1 用于可分性判据的类内类间距离在特征空间中,同类的样本距离越近,不同类的样本距离越远,这样的一组特征集显然最有利于分类。令x n x j “分别为q 类及q 类中的d 维特征向量f ( x x j l 为这两个向量闻的距离,则各类特征向量之间的平均距离为cnr,山( 工) = 士月乃击f ( ,门) ( 2 - - 1 )t - ij - ik = li = 1其中c 为类别数n i 为( 0 i 类中样本数一,为q 类中样本数p ,p j 是对应类别的先验概率萑欧氏距离表示下,式( 2 一1 ) 可表示如下:f ( x l “,x j l = ( x :一巧勺7 ( x f “一)( 2 2 )若用川表示第i 类样本集的均值向量第二章人脸识别的框架及关键技术m ,= 寺x ? 用m 表示所有各类的样本集总平均向量卅= p 卅( 2 3 )( 2 4 )将式( 2 2 ) 、式( 2 3 ) 、式( 2 4 ) 代入式( 2 1 ) 中,可得cm。( x ) = 芝:f 【 ( x ? 一m ,) 7 ( x ? 1 一m ) + ( 脚,卅) 7 ( 聊一m ) 】( 2 5 )f li l若用矩阵表示则类间散度矩阵最= e p ( “一w ) ( 坼一“) 7( 2 6 ),l l类内散度矩阵s 。= p , e ( x 一坼) ( 工一峨) 7 】j - l其中各类均值m = e ( 工)( 2 7 )( 2 8 )总体均值u = e ( x )( 2 - - 9 )因此。若要求最佳特征集,则只须求出使式m a x ( 2 一l o )成立的变换矩阵即可实际运用中可利用迭代算法求出。此距离准则直接从各类样本间距离算出,优点是计算方便,直观,概念清楚,不足之处是没有考虑各样本空间分布情况,无法引入先验知识。2 2 2 基于概率分布的可分性判据样本空间概率分布情况直观上决定了样本集的可分性,分布密度的交叠程度可用分布密度函数之间的距离,。来度量。理论上任何函数,( ) = i g p ( x7 q ) ,p c x l c 0 2 ) ,p l ,p 2 d x 满足下述条件( 1 ) j 为非负,即j 。0 :( 2 ) 当两类完全不交迭时j p 最大,即若对所有工有0 鸭) o 列r p ( x a , , ) = 0 ;( 3 ) 当两类分布密度相同时,j ,应为0 ,即若p ( x q ) = p ( x a h ) ,则j 。:0 ;都可用来作为类分离性的概率距离度量。常用的概率距离度量有以下几种:6智能人脸识别技术研究( 1 ) h a t t a c h a r y y a 距离和c h e m o f f 界限其定义公式是j 口= 一l n i p ( x c o i ) p ( x c 0 2 ) 】i d x ( 2 - - 1 1 )它与错误概率的上届有直接关系。c h e r n o f f 定义j 。= 一i njp ( x d o i ) p 。( x c 0 2 ) d x ( 2 - - 1 2 )其中s o ,1 中的一个参数。可以看出,当s = o 5 时,j 8 = j c( 2 ) 散度两类密度函数的似然比或负对数似然比对分类来说是个重要度量,设两类q ,脚,其对数似然比为l = l n 第等( 2 1 3 )可定义散度j d = ,p ( 工q ) 一p ( x c o j ) i n 等等d x( 2 1 4 )敝度,。从密度函数的似然比中衡量样本的分布情况。其优点是计算量少,算法设计简单。2 2 3 正态分布时可分性判据正念分布时最常见的样本分布情况在已知样本符合正态分布的前提下,可简化可分性判据,减少特征提取工作的计算量。对一维正态分布情况山=与弘(2-15)当两类都符合正态分布时小如r1 川单一 一h l “黼( 2 - - 1 6 )公式( 2 1 5 ) 、式( 2 - - 1 6 ) 应用的前提条件是,样本必须符合正态分布,否则可锈得不到最优特征集。第二章人脸识别的框架及关键技术2 2 4 基于熵函数的可分析判据在信息论中,熵常用来表示信息的含量,用作不确定性的度量,从特征提取的角度看,具有最小不确定性的那些特征进行分类是最优的。熵可表示如下:h = j 。 p ( q x ) ,p ( w 2 x ) p ( c o , i x ) ( 2 1 7 )根据熵定义的不同,可得到不同的熵函数,常用的有rs h a n n o n 熵一p ( a g , x ) l 0 9 2p ( e o i x )( 2 1 8 ),= lf平方熵2 1 1 - z p 2 ( 国,x ) 】( 2 1 9 )- l l熵的期望值j ( ) = e 彤【p ( q i x ) ,p ( :i x ) p ( o c x ) 】 可表征类别的分离程度,均是以最小错误概率上限理论为依据,从距离、概率密度分布和信息熵的度量角度提出的判据。实际应用中,根据不同的应用特点人们提出了不少有效的特征提取的方法。42 3 特征提取的常用方法特征提取的过程就是依据各类可分性判据,运用迭代或智能进化的方法,找出一组变换矩阵,将样本从原始分布空间有效映射到新的特征空间的过程,因此特征提取实际上是一个寻求最佳映射变换的过程同时也是一个数据压缩的过程。2 3 1 按欧氏距离度量的特征提取方法假设f ( x ”x j ) 表示第q 的第k 个样本与第类的第,个样本之间的距离,这样的特征集x ,使c 个各样本之间的平均距离j ( x ) 为最大,即j ( x ) = m a x j ( x )( 2 2 0 )为最优的特征集。其一般特征提取过程如下:设y = 【y 1 ) 儿,】7 为d 各原始特征集,s 。,瓯为原始空间离散度矩阵,文= 7 ,= s 。渺为映射后离散度矩阵,w 为待求的变换矩阵w i r “。,变换后的可分性判据j ( w ) = t d ( w s 。) 。w 7 瓯】( 2 - - 2 1 )i 暑智能人脸识别技术研究对各分量求偏导,可唯一确定一组值。设矩阵s :1 s b 的本征值 ,如,砧且 如2 0 ,取前d 个本征值对应的本征向量作为w ,即= 【u i “,】,即可求出特征变换矩阵,则新的特征集为x = 7 y( 2 - - 2 2 )2 3 2k - l 变换方法k - l 变换方法的数学基础是k a r h u m a n l o e v e 展开式。一个非周期性随机过程可以用互不相关系数的正交函数丸( ,) 的级数展开,在离散情况下,取前n 个展开项,其截断均方误差和在所有其它正交坐标系情况下用d 个坐标展开时所引起的均方误差最小。也就是说,k - l 变换消除了原有向量的各分量之间的相关性,从两有可能去掉那些带有较少信息的坐标轴以提取大部分特征信息而有效降低空闾维数常被用于人脸的特征提取和数据压缩。其算法一般过程是:设人脸图像可表示为行1 维的向量工,设训练样本数为n ,以 0 t l 练样本的总体散御矩阵作为产生矩阵c = e x x 7 】= 古以w( 2 2 3 ) t i用一个h n 矩阵表示n 个人脸矢量z = 【i ,x 2 ,x 】( 2 2 4 )则式( 2 2 3 ) 可表示为c e 古剃7( 2 - - 2 5 )s :窆p ( ) ( m j - - m ) ( m 一m ) r ( 2 - 2 6 )l - o其中m 为训练样本集中第i 个人平均图像矢量,p 为总的训练样本数。根据s 求出一组正交的特征向量,:,其对应的特征值满足 五五五,贝唾变换后的样本集为z = 丑“,。j = lk - l 变换方法有其数学理论基础,并且有相应的快速算法,但其在人脸特征抽取和识别上却有着明显的缺点。( 1 ) 变换后的低维特征空间保留了原始人脸最大的信息量。对人脸本身有很第二章人脸识别的框架及关键技术好的表达,但这并不意味着这些特征量对人脸具有较强的辨别能力。训练样本的散布矩阵把所有图像都平等对待,忽略了类内和类间距离的差异,特征脸方法用于人脸识别存在理论上的缺陷1 2 “。( 2 ) 其训练样本散布矩阵并不能完全表达整个样本空间的分布状态,只是当样本数量足够大时,理论上训练样本分布才接近实际样本空间分布状态,是典型的大样本学习问题,其实际应用必然受到一定的限制。( 3 ) 不能够有效解决增量学习问题。当样本空间有较大变化或新增一定的样本时其散布矩阵变化也较明显,必须重新训练系统生成新的变换矩阵,这在实际应用中代价是十分离昂的。( 4 ) k l 变换方法对人脸图像质量要求较高。一般情况下,需要对图像进行归一化处理,以去除人的发际、颈部和背景的影响。必要时要进一步消除图像的灰度和尺度畸变,才能获得较为理想的识别结果。目前,在人脸定位技术还不足以达到理想的定位精度时,单纯依靠人工处理图像,在实际应用中是行不通的。2 3 3p c a 与m c 方法p e a ( p r i n c i p l ec o m p o n e n t sa n a l y s i s ,p c a ) 方法是寻求一个可递的线性变换t ,使得变换后的t x 的截断在均方意义下为最优。设r 。i r “。是输入矩阵x 的自相关矩阵则月。是个对称阵,令z 为d 维随机向量,且e ( 工) = 0 ,令为d 维单位向量,即,= 7 ) 士= 1 ,则随机变量口的方差盯2 可表示为“的函数妒( “) = 盯2 = u 7 k ( 2 2 7 )希望找到一个方向使的方差妒( ) 达到最大,令厶, ,。,且凡 九为r 。的前m 个特征值,则选择变换后的前m个分量,则变换后的特征集为m - !x = 口j 封j( 2 2 8 )j l o产生的截断误差为d ie = x x 1 ;d 阮( 2 - - 2 9 )j - m原始变量z 的d 个分量的总方差为d - id i司= 乃( 2 3 0 )j = oj - o2 0智能人脸识别技术研究 _ _ _ _ _ 一一而变换后的向量的前m 个分量的方差为一1一1y d ;:y 五( 2 3 1 )箭。箭。按照这一迭代选取原则,则变换后的特征空间是原始空间的一个最大正交投影集,其最大限度保留了原始空间的信息。其算法的一般过程是:( 1 ) 计算输入向量的相关矩阵月。的特征值和特征向量。并将特征向量单位化。( 2 ) 按其特征值从大n d , 次序重新排列。( 3 ) 将原向量投影到前m 个特征值对应的特征向量构成的子空间中。( 4 ) 按要求,取前m 个分量,即是其原始向量的主分量。欲求其原始向量的主分量,必须首先计算其原始输入矩阵的自相关矩阵,并求其特征值及特征向量,其计算代价十分巨大,下面介绍一种用单层神经网络提x p - i图2 2 用于p c a 提取的单层神经网络结构图取一组主分量的快速算法。神经网络是近年来发展起来的一种新的智能计算方法,用它来提取主分量思潞清晰,计算相对简单,是一种比较成熟的特征提取技术。其网络结构如图2 2所示,网络各单元是线性的,有p 各输入,m 个输出,且t f n常用的核函数如下几种:多项式内积函数k ( x ,y ) = ( x y + 1 ) p( 2 4 3 )此时得到的是q 阶多项式分类器。径向基核函数k ( x ,y ) = e x p ( 一寺忆一y i l 2 )( 2 4 4 )k ( x ,y ) = e x p ( 乏了i i x y i i )此时得到的是径向基分类器,式( 2 4 4 ) 是最常用的两种径向基核函数,也可设置其它参数得到不同的径向基核函数。匿) s i g m o i d 核函数内积x ( x ,x j = t a n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年会计继续教育试题参考答案
- 2025年四川事业单位电子商务类招聘考试专业能力测试试卷及解析
- 摄影用光基础知识培训课件
- 消毒技术测试试题及答案
- 2025商业代理合同范本
- 2025年农业用地使用权流转协议
- 公司防水知识培训心得课件
- 2025新商场店铺租赁合同范本模板
- 搅拌工艺基础知识培训课件
- 插画排线基础知识培训课件
- 呼吸功能锻炼技术操作考核评分标准
- GB 5577-1985合成橡胶牌号规定
- FZ/T 01034-2008纺织品机织物拉伸弹性试验方法
- 《百团大战》历史课件
- 高血压的健康宣教课件
- 水溶肥分析课件
- 人保财险新人培训4商业非车险与财产保险简介课件讲义
- 马克思主义基本原理课件- (全套完整课件)全版
- 骨科三基考试复习题常见考题及答案(骨科)
- 【优秀】脑膜瘤护理查房课件
- GB∕T 3480.3-2021 直齿轮和斜齿轮承载能力计算 第3部分:轮齿弯曲强度计算
评论
0/150
提交评论