(计算数学专业论文)基于视频内容的身份认证.pdf_第1页
(计算数学专业论文)基于视频内容的身份认证.pdf_第2页
(计算数学专业论文)基于视频内容的身份认证.pdf_第3页
(计算数学专业论文)基于视频内容的身份认证.pdf_第4页
(计算数学专业论文)基于视频内容的身份认证.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算数学专业论文)基于视频内容的身份认证.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文基于视频内容的身份认证 摘要 基于诸如语音、虹膜,d n a 等等生物特征信息识别技术的身份认证已逐步走 进实用阶段,然而当前的技术应用均是建立于较高的硬件配置信息处理工具。对此, 为更有效地推动应用技术的普及,本文以一般家用计算机为处理工具,从信息数据 处理各种方法着手全面探讨生物特征信息识别的门禁系统。 鉴于监控系统等视频信息普遍存在,且人脸特征数据具有很强的自身稳定性和 个体差异性,比指纹数据的提取更易于被接受、友好方便;同时入脸图象识别技术 己具备了较好的研究基础,因此我们的研究也将针对于视频内容中的人脸图像进 行。 人脸识别技术主要包括人脸检测和定位、特征提取以及训练识别。针对门禁系 统的实时性和准确性的要求,本文的研究将通过分析比较各处理环节的不同方法以 确定适用方法以及方法改进和新的方法应用等方面展开 对于视频序列进行人脸检测和定位,首先利用差分方法分割运动个体:考虑到 视频图像信息的质量缺陷,在分割出运动目标后先进行光照补偿和色度补偿的预处 理;然后根据肤色的特性,建立高斯概率模型,并利用投影法和模板匹配方法进行 人脸的精确定位。 其次,对于人脸特征的提取分析,比较了特征提取的p c a 方法、基于矩阵的 主分量分析方法( i - p c a ) 、k p c a 方法和f i s h e r 线性鉴别方法,通过数值实验结果 比较分析,给出p c a i - p c a + k p c a + f i s h e r 的特征提取方法,能满足门禁系统的实 时性和准确性结合的要求 识别过程的数据的变化和更新是重要部分,我们采用b p 神经网络讽练分类器 以进一步提高识别率;然而b p 算法迭代次数多、训练过程中费时的问题是众所周 知的。事实上,学习过程的本质是特殊多元优化问题,b p 算法即是以负梯度为寻 查方向的线性收敛速度算法。鉴此特点,我们将能加速线性收敛序列收敛e p s i l o n 算法( 向量) 分别应用于权值调整过程和最优学习率的确定以提高学习效率,从而 有效缩短训练时间,显著数值实验结果验证了其可行性和高效性。 最后初步实现了一个实时的基于视频内容的身份认证系统。 关键词:人脸识别,p c a ,k p c a ,f d a ,b p 算法,外推法,加速收敛, 实时系统 硕士论文基于税频内容的身份认证 a b s t r a c t t h e i d e n t i t yd i s a - i m h n t et e c h n i q u e ,w h i c h i sb a s e do nt h er i v i n gc r e a t u r e c h a r a c t e r i s t i ci n f o r m a t i o ns u c ha st h es p e e c h , i r i sa n dt h ed n av i e ,h a sa l r e a d yw a l k e d i n map r a t i c ms t a g e b u t , c u r r e n tt e c h n i q u ea p p l i c a t i o na l li sb u i l t0 1 3h i g h e rh a r d w a r e 协 d e a lw i t hi n f o r m a t i o n 删sp a p e rm a i n l yd or e s e a r c ho nt h eg a t es y s t e mf r o mv a r i o u s m e t h o do ft h ei n f o r m a t i o nd a t ap r o c e s s i n g , w h i c hi su s e dw i t hh o u s e h o l d - u s ec o m p u t e r s a sah a n d l et 0 0 1 t h ev i d e oi n f o r m a t i o ni sw i d e s p r e a di nt h es u p e r v i s i o ns y s t e m ,a n df a c ec h a 珀c t e r i s t i c sa r ci n t r i n s i ca n ds t a b l et op e o p l ea n ds t r o n g l yd i f f e r e n tf r o mo n et ot h eo t h e r s ,t h e y a a l s of r i e n d l ya n de c c e p e t a b l e t h u st h e yc a nb eu s e d 嬲f e a t u r e sf o ri d e n t i t y d i s c r i m i n a t e t h u so u rr e s t e a c hw i l lb eb a s e do i lt h ef a c i a lp i c t u r e sw i t h i nt h ev i d e o f 弛q u e n c yc o n t e n t s f a c er e c o g n i t i o nt e c h n i q u ec o n t a i n sf a c ed e t e c t i o n 、c h a r a c t e r i s t i ce x t r a c t i o n 、t r a i n i n g a n dr e c o g n i t i o n t os a t i s f yr e a l - t i m ea n da c c u r a c ya si ti su s e di ng a t es y s t e m , w ea n a l y s i s a n dc o m p a r et h em e t h o dt h a th a se x i t e di ne a c hr e s e a r c hp a r t , t h e np u tf o r w a r ds o m ei m p r - o v c r n e n t s w ea l s op r o p o s et w on e wm e t h o d si nt h et r a i n i n ga n dr e c o g n i z i n gp a n i nt h ep a r to f h u m a nf a c i a ld e t e c t i o na n d 夙e d p o s i t i o n , w ep r e s e n t sa na l g o r i t h m t o f a c ed e t e c t i o nb a s e do bc o m p l e xa n dd y n a m i cv e d i oi n f o r m a t i o n t h em e t h o di n v o l v e s l o c a t i n gh u m a nf a c el i k er e g i n n sb ys u b s t r a c d n gt w oa d j a c e n tp i c t u r e so f a s r c i c sa n du s i n g s k i nc o l o rm o d e lt os e g e m e n tf a c e c o l o ri n f o r m a t i o ni su s e dt od e l 呛c tt h es k i n 勰a f i r s t , a n dt h et e m p l a t ei su s e dt om a t c ht h ef a c ea s e c o n d , i nt h ep a r to fh u m a nf e a t u r ee x t r a c t i o n , w ep r e s e n t st h et h e o r yo fp c a a l g o r i t h m , i - p c aa l g o r i t h m , k p c aa l g o r i t h m , f d aa l g o r i t h ma n dt h e i ra p p l i c a t i o nt o f a c er e c o g n i t i o n t h e n , a st h en e e do f t i m ea n da c c u r a c yi ng a t es y s t e m , w ep r o p o s ea n a l g o r i t h ma sp c a i - p c a + k p c a + f d a , a n dt h ee x p e r i m - e n tp r o v e di t sp o s s i b i l i t y d u r i n gt h ep e r i o do f i d e n t i t y , t h ev a r i e t ya n d1 y y n e w a lo f t h ed a t aa r ci m p o r t a n t t h e b a c kp r o p a g a t i o n ( b p ) a l g o f i t h mw a si n t r o d u c e dt ot r a i nt h en e l i r a ln e t w o r kf o rf a c er e c o g - n i t i o ma si sk n o w n , b pa l g o r i t h mu s u a l l yn e e d st o om u c hi t c r m i v et i m e sa n dw a s t e st i m e d u r i n gt h et r a i n i n g t h i sa l g o r i t h mc o m b i n e st h eo p t i m i z a t i o no f t h ec h a r a c t e r i s t i cv e c t o r a n dt h ea d a p t a b i l i t yo ft h en e u r a ln e t w o r kt oi m p r o v et h er e c o g n i t i o nr a t ea n dt h e r o b u s t n e s so ft h ea l g o r i t h mt on o i s e s ,f o rs e q u e n c ec o m i n gf r o mt h es t e e p - d e s c e n t m e t h o d , w eu s ee x t r a p o l a t i o nm e t h o df o rt h es e q u e n c et oa c c e l e r a t ec o n v e r g e n c ea n d n 硕士论文 基于视频内容的身份认证 s a v et h ec o m p u t a t i o n a lt i m e a n dw el 塔et h em e t h o dt or e d u c et h et r a i n i n gt i m ea n d i m p r o v ee f f i c i e n t c y w ea l s og i v es o m en u m e r i c a le x p e r i m e n t st op r o v et h ep o s s i b i l i t y a n d 觚c l 删o f t h ea l g o r i t h mw ei m p r o v e d i nt h ee n d , w ei m p l e m e n tar e a l - t i m ef a c er e c o g n i t i o ns y s t e mu s i n gt h em e t h o dw c p r e s e n t e db e f o r e k c y w o r d s :f a c er e c o g n i t i o n ,p r i n c i p a lc o m p o n e n ta n a l y s i s ,k e r n e lp r i n c i p a l - c o m p o n e n t a n a l y s i s ,f i s h e r d i s c r i m i n a n t a n a l y s i s ,b p a l g o r i t h m , e x w a p o l a f i o n ,a c c e l e r a t e dc o n v e r g e n c e ,p e a l - t i m es y s t e m 1 1 1 硕士论文 基于视频内容的身份认证 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:聋丝“年6 月刁日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:燕叁纠年铜矽日 硕士论文基于视频内容的身份认证 1 1 引言 第一章绪论 随着近十年来模式识别、计算机视觉等学科的飞速发展,以及社会各方面对快速 高效的自动身份验证的要求日益迫切,生物识别技术在科研领域取得了极大的重视和 发展。生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份 验证的最理想依据。其中,人脸特征是典型的生物特征之一,同其他的生物特征识别 技术,如指纹识别、说话人语音识别、虹膜识别、d n a 识别、步态识别等相比,人 脸识别易于为用户接受、友好方便,因此成为国内外各研究机构研究的热点之一 对于人类而言,识别人脸是一件非常简单的事情,也是正常人在日常生活中每天 都要进行的一项工作。但要使计算机实现同样的功能,则非常的困难人脸识别技术 是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经 网络、心理学、生理学、数学等诸多学科的内容 人脸识别最早可以追溯到1 8 8 8 年,但人脸识别的研究真正开始成为热点是从上 世纪8 0 年代末开始的,到现在已经取得了一定的研究成果,其表现是全世界已经有 相当数量的科研院所提出了各自的人脸识别的算法,同时也出现了一批提供人脸识别 相关产品的公司近年来,因为恐怖分子的破坏活动,尤其是“9 1 l ”事件之后,美 国政府连续签署了三项国家安全法案,要求采用生物识别技术;2 0 0 3 年6 月,联合 国国际民用航空组织已公布了其生物应用规划,将在个人护照中加入生物特征,并在 入境时进行个人身份确认。因此包括人脸识别在内的生物特征识别再度成为人们关注 的热点,各国也纷纷增加了对该领域研发的投入我国预计也将在2 0 0 8 年奥运会时 将应用人脸识别技术在各个场所进行身份认证。 本文的构想是将人脸识别技术应用到门禁系统中进行身份认证,实现在家居中代 替门锁以及在一些公共场所入口处验证身份。现实生活中,门锁都是用钥匙控制,这 样做有很多的弊端,例如:门锁易被撬开,导致东西失窃;一旦忘记带钥匙,将会被 拒之门外等等。在有些场合采用指纹识别仪进行身份认证,虽然方便易行,但每次都 要提取指纹;况且,指纹识别仪的价格都很高,不是一般家庭或机构所能够承担的 基于以上现实因素,我们考虑将人脸识别技术应用于门禁系统,只需要在门上方装一 个摄像头,实时捕获人脸图像进行识别认证即可。一个普通的摄像头成本很低,一般 家庭或机构都能承受得起,而且通过对人走近过程所拍摄的图片进行识别处理,友好 方便、易于接受。 硕士论文基于视频内容的身份认证 1 2 视频内容身份认证研究的主要内容和困难 本文所研究的基于视频内容的身份认证实际就是利用人脸进行身份认证,因此主 要还是进行人脸识别。人脸识别是指采用机器对人脸图像进行分析,进而提取有效的 识别信息达到身份辨认的目的其研究范围就广义上来说大致可包括人脸检测( f a c e d e t e c t i o n ) 、人脸表征( r a c er e p r e s e n t a t i o n ) 和人脸识别c er e c o 鲥缸) 三部分。首先 是人脸的检铡与定位,即从各种不同的场景中检测出入脸的存在并确定其位置,并且 将人脸从背景中分割出来;然后采用某种表示方法表示检测出的人脸和数据库中的己 知人脸,一般是提取能够代表人脸图像信息的某种特征来表征人脸;最后一步才是将 待识别的人脸与数据库中的已知人脸进行比较,从而达到人脸识别的目的。这一过程 的核心是选择适当的人脸表征方式( 即特征提取) 和匹配策略( a p 设计分类器) 。现阶段, 人脸识别的各种算法的检验大都是在已经分离了背景的人脸数据库上完成的,从人脸 识别这一课题的特殊性来看,这是合理的。 虽然人类自身能毫不费力的识别出人脸,但人脸的自动识别却是一个难度极大的 课题,其困难主要有以下几个方面: ( 1 ) 人脸是由复杂的三维曲面构成的可变形体,很难用精确的数学模型描述; ( 2 ) 所有人的脸部结构均高度相似,从统计意义上来讲,属于典型的类内散布大于 类间散布的统计模式识别问题; ( 3 ) 人脸图像受到各种成像条件的影响诸如表情、姿态或发型、化妆的千变万化, 以及拍摄的尺度、光照和背景等的大幅度变化。 这诸多的因素使得入脸识别成为一项非常复杂但是又极富有挑战性的研究课题。 1 3 人脸识别技术的国内外发展概况 现在人脸识别技术已经应用在许多领域中,并起到了举足轻重的作用人脸识别 研究开始于1 9 6 6 年p r i 的b l e d s o e 的工作,经过三十多年的发展,已经取得了长足 的进步。下面对目前国内外的发展情况进行概述。 1 3 i 国外的发展概况 见诸文献的机器自动人脸识别研究开始于1 9 6 6 年p r i 的b l e d s o e 的工作,1 9 9 0 年日 本研制的人像识别机,可在1 秒钟内中从3 5 0 0 人中识别到你要找的人1 9 9 3 年,美国 国防部高级研究项目署( a d v a n c e dr e s e a r c hp r o j e c t sa g e n c y ) 和美国陆军研究实验 室( a r m yr e s e a r c hl a b o r a t o r y ) 成立t f e r e t ( f a c er e c o g n i t i o nt e c h n o l o g y ) 项目 2 硕士论文基于视顿内容的身份认证 组,建立了f e r e t 人脸数据库,用于评价人脸识别算法的性能。 美国陆军实验室也是利用v c + + 开发,通过软件实现的,并且f a r 为4 9 。在美国 的进行的公开测试中,f a r 为5 3 美国国防部高级研究项目署,利用半自动和全自 动算法这种算法需要人工或自动指出图像中人的两眼的中心坐标,然后进行识别。 在机场开展的测试中,系统发出的错误警报太多,国外的一些高校( 卡内基梅隆大学 ( c a r n e g i em e l l o nu n i v e r s i t y ) 为首,麻省理工大学( m a s s a c h u s e t t si n s t i t u t eo f t e c h n o l o g y ) 等,英国的雷丁大学( u n i v e r s i t yo fr e a d i n g ) ) 和公司( v i s i o n i c s 公司f a c e l t 人脸识别系统、v i i a g e 的f a c e f i n d e r 身份验证系统,l a ut e c h 公司 h u n t e r 系统、德国的b i o l d 系统等) 的工程研究工作也主要放在公安、刑事方面, 在考试验证系统的实现方面深入研究并不多 1 3 2 国内的发展概况 人脸识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位 的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智 能门禁、司机驾照验证、计算机登录系统。我国在这方面也取得了较好的成就,国家 8 6 3 项目“面像检测与识别核心技术”通过成果鉴定并初步应用,就标志着我国在人脸 识别这一当今热点科研领域掌握了一定的核心技术。北京科瑞奇技术开发股份有限公 司在2 0 0 2 年开发了一种人脸鉴别系统,对人脸图像进行处理,消除了照相机的影响, 再对图像进行特征提取和识别这对于人脸鉴别特别有价值,因为人脸鉴别通常使用 正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样系统可以接受 时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2 3 0 0 人的正面照片, 每人一张照片,使用相距l 一7 年、差别比较大的照片去查询,首选率可以达到5 0 , n - 口2 0 张输出照片中包含有与输入照片为同一人的照片的概率可达7 0 2 0 0 5 年1 月l g 日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家”十五”攻关 项目人脸识别系统通过了由公安部主持的专家鉴定鉴定委员会认为,该项技术 处于国内领先水平和国际先进水平 1 4 本文所做工作 本文主要研究建立一个应用于门禁系统的基于视频内容的身份认证系统,内容包 括视频图像的采集、人脸的检测与定位,人脸的特征抽取和分类识别等。本文对系统 构建所用的方法进行了研究和探讨,主要的工作和成果如下: ( 1 ) 基于视频序列进行人脸检测和定位:考虑门禁系统的实时性要求,首先利用简 硕士论文 基于视频内容的身份认证 单的差分方法将视频中的帧图像与背景图像相减,获得一幅仅包含运动个体的静态图 像;考虑到视频图像信息的质量缺陷,在分割出运动目标后对图像先进行光照补偿和 色度补偿的预处理;然后根据肤色的特性,建立高斯概率模型,进行人脸的精确定位。 其中包括;人脸图像预处理、肤色建模、图像去噪和模板匹配等步骤; ( 2 ) 人脸识别的特征提取方法;在特征提取之前先给出了光照归一化的预处理方法, 以提高识别率;对人脸识别的p c a 方法进行了详细的研究,结合实验分析了影响p c a 算法识别率的参数:特征向量的选取、距离函数的选取,散布矩阵的选择、以及图像 的插值缩减降维,通过在o r l 人脸库上的大量实验和分析,给出了如何选择合适的 参数以提高识别率;并给出了基于主成分分析的i - p c a 方法一一直接利用图像矩阵求 解特征子空间,在不影响识别率的前提下大大节约了计算时间。接着,针对p c a 方 法不能有效求解线性不可分分类问题,介绍k p c a 方法和f i s h e r 线性鉴别方法( f d a ) 来弥补这一不足,若通过数值实验分析比较。最后,结合本文的构建系统的实时性和 准确性要求,给出了p c a i p c a + ,c a + f i s h e r 的特征提取方法,实验证明该方法 不仅提高了识别率,而且也满足实时性。 ( 3 ) 训练和识别人脸:基于人工神经网络良好的自组织、自学习和自适应能力,本 文用b p 神经网络训练分类器,进一步提高识别率;然后针对b p 算法迭代次数多、 在训练过程中耗费时间长的问题,提出将能加速线性收敛序列收敛e p s i l o n 算法( 向 量) 分别应用于权值调整过程和最优学习率的确定以提高学习效率即对求解非线性 优化闯题最简洁的最速下降方法产生的迭代序列,运用序列加速收敛手段进行加速。 最后通过实验验证了其可行性和高效性。 ( 4 ) 初步实现了一个实时的基于视频内容的身份认证系统,该系统可以在静态的 o r l 人脸库上作识别率的测试,也可以通过摄像头实时捕获图像,对其进行检测和 识别。在视频捕获过程中,本文采用了v i d e of o rw m d o w s 技术( 简称v f w ) 进行视频 的实时捕获,在个体走近摄像头的过程中采集一段约一秒钟的视频流。 4 碛士论文 基于视颡内容的身份认证 2 1 人脸识男i 系统的概述田 第二章人脸检测和识别 人脸自动识别系统包括两个主要技术环节如图2 1 所示;首先是人脸的检测和定 位,即从输入图像中找出人脸和人脸存在的位置,并将人脸从背景中分割出来,然后 对归一化的人脸图像进行特征提取与识别这两个环节的独立性很强。下面我们将分 别对其进行研究分析。 2 2 人脸检测过程 图2 1 人脸自动识别系统的构成 人脸检测是指判断输入图像中是否包含人脸,如果存在则进一步准确定位出人脸 的位置,大小等根据本文的具体要求,我们首先对摄像头实时捕获的视频图像进行 差分运算以剔除大部分背景区域,粗定位含人脸的区域,然后对得到的含人脸的区域 利用基于肤色的高斯概率模型进行精确定位。下面对这个检澳4 过程进行详细的描述, 并用v 叶十6 0 编程进行了实验。 2 2 1 视频序列中运动目标的分割1 2 1 1 4 1 这一步主要是实现从视频捕获的图像序列中分离出运动的个体。本文研究的对象 是静止背景的视频序列,所以运动分割的目的就是要将运动目标从静止背景中提取出 来,即运动检测问题。目前有很多种方法能够很好的分割出运动的个体,如光流法等。 但是考虑到本文系统的实时性要求,因此采用帧问差分算法来提取视频图像中的运动 区域。该算法可以简单有效地将图像中的运动目标从背景中分割出来,从而即得到人 脸候选区域。帧间差分算法的主要思想是计算出帧图像与背景图像中每一点的灰度差 值,然后通过设定一个阈值来判断哪些像素点是运动点。该算法可以描述为 舷,) = 谊隐f ( x , y y f ) , t ) 叫- g ( ”x , y ) | ) i r t ( 2 2 1 ) 其中坟x y ,t ) 表示时刻t 帧图像,g ( 五y ) 为背景图像,t 取2 0 ( 主要是考虑到图像中的 硕士论文基于视颡内容的身份认证 噪声影响) 。如果两帧图像对应像素灰度的绝对差值大于r ,则表明该像素是运动点, 实验中发现,当人很接近摄像机的时候,可能会遮挡光线,从而产生遮挡效应, 使得当前图像与背景图像之间的亮度分量相差很大此时,即使差分是对静止的背景 区域进行的,两帧图像之间的亮度分量的差值仍然会很大,从而无法定位含人脸区域。 由于光照的变化对色度的影响不是很大,因此,当发生遮挡效应时,本文用色度分量 差分来进行矫正嗍。实验发现,用c r 分量差分的效果更好,所以当发生遮挡时,重 新计算两帧图像的c r 分量差分并对c r 分量差分图像进行处理以定位含人脸区域 ( a ) 第十帧( b ) 第十一帧 ( c ) 差分后的运动区域( d ) 提取出的运动对象 2 2 2 基于肤色的人脸检测定位翩 这一步,主要是利用肤色高斯概率模型对差分相减得到的候选区域进行肤色检 测,从而精确定位出人脸区域。 研究表明,人的肤色分布相对集中,尽管不同种族的人呈现不同的肤色,但其差 6 硕士论文 基于视频内容的身份认证 异主要体现在亮度上,色度变化不是很大而且颜色信息与物体的大小、伸缩及姿态 等基本上也无关,因此,采用肤色可以快速地确定出人脸的大致位置。但是,对于背 景比较复杂的图像来说,肤色检测容易受到类似肤色的背景区域的干扰,降低检测的 准确性本文系统中选用y c r c b 色彩空间作为肤色统计分布的殃射,因为该空间中亮 度信息y 和色度信息c ,、c 台是分离的,可以较好的去除亮度分量的影响;色度分量 两维独立分布,能更好地利用y c r c b 色彩空间的颜色信息进行建模;y c r c b 色彩空间 中肤色的聚类特性比较好。从r g b 空间转换到y c r c b 颜色空间的转换公式为: fy = 0 2 9 9 r + 0 5 8 7 g 十0 1 1 4 曰 c b = - 0 1 6 8 r - 0 3 3 1 3 g + o 5 b + 1 2 8( 2 2 2 ) ic ,;0 5 r - 0 4 1 8 7 g - 0 0 8 1 3 b + 1 2 8 、 下面详细介绍本文系统中人脸检测定位过程中所用到的关键技术: 1 图像的预处理 由于拍摄环境和外界光照环境等外在因素的影响,视频采集到的图像可能会发生 高光或阴影以及色彩偏移,如果直接应用肤色模型检测算法,结果可能会出现较大的 误差,因此有必要先对图像进行预处理。本文构建的系统中主要对图像进行了光线补 偿和色彩补偿下面分别进行详细的介绍: 色彩补偿啪: 受外界光照环境尤其是光源颜色的影响,采集来的彩色图像经常会发生彩色偏 移于是,本文系统中采用彩色均衡化的方法来消除图像中的彩色偏移。该方法是基 于“灰度世界假设( g r a yw o d ds u p p o s e ) ”提出的。基本思想是:首先通过图像的r 、 g 、b 三个分量各自的平均值a v g r 、a v g o 、a v g b 确定出图像的平均灰度值a v g g r a y : 然后调整每个象素的r 、g 、b 值,使得调整后的r 、g 、b 三个分量各自的平均值都 趋于平均灰度值a v g g r a y 。 具体的算法步骤如下: ( 1 ) 计算图像的r g b 三分量各自的平均值a v e , r , a v g g , a v g b ,并令图像的灰度值为: a v g g r a y = ( a v g r + a v g g + a v g b ) 3 ( 2 2 3 ) ( 2 ) 令 q = a v g g r a y a v g g ,吃= a v g g r a y a v g g ,钙= a v g g r a y a v g b 对于图像中的每个像素c ,调整其r o b 分量c ( r ) 、c ( g ) 、c ( 功,使得: c ( r ) = c ( 且) 喁,c ( r ) = c ( r ) q , c ( b ) = c ( 占) c r 3 ( 2 2 4 ) ( 3 ) 将图像各个像素r g b 值调整到能够显示的范围之内。例如对于2 4 位真彩图像, 令f a c t o r 为图像中所有r g b 三个分量中的最大值,并使f a c t o r = f a c t o r 2 5 5 ,如果f a c t o r 7 硕士论文基于视频内容的身份认证 l ,则对于图像中每个像素c ,调整其r g b 分量“脚、西回,c ( 功,使得: “足) = c ( x ) f a c t o r , c ( g ) = c ( g ) f a c t o r ,c ( 1 d = c ( 曰) ,a c t o r ( 2 2 5 ) 光线补偿”1 : 由于肤色等彩色信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影 响,导致整体偏离本质色彩而向某一方向移动,即我们通常所说的色彩偏冷、偏暖, 照片偏黄,偏蓝等等为了抵消这种整个图像中存在的色彩偏差,a n i lkj a i n 等提出 可以将整个图像中所有像素的亮度从高到低进行排列,取前5 的像素,如果这些像 素的数目足够多,就将它们的亮度作为“参考白0 整幅图像的其它像素点也都按此 调整尺度进行变换。 具体的算法如下: 记r s 、g s 和b s 分别为参考白的红、绿、蓝3 基色值,而m a x 为三者中的最大 值,调整后的三基色值分别用r r ,g r 和b r : r r = r s 2 5 5 m a x g r = g s + 2 5 5 | m a x ,( 2 2 6 ) b r = b s + 2 5 5 m a x 又假设纯白色的三基色值分别为r p ,g p 和b p ,图像中象素的3 基色值分别是r 、g 和b ,这样可以通过式( 3 ) 得到象素在纯自光照射下的3 基色值: r = ( r r r ) 事助,g = 国g r ) 木印,b = ( b b r ) + a l , ( 2 2 7 ) 图2 1 待检测的原图像 图2 2 预处理后的图像 2 非线性转换m : 一般来说在进行人脸检测时,y c c 空间中亮度和色度的分离度越大约好,并 硕士论文基于视频内容的身份认证 且在实际应用中人们发现色度值对亮度值总是存在着一定的非线性依赖关系,这种依 赖关系将会在很大程度上影响图像的检测效果所以本文在构建系统时对y c c 空间 又进行了一次非线性的转换,用来消除色度对亮度的依赖关系 下面给出实现非线性转换的公式: 108+百(k,-r)(s-108),ff(rk) 翮2 k 酵,矿 d q 2 幻 l 1 q 一“ ( 1 ) 肤色区域的中轴线 c ( d =删一瞥,则 勘 眨2 9 ) 脚坠学,矿 d 其中,k f f i l 2 5 ,瓦= 1 8 8 是非线性分段色彩变换的分段阈值,这里同时取: k = 1 6 ,k = 2 3 5 ( 2 ) 肤色区域的宽度:舔y ) 和一w o ( r ) 0 3 = 吼+ 盟卷掣,椰 的 包2 舯, w z o + g 五;塑乒, 抓瓦 y ) m a w l c b = 2 3 形= 2 0 , w h c b = 1 4 ; w h o = 1 0 ; ( 3 ) 非线性分段色彩变换公式: fg , f f ( r k ,墨】) 2 1 ( c :( 】,) 一一c , o q ) 鑫+ 一c , 0 9 , 郴 跏 y ) ( 2 2 1 1 ) 3 基于肤色的高斯建模田 本文系统中通过建立肤色模型,将图像分为肤色区域和非肤色区域两类。研究 发现,在y e b c r 颜色空间中,由色度c b 和c r 构成的二维平面上肤色分布相对比较 集中,满足二维g a u s s 分布,盯) 。 乃瓯 9 为铯强 = = 中其 硕士论文基于视频内容的身份认证 具体算法步骤是: ( 1 ) 求均值= 目 功,其中x = ( c r ,c b ) 7 ; ( 2 ) 假设c r 、c b 颜色分量相互独立,则协方差 o = e c c x - a x x - u ) 7 ) ; ( 2 2 1 2 ) ( 3 ) 根据肤色在色度空间的c r a m s 分布,对于图像上任意一点从r g b 颜色空间, 从而得到该点属于肤色区域的概率: p ( c r ,c b ) = e x p ( - ( x 一) 7 仃一1 ( x - l a ) 2 ) ( ( 2 x ) ? ”l 仃f 偿) ) ( 2 2 1 3 图2 3 肤色建楱 4 阈值的选取方法: 本系统采用的是自适应选取最佳阚值的方法,即由计算机自动产生一个合适的阈 值,对图像进行二值化。这样做比手动选取更加科学、可靠。算法思想是:设初始阈 值为k = 0 6 5 ,依据该值对图像进行二值化,再以o 0 5 的步长减小k ,当相邻两次二 值图像的差值最小时所得到的阈值即是我们所要的最佳阈值。 5 投影法较精确定位人脸区域 6 5 j 设,k 力为大小为m x n 的图像,则 , 垂直投影为:h u m y = 厂( 墨y ) , i - - 1 ,2 ,3 ,肘 水平投影为:m 堋【司:兰f ( x ,y ) ,f ;1 ,2 ,3 , 一 判断每一列的白色象素数胛姗l 涉】是否大于某一阙值m a x l e n g t h ( 如:m 4 ) , 大于的则可能是人脸区域,从而确定出左右边界l e f t 和r i g h t ;类似的,判断每一列 的白色象素的个数n u m x 】是否大于某一阈值m a x l e n 殍, h ( 比如取3 ) ,确定出上 下边界;t o p 和b o t t o m 。 1 0 硕士论文基于视频内容的身份认证 图2 4 投影法进一步精确定位人脸区域 6 模板匹配精确定位出人脸区域嗍川 由于我们仅仅利用肤色进行区域的判别,因此所得到的矩形区域可能过多或是不 够精细,不利于下面的识别因此,采用模板匹配方法进一步筛选,精确地检测定位 出人脸区域i 聃l 嗍。 模板的选择 模板是对一系列入脸图像相似度的一个统计平均。匹配所用的模板是对多个人脸 样本图像取平均值构造出来的。由于训练库中的人脸图像都是大小相等的灰度图,因 此本文选取训练样本库中所有人脸的平均图像作为模板这样检测得到的图像都是大 小相等的,在进行后续的人脸识别时就不需要再进行尺度归一化处理,大大减少了工 作量和计算的复杂度 匹配算法【峋 1 彩色图像转化为灰度图像: r g b 专g r a y lg r a y = ( g * 5 0 + r + 3 9 + b 事h ) s 0 0 2 对图像区域进行灰度标准化; 灰度标准化就是将图像的灰度期望和灰度方差变换为肺,设图像灰度 矩阵为d ,则 = 喜舌p 【1 1 明仃2 ; 善( 。【f 】u 】一五) 2 d 【司l 门的转换公式为:d 【f 】阴= 粤( d 【j 】们一力+ z o c a r 3 。相似性计算: 设模板的灰度矩阵为t ,图像窗口的灰度矩阵为则相似性度量系数p 可以 由下式计算: p = 喇u i 盈【司l ,】,( 删u 】2 。r 【f 】l ,】2 ) 2 uu 硕士论文基于视频内容的身份认证 实际计算时,还将图像的窗口分别向上下左右各移动一次,每次两个象素, 共4 次比对相似性,取最大相似度系数所对应的区域为人脸所在区域。 实验结果如下图所示: 2 3 人脸识别过程 图2 5 糟确定位出的人脸区域 人脸识别即判断待识别图像属于训练样本库中的哪类,主要包括特征提取和分 类识别两大部分,为了提高识别率,同样要先进行预处理。下面就一一进行详细的分 析研究。 2 3 1 人脸图像的预处理i 2 l 为提高识别效果,在识别之前,我们有必要先进行归一化预处理。在本文的系统 中,由于前面模板匹配所用的是同一个模板,因此检测所得的图像都是大小一样的, 故无需再进行尺度归一化此处的归一化主要是对图像光照的处理。 为了消除面部光照对识别的影响,我们让每一幅图象灰度值的均值和方差都相 等。从物理意义上说,就是让每一幅图的直流能量和交流能量都相等。基于这种思想, 假设期望的均值和方差分别为和气,那么对于高为h 宽为街的灰度图 ,( f 力【0 ,1 】,有: m e a n 2 击荟善m - ,) ( 2 3 1 ) d e l t a 2 ( 2 3 2 ) 这样,由式( 3 2 3 ) ,可以将样本集和测试中的人脸图像灰度全部归一化得,( f ,_ ,) j ( ,) = 豫+ 1 ( i , 矿j ) - m e a n 吒 ( 2 - 3 3 ) 本文的实验中,取= o 5 ,吒= o 2 5 1 2 颈士论文基于税频内容韵身份认证 2 3 2 特征提取嘲 人脸图像在原始样本空间中的分布并不集中,这往往不利于进行有效的分类识 别。为了能区分不同类别的人脸图像,可以把原始的人脸图像通过线性或者非线性方 法转换到另一个低维空间,使得同类人脸图像在此空间中分布更加紧凑,从而便于分 类和识别。特征的选择和提取的基本任务是从样本的许多特征中找出那些最有效的特 征。也就是通过映射或者变换的方法将高维的原始空间转换到低维的特征空间中,得 到人脸特征的低维表示。 本文主要讨论几种代数特征提取方法,并最终根据分析比较,从中选择最优的特 征提取方法将其应用于本文构建的识别系统中 ( 一) 主分分析方法0 c j 0 哪 主成分分析方法的目的是通过线性变换找一组最优的单位正交向量基( 1 l p 主元) , 用它们的线性组合来重建原样本,并使重建后的样本和原样本的误差最小p c a 方 法进行人脸识别的具体流程如下: ( 1 ) 、读入人脸库。读入每幅人脸图像并转化为一维列向量假设图像的大小是 w x h ( w 和h 分别为图像的宽度和高度) ,整个样本库中图像个数是n ,用于训练的 人脸图像数是n l ,测试的图像数是n 2 ,令m = w h ,则训练集是一个m x n l 的矩阵, 测试集是m x n 2 的矩阵。第f 幅人脸可以表示为: x = 【,z 】r( 2 ,3 4 ) ( 2 ) 、计算k - l 变换的生成矩阵z ,进行k - l 变换k - l 变换的生成矩阵可以是 训练样本的总体散布矩阵s t ,也可以是类问散布矩阵s b 等 总体散布矩阵可表示为( 忽略系数) : m q = ( 一一i ) “一习7 尺 ( 2 3 5 ) l = i 若取总体散布矩阵s 。作为生成矩阵,记 x = 【x l 一覃,x 2 一舅,x 。l i 】r 埘。m ( 2 3 6 ) 则z 可写成: = j 7 r 朋朋 ( 2 3 n 若将类内敖布矩阵s b ( 忽略系数) 作为k - l 交换的生成矩阵z ,即: s 6 = ( 丽,一i ) ( 万,一x - ) 7 ( 2 3 8 ) 碗士论文基于视频内容的身份认证 这里c 为训练样本集中模式的类别数,厩( f = l ,一,力是训练样本集中各类模式样 本的均值矢量,且记: 石= r 两一i 而一不一 瓦一司r “” ( 2 3 9 ) 则生成矩阵z 为: = z x 7 r n | x n l ( 2 3 1 0 )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论