(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf_第1页
(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf_第2页
(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf_第3页
(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf_第4页
(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(信号与信息处理专业论文)人脸识别身份验证技术的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 人类身份验证形式从古至今经历了很长时间的变革,随着数字时代的来临, 基于生物特征识别的身份验证技术己开始显现出它的价值。人脸检测识别技术是 基于人脸特征来进行身份识别的技术,与其他识别方式相比,由于人脸始终暴露 在外面,采集人脸特征有直接、友好、方便的特点,因此自动人脸识别己成为人 工智能和人体生物特征识别领域的一个重要研究方向,也成为模式识别与计算机 视觉领域内一项受到普遍关注、十分活跃的课题。 本文通过构造人脸检测模块和人脸识别模块组成一个人脸识别身份验证系 统,创新性的对b p 神经网络进行了改进,提出了基于聚类的非平衡二叉树支持向 量机概念,并通过分析实验数据验证了方法有效性。具体完成工作如下: 首先,对人脸识别技术研究背景和现实意义进行了简单的介绍,并对当今研 究现状及应用领域进行概括。 其次,基于传统支持向量机优良性能分析,提出非平衡二叉树支持向量机概 念,通过f a s f l c a 算法进行图像压缩,运用改进的添加附加动量、可变学习速率 b p 神经网络进行人脸检测实现。 再次,应用g a b o r 滤波器特征提取,h o p f i e l d 神经网络压缩,运用非平衡二叉 树支持向量机通过实验样本仿真数据分析系统的可靠性。 最后,实际应用到现实身份验证过程中,通过试验进一步验证整个系统完整 性与可用性,并进行总结展望。 关键词:人脸检测,人脸识别,支持向量机,f a s t l c a ,b p 神经网络,g a b o r 滤波 器,h o p f i e l d 神经网络,非平衡- y 树支持向量机 a b s t r a c t a bs t r a c t s i n c ea n c i e n tt i m e sh u m a na u t h e n t i c a t i o nh a sg o n et h r o u g hav e r yl o n gp e r i o do f c h a n g e w i t ht h ea d v e n to fd i g i t a la g e ,t e c h n o l o g i e sb a s e do nb i o m e t r i ca u t h e n t i c a t i o n h a v es h o w nt h e i rv a l u e f a c ed e t e c t i o nt e c h n o l o g yi sb a s e do nf a c ef e a t u r e sf o ri d e n t i t y r e c o g n i t i o n b e a c a u s ef a c ei sa l w a y se x p o s e d ,f a c i a lf e a t u r ec o l l e c t i o nh a sad i r e c t , f r i e n d l y ,c o n v e n i e n ta d v a n t a g ec o m p a r e dw i t ho t h e rm e a n so fi d e n t i f i c a t i o n t h e a u t o m a t i cf a c er e c o g n i t i o nh a sb e c o m ea ni m p o r t a n tr e s e a r c hp o i n ti nt h ea r e ao f a r t i f i c i a li n t e l l i g e n c ea n dh u m a nb i o m e t r i c sa n dav e r ya c t i v e s u b j e c ti np a t t e r n r e c o g n i t i o na n dc o m p u t e rv i s i o n b yc o n s t r u c t i n gf a c ed e t e c t i o nm o d u l ea n df a c er e c o g n i t i o nm o d u l et oaf a c e r e c o g n i t i o na u t h e n t i c a t i o ns y s t e m ,a ni m p r o v e db pn e u r a ln e t w o r ka n dn o n b a l a n c e d b i n a r yt r e es u p p o r tv e c t o rm a c h i n ew i t hc l u s t e r i n ga r ep r o p o s e d ,a n de x p e r i m e n t a l r e s u l t sv a l i d a t e 恤sm e t h o de r i e c t i v e c o n c r e t ew o r kd o n ea sf o l l o w s : f i r s t ,as i m p l ei n t r o d u c t i o no ff a c er e c o g n i t i o nt e c h n o l o g yb a c k g r o u n da n d p r a c t i c a ls i g n i f i c a n c ei sp r e s e n t e da sw e l la st h e o r e t i c a lo v e r v i e wo ft h ep r e l i m i n a r y w o r k s e c o n d ,b a s e do np e r f o r m a n c eo ft r a d i t i o n a ls u p p o r tv e c t o rm a c h i n e ,n o n - b a l a n c e d b i n a r yt r e es u p p o r tv e c t o rm a c h i n ei sp r e s e n t e d b yf a s t l c aa l g o r i t h mf o ri m a g e c o m p r e s s i o n ,t oa c h i e v et h ep u r p o s eo ff a c ed e t e c t i o nt h o u g hi m p r o v e da d d i n g a d d i t i o n a lm o m e n t u m ,v a r i a b l el e a r n i n gr a t eb pn e u r a ln e t w o r kf a c ed e t e c t i o n a g a i n ,a f t e rg a b o rf i l t e rf e a t u r ee x t r a c t i o n , h o p f i e l dn e u r a ln e t w o r kc o m p r e s s i o n , 谢mn o n - b a l a n c e db i n a r yt r e es u p p o r tv e c t o rm a c h i n e ,c o r r e c t n e s sa n d r e l i a b i l i t yc a nb e v a l i f i e dt h o u g hd a t aa n a l y s i s f i n a l l y , t h ea p p l i c a t i o nt ot h er e a la u t h e n t i c a t i o np r o c e s sf r r t h e rv a l i d a t e st h i s s y s t e mb yt e s t i n gt h ei n t e g r i t ya n da v a i l a b i l i t y a tl a s t ,as i m p l ev i e wo ft h ep r o s p e c t si n t h i sa r e ai sp r o v i d e d k e yw o r d s :f a c ed e t e c t i o n ,f a c er e c o g n i t i o n ,s u p p o r tv e c t o rm a c h i n e ,f a s t i c a , b p n e u r a ln e t w o r k ,g a b o rf i l t e r , h o p f i e l dn e u r a ln e t w o r k , n o b a l a n c eb i n a r yt r e es u p p o r t v e c t o rm a c h i n e n 图目录 图目录 图2 1 一对多策略决策图1 5 图2 2d a g 支持向量机决策图16 图2 3 基于不同类间距离的样本空间图1 7 图2 4 非平衡支持向量机决策图18 图3 1p c a 和i c a 投影方向的比较图2 3 图3 2 神经元结构图2 4 图3 3b p 神经网络结构图2 6 图3 - 4 精度变化曲线图2 8 图3 5 人脸检测流程图3 0 图3 - 6 ( a ) 部分训练样本人脸图片( b ) 部分训练样本非人脸图片3 1 图3 7 ( a ) 部分正确检测人脸样本图片( b ) 部分漏检人脸样本图片 ( c ) 部分误检人脸样本图片3 2 图3 8 不同隐含层节点数对应定位准确率关系曲线图3 3 图4 1 总体训练方式与基空间训练方式训练时间比较图3 8 图4 23 个频率8 个方向g a b o r 基函数实部3 9 图4 33 个频率8 个方向g a b o r 基函数虚部4 0 图4 - 4g a b o r 滤波器作用下基于八个方向的同一人脸图像4 0 图4 5 两层h o p f i e l d 离散神经网络图4 1 图5 1d i r e c t s h o w 应用软件框架图4 8 图5 2 图像采集与存储连接模型4 9 图5 3 ( a ) 图为末经去噪的图像帧( b ) 图为中值滤波后的图像5 1 图5 - 4 身份验证过程流程图。5 2 图5 5 单向认证过程示意图5 3 图5 6 双向认证过程示意图。5 3 图5 7o r l 人脸库样本图片5 4 图5 8 核函数阶数与识别率关系曲线图5 5 图5 - 9 训练样本数目与识别率关系曲线图5 6 图5 1 0 样本类数与识别率关系曲线图5 6 v i 图目录 图5 1 1 输入特征维数与识别率关系曲线图5 7 图5 1 2 输入特征维数与训练时间关系曲线图5 7 图5 1 3 不同识别方法对应识别率与识别时间图5 8 图5 1 4 自建人脸库样本图片5 8 图5 1 5 人脸检测图像生成图5 9 图5 16 人脸识别结果图6 0 v h 表目录 表目录 表1 1 生物特征识别技术优良性能比较表2 表1 2i s o i e cw d2 9 7 9 4 1 生物识别标准3 表2 1s v m 多类别分类方法所需要的支持向量机分类器数目1 8 表2 2s v m 多类别分类方法结构与训练时间比较表1 9 表3 1 不同隐含层节点数对应定位准确率3 3 表5 1 不同样本集分类方法对应识别率5 5 v i i i 缩略语目录 b p i c a f a s t l c a p c a l d a e g m f m h 删 e r m s r m s v m o a o s v m o a a s v m d a g s v m n b b t s v m 缩略语目录 b a c kp r o p a g a t i o n i n d e p e n d e n tc o m p o n e n ta n a l y s i s f a s ti n d e p e n d e n tc o m p o n e n ta n a l y s i s p r i n c i p a lc o m o n e n t sa n a l y s i s l i n e a rd i s c r i m i n a n ta n a l y s i s e l a s t i cg r a p hm a t c h i n g f l e x i b l em o d e l h i d d e nm a r k o vm o d e l e m p i r i c a lr i s km i n i m i z a t i o n s t r u c t u r a lr i s km i n i m i z a t i o n s u p p o r tv e c t o rm a c h i n e o n e a g a i n s to n es u p p o r tv e c t o rm a c h i n e o n ea g a i n s ta l ls u p p o r tv e c t o rm a c h i n e d i r e c t e da c y c l i cg r a p hs u p p o r tv e c t o rm a c h i n e n o b a l a n c eb i n a r yt r e es u p p o r tv e c t o rm a c h i n e i x 反向传播 独立成分分析 快速独立成分分析 主成分分析 线性鉴别分析 弹性图匹配技术 柔性模型 隐马尔可夫模型 经验风险最小化 结构风险最小化 支持向量机 一对一支持向量机 一对多支持向量机 有向无环图支持向量机 非平衡二叉树支持向量机 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明 确的说明并表示谢意。 签名: 日期:冲年s 月知日 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名: 导师签名:娩 日期:眸钿 z e l 第一章绪论 第一章绪论 1 1 人脸识别技术研究背景及意义 人类身份验证形式从最初手写名字、介绍信到如今的身份证、智能卡,有很 长时间的一段变革,但大多数身份验证形式由于其安全性低,只能适用于安全要 求不高的环境。随着数字时代的来临,我们发现指纹识别已在机场金融领域进行 实际应用,这是一种生物识别技术,基于生物特征识别的身份验证技术已开始显 现出它的价值。生物识别技术是利用人体的生物特征与预先存储的数据进行比较 来进行身份验证的技术。指纹、掌纹、面孔、发音、虹膜、视网膜、骨架等可认 为是与众不同而且终生不变的,有唯一性、可采集性、难欺骗性、随身携带和稳 定性,可以由此识别出人的身份,并且这种新兴的生物识别身份验证技术有其不 可替代的优越性,将成为未来身份认定的重要方式。因为生物特征识别技术需要 特征采集过程,识别过程一般要进行大量的计算,所以实现这些技术所需系统支 持也较为复杂,需要基于大量理论基础的支撑。 1 1 1 生物识别概论 我们都知道,人类是通过视觉来感知外界环境的。在客观世界中,7 5 的信 息量都来自于人类的视觉,所以人工智能的重要环节是在计算机内植入人工视觉, 随着信号处理理论与高性能计算机的出现,这种设想变得有条件实现。在众多生 物识别方式中,指纹识别是最古老的生物特征识别技术,应用最早也是发展最成 熟的,目前来说市场应用也最为广泛。指纹指的是指尖表面的纹路,这些纹路具 有唯一性的特征信息。指纹识别技术是通过采集设备读取指纹图像,然后用计算 机识别软件分析指纹的细节特征,从指纹中抽取特征值,相互匹配来确定一个人 身份。这种最为广泛应用的生物识别方法有其固有的优点,例如研究历史悠久理 论成熟,指纹特征独一无二且固定,不易随时间发生改变,同时采集设备移动方 便。但其缺点同样显而易见,样本采集过程为物理接触式,这种接触式或近距离 特征采集需要用户主动配合,不友好性会给使用者带来诸多不便,引起用户反感, 使商用可接受性大打折扣。另外,指纹易受磨损,导致不能轻易提取特征图像, 同时从安全角度来说,指纹痕迹存在被复制性,可以利用科技手段克隆指纹造成 电子科技大学硕士学位论文 欺诈验证。 虹膜识别也是一种被广泛研究的生物识别方法。虹膜是位于眼睛黑色瞳孔和 白色巩膜之间的圆环状部分,由相当复杂的纤维组织构成,呈现由里到外的放射 状结构。根据医务工作者和学者们临床观察及研究发现,一个虹膜可变项多达2 6 0 项,使得虹膜结构千变万化,成为独一无二的标识。这种识别方法的突出优点在 于虹膜结构不具有遗传性,但一个最重要的缺点是很难进行获取图像压缩小型化, 另外采集设备昂贵,镜头产生畸变从而使可靠性低,所以当前虹膜识别系统没有 进行过任何实际认证实验。 语音识别最大优点就是语音信号获取方便,但语音识别系统对人们在声音变 化时比如感冒时反应比较敏感,另外,同一个人的磁带录音也能欺骗语音识别系 统,造成错误的身份验证。 以下为几种生物特征识别技术优良性能比较: 表1 1 生物特征识别技术优良性能比较表 生物特征识别技术可用性侵入性鲁棒性 虹膜差 较大 好 视网膜差较大好 指纹较差大 好 语音好小 较差 人脸较好较小较好 大批基于生物识别科学技术产生的应用、产品和市场的发现,使得生物识别 标准的出台迫在眉睫。我国在生物识别领域从技术上来说已经达到国际水平,但 离产业化还有很长的路要走,同时,生物识别标准也处于起始阶段,大部分标准 都是企业标准,用于企业内部的生产制造,还没有统一的国家行业标准。2 0 0 5 年, 国标计划生物特征识别防伪技术产品通用技术条件是一个里程碑式文件,但 由于仅限于公安行业范围,涉及范围较小,并不能得到广泛推广。为了使我国生 物识别行业更快更好的发展,十分有必要建立一个生物识别标准制定工作组,专 门致力于生物特征识别标准体系的制定,为之后产业化发展奠定基础。 生物特征识别标准应具体到四类进行体系制定: ( 1 ) 生物特征识别词汇汇编; ( 2 ) 生物特征识别技术接口; 2 第一章绪论 ( 3 ) 生物特征识别数据交换格式; ( 4 ) 生物特征识别测试与报告。 对于生物特征识别质量监督,根据i s o i e cw d2 9 7 9 4 1 ,我们有如下标准: 表1 2i s o 正cw d2 9 7 9 4 1 生物识别标准 质量等级定义 优( 7 6 - 1 0 0 )任何环境下该样本都有比较好的认证结果 多数情况下,可以产生好的认证结果,但在有些 良( 5 1 - 7 5 ) 应用中,需要改进样本质量 中( 2 6 - 5 0 )认证结果较差,需要考虑更换新样本替换 差( 0 - 2 5 )完全不能进行生物识别 1 1 2 人脸检测识别技术简介 人脸检测识别技术是基于人脸特征来进行身份识别的技术。与其他识别方式 相比,由于人脸始终暴露在外面,采集人脸特征有直接、友好、方便的特点。现 在,国际银行组织、国际民航组织的生物特征识别护照的标准中明文规定必选的 特征是人脸,可选的特征是指纹、虹膜或者在其它特征中任何一种。目前我国公 民的第二代身份证有嵌入可机读的人脸图像信息,这也为下一步人脸识别广泛应 用打下有利的基础。 人脸检测识别研究历史悠久,是模式识别领域的经典问题。十九世纪g a l t o n 在( ( n a t u r e 杂志上发表了运用人脸进行身份识别的文章,现代研究始于6 0 年代末, 在9 0 年代成为了研究热点。人脸检测问题也来自于人脸识别问题,它是人脸识别 系统一个重要组成部分,要进行人脸检测,首先需要将人脸从视频流或图像中定 位分割出来。早期人脸识别主要针对强约束人脸图像,即假设无背景图像,因此 人脸检测问题并没有得到足够重视,但在实际应用中,要求识别过程对一般环境 图像和视频具有一定适应能力,因此人脸检测部分作为一个独立课题被广泛研究。 在很多算法中,人脸检测完成的同时完成了定位。人脸结构具有恒定性,五官分 配有普遍性,通常采用基于知识规则方法和模板匹配方法。基于知识规则方法指 通过先验知识判断目标图像是否属于某人;而基于模板匹配方法是通过目标图像 与标准人脸模板间的相关性来进行判决。 人脸识别是人类视觉固有的能力,这涉及到模式识别、图像处理、认知科学、 生物学、心理学,早在六七十年代学者们就开始了研究的步伐。人脸自动识别系 电子科技大学硕士学位论文 统没有开始大规模商业应用主要原因是利用计算机进行自动人脸定位和识别还处 于不成熟阶段。现在存在的问题是对人类的视觉系统和大脑的工作机理的研究没 有突破性进展,因此人工可以轻易完成的识别任务,对于只会机械执行程序指令 的计算机来说却相当的困难。除此之外,人脸图像数据量庞大,也是一个不可忽 视的原因。例如一张人脸检测识别算法研究广泛使用的尺寸很小的灰度图像,大 约为6 4 6 4 ,就有4 0 9 6 个数据,而每个数据基于像素的考虑又可能有2 5 6 种取值, 所以可以说检测样本十分复杂。若当人脸数目较大,计算速度会让人难以忍受。 并且灰度图像丧失了诸如色彩、运动等有用信息,如果对于实时人脸检测来说, 普通的摄像头就能够以每秒1 0 帧的速度捕捉大小为3 2 0 2 4 0 的彩色图像,试想一 下,检测数据计算量相当大。 人脸检测识别技术相比于其它生物特征识别技术在实用性方面优势,主要体 现在以下四个方面: 首先,可交互性强。非接触式采集目标,符合一般用户的习惯,容易被人们 接受,不会造成生理上的伤害,没有侵犯性,从而提高系统的可靠性和可用性; 其次,可以隐蔽操作,适用于安全监控;再次,设备成本低廉。数码相机、摄像 机日益普及,进一步增加可用性。 我们在三维立体场景中,人眼可以多角度的观察目标,相比于平面图可以获 得更多的信息量。另外人类可以通过大脑不断学习,同时利用先验知识确定判断 人脸。可是用于计算机实现是一个棘手的问题,主要表现在以下三个方面: 首先,人脸检测识别的可靠性相对较低。虽然人脸各不相同,但面孔是相似 的;其次,人脸特征稳定性较差。建立一种具有条件不变的描述模型是非常困难 的;最后,图像采集过程受客观因素影响很大。在不同的光照条件、视角、距离 变化等情况下采集图像会极大影响人脸图像的表观,使得识别性能差强人意。 人脸识别研究是具有挑战性的研究课题,同时也是当前研究热点。目前,在 用户配合、采集条件理想的情况下,世界上最好的自动人脸检测识别系统可以基 本满足一般应用要求。随着技术的进步,希望自动人脸检测识别技术能够更好的 满足人们的要求。 国际上人脸识别评价机构都制定了人脸识别评价指标,例如人脸样本的采集, 训练样本和测试样本的划分以及指标的计算等,下面给出常用的系统性能指标含 义。 ( 1 ) 首选识别率 人脸识别中匹配相似度最大的比率。 4 第一章绪论 ( 2 ) 累积识别率 规定一定数量候选类别情况下,正确识别结果的比率。 ( 3 ) 累积识别率曲线 累积识别率随候选类别数量变化的关系曲线。 ( 4 ) 错误接受率 某个匹配相似度阈值下,非目标人被错误归为目标类的比率。 ( 5 ) 错误拒绝率 某个匹配相似度阈值下,目标人被错误归为非目标类的比率。 ( 6 ) r o c 曲线 随着匹配相似度阈值变化,错误接受率和错误拒绝率也会随之改变,我们分别 以错误接受率和错误识别率为横纵坐标可得到不同匹配相似度轨迹线,我们称之 为r o c 曲线。 ( 7 ) 等错误率 我们把r o c 曲线中错误接受率和错误识别率相等的值称为等错误率。 1 2 国内外人脸识别研究现状 上世纪九十年代以来,人脸检测识别技术研究达到了高潮时期,一批具有代 表性的论文和算法产生,自动人脸识别技术也得到了长足的发展,相关机构组织 了如人脸手势识别等专门的国际学术会议。另外,现在很多的研究型理工大学和兀 公司都在着手人脸检测识别研究。领域内最著名的国际研究机构包括:美国麻省 理工学院媒体实验室及人工智能实验室、南加州大学、马里兰大学、卡内基一梅隆 大学机器人研究及交互系统实验室等。 在我国,清华大学计算机系、电子系瞻嘲、中科院自动化所阳吲、南京理工大学 1 0 - 1 3 、南京航空航天大学n 4 。1 、哈尔滨工业大学n 8 。圳、微软亚洲研究院陋2 叼等,他 们进行了许多很有意义的尝试,积累了经验。 2 0 0 5 年1 月,由清华大学电子工程系组织研究的商用人脸识别系统通过公安部 专家鉴定组认可。该系统采用人脸局部主成分分析的多模式人脸识别方法,实时人 脸图像归一化处理具有多项创新和知识产权。另外在国际相关人脸识别学术会议 中,众多学者提出了许多卓有成效的理论与实践。 b l e d s o e 考虑到人脸特征点相对位置为特征,建成一个半自动的人脸识别系统。 包括人脸归一化点间距离和比率以及人脸特征点,如眼、嘴、鼻等所构成的三维 5 电子科技大学硕士学位论文 拓扑结构。 h u a n g 矛1 y a n g 提出了基于知识的分层检测方法汹3 。主导方法由三级处理层面组 成,分层检测先简单再复杂可以减少大量计算。虽然没有报告满意的检测率,但 多分层的思想为人们提供了一种新思路。 k o t r o p o u l o s 和p i t a s 提出采用投影方法确定面部特征晗引,而y o w $ 口c i p o l l a 提出了 一种基于特征的方法都是在特征提取方面做了大量研究和探索。 m i a o 等人提出了层次模板匹配方法用于人脸检测1 。首先处理旋转图像,运 用拉普拉斯运算对输入图像从- 2 0 度到2 0 度以5 度间隔旋转,形成多分辨率图像层 次并且提取边缘,两只眉毛、两只眼睛、一个鼻子和一张嘴六个人脸组成部分产 生的边缘组成人脸模板,最后通过启发式方法来定位人脸。论文实验结果表明对于 图像中单个人脸的情况,此方法有不错的表现。 当实验样本为彩色图像时,由于肤色具有聚类的性质,所以在一定的亮度空 间内,肤色是非常有效的信息。z a r i t 研究小组基于五种不同的彩色空间进行肤色 分割啪3 ,t e n i l i o n 等人评估了对于不同色度空间的肤色分布模型口1 i 。但不可避免的 是人体有其他部位比如手、脖子、腿等部位也是具有肤色信息的,这就给利用单 一肤色进行人脸检测造成一定难度,所以学者们也致力于其他算法的研究。 麻省理工学院t u r k 和p e n t l a n d 提出的主成分分析法,也被称作e i g e n f a c e b 羽。这 个算法重在挖掘数据间内在联系,把相关变量降维成不相关变量,重新组成一组 数据。其中第一个主成分变量具有最多的信息,剩下的变量依次包含剩余信息的 最大量。在这之后很多人脸识别方法都和特征脸技术有或多或少联系。 b o o s t i n g 算法作为一种新的基于统计学习方法被学者们提出口羽,并在人脸检测 中获得不错效果。代表算法a d a b o o s t 算法采用迭代方法,选择一个特征集,改变样 本分布,将正确分类样本的权重略微降低,反之将错误分类样本的权重适当提高, 最终使得特征具有较强的区分性和独立性。然后将特征结果保留构造成弱分类器, 再进行权重选择组合成为一个强分类器。 另一种获得广泛认同的人脸识别方法是由b e l h u m e u r 等提出的基于特征空间 的统计式方法,另称为f i s h e r f a c e 口钔。同样首先采用主成分分析对特征图像进行降 维,之后运用线性判别分析的方法以获得最大类间散度和最小类内散度,以此得 到易于分类的向量。 w i s k o t t 等人基于b u h m a n n 和l a d e s 等提出的弹性图匹配技术( e l a s t i cg r a p h m a t c h i n g ,e g m ) 所做的一些改进也广泛受到认可5 嘲,主要方法是用属性图来描 述人脸,面部特征点由属性图的顶点表示,即为多分辨率、多方向局部特征- g a b o r 6 第一章绪论 变换特征。 柔性模型( f l e x i b l em o d e l s ) 口7 矧在人脸建模方面起到重要的作用。将人脸区分 为2 d 形状和纹理两个不相关的部分,之后通过主成分分析过程将上述两部分融合 对人脸进行统计建模。 另一种人脸识别典型数学建模方法是基于隐马尔可夫模型( h i d d e nm a r k o v m o d e l s ,h m m ) 进行的口引。我们可将人脸图像垂直分成条状区域,包括额头区域、 眼睛区域、鼻子区域、嘴巴区域和下颚区域,每个区域代表从左到右的连续h m m 中的一个状态,但由于其维数很高,计算量较大。 人工神经网络在人脸识别应用中历史悠久,已成为一个重要的研究方向。主 要包括自联想映射神经网络、无监督监督混合神经网络、级联b p 神经网络、基于 概率决策的神经网络、多模态的神经网络等等。 v a p n i k m 3 最先提出支持向量机理论( s v m ) ,这是一种基于统计学习理论中 v c 维理论和结构风险最小理论的学习方法。这种方法对于维数多变性不敏感,非 常适合于解决小样本学习问题,并具有广泛的推广能力。在国外,s v m 已经成为 一个研究的热门方向,在学者们的努力攻关下,已经取得了不少卓有成效的成果。 在我国早在八十年代末就有学者注意到统计学习理论的基础成果,目前日益成为 人脸识别领域的一种新方法和新思路,已开始对s v m 的广泛研究,并且由于该方 法在支持向量机中的成功应用,引导学者们展开运用核技巧改进传统线性数据处 理算法的科研攻关。支持向量机同时是一种性能优越的分类算法,具有较强的泛 化能力。支持向量机起初是由两类分类问题发展而来,因此对人脸识别此类多类 问题,必须将其转换为两两分类问题。g u o 等h 妇提出了一个基于支持向量机多类识 别问题,在o r l 人脸数据库上取得了不错的数据结果。h e i s e l e 等h 习采用“一对多 分类”的实验方法利用s v m 进行人脸识别,也达到了预期实验效果。d e n i z 等h 列首 先利用独立成分分析( i c a ) 提取人脸图像特征,然后用支持向量机分类,在y a l e 和a r 人脸数据库上都达到了很好的识别效果。 1 3 人脸识别系统应用 人脸识别较自然、人性化、可视化、能够被广泛接受,是一种极具潜力的生 物特征识别方式。人脸识别技术最初主要应用于于公安部门人脸照片存档管理和 刑侦破案,现在该技术应用领域扩展广泛,在安全系统、商业领域和日常生活中 都有很多应用: 7 电子科技大学硕士学位论文 ( 1 ) 刑侦破案。公安部门获得嫌疑人照片后,将记录在案逃犯照片、身份证、 特征上传到网络,利用人脸检测识别技术对罪犯人脸库进行管理和查询,此方法 可以对犯罪分子产生极大威慑力,并可以明显提高工作效率。 ( 2 ) 证件验证。每个人都有非常多的各类证件,如身份证、驾驶证、军官证、 考试证等,现在情况是多为人工验证完成。人脸识别技术能够应用于这项工作, 可由计算机实现并完成自动化及智能管理。 ( 3 ) 视频监控。入口控制范围很广,在视频监控中引入人脸识别系统,可以防 范钥匙、密码盗用、盗取现象。2 0 0 8 年北京奥运会中,中科院研究所研发的人脸 识别快速身份验证系统,已经投入使用并获得好评。 ( 4 ) 人机交互。人脸识别在智能计算机领域具有重要作用。可根据客户对象的 个性化使用特点进行特定设置,使人机交互尽可能模拟人人交互轻松自如。 1 4 本文主要工作和内容安排 本文通过构造人脸检测模块和人脸识别模块组成一个人脸识别身份验证系 统,创新性的对b p 神经网络进行了改进,提出了基于聚类的非平衡二叉树支持向 量机概念,并通过分析实验数据验证了方法可靠性。 第一章对人脸识别技术研究背景和现实意义进行了简单的介绍,并对当今研 究现状及应用领域进行概括。 第二章对传统支持向量机优良性能分析并提出非平衡二叉树支持向量机概 念。 第三章介绍人脸检测工作。通过f a s t l c a 算法进行图像压缩,运用改进的添加 附加动量、可变学习速率b p 神经网络进行人脸检测实现,并在第四章应用g a b o r 滤波器特征提取,h o p f i e l d 神经网络压缩,运用非平衡二叉树支持向量机通过实验 样本仿真数据分析系统的可靠性。 第五章介绍了d i r e c t s h o w 图像截取软件并对图像进行中值预处理,给出人脸 识别系统方案。 最后,实际应用到现实身份验证过程中,通过试验进一步验证整个系统完整 性与可用性,并进行总结展望。 第二章支持向量机理论 第二章支持向量机理论 1 9 9 2 年,a t & t 贝尔实验室,v a p n i k 研究团队首次提出支持向量机机器学习 算法,并在随后二十年间得到广泛应用发展。本章对各种支持向量机分类方法进 行介绍,提出非平衡支持向量机用于人脸识别系统中识别过程。 2 1 统计学习理论 统计学习过程就是对小样本进行统计和预测的理论。在统计学习中,表示估 计函数y = 厂( x ) ,x r 输出函数y 值不同时意义也不相同: y er 是回归或概率密度估计; y n 是多分类模式识别; y 一1 ,+ 1 ) 是二值模式识别。 我们给定未知函数映射的一个样本来构造函数,( 五,乃) ,( 恐,咒) ,( ,以) ,定 义这个未知函数为训练集,一个机器学习过程是从一个给定函数集 f ( x ,口) ,a a 1 选出一个最优近似函数,人是任何参数的抽象集。一个机器学习系统由四部分组 成,分别为问题域、归纳原理、决策集以及算法,我们了解一下相关的损失函数。 2 1 1 损失函数和风险最小化 从函数集 厂( 工,口) ,口a 】中估计出函数厂( x ,口) ,那么期望风险函数可表示为 r ( 口) = p ( y ,f ( x , a ) ) 谚( 工,j ,) ,l ( y ,f ( x , a ) ) 就是损失函数,我们的目的是最小化 风险函数,也可以说我们的目标是最小化期望的平均损失。 2 1 2 归纳原理 归纳原理是指通过给定空间的训练集构造出一个决策准则,通过这个准则可 以对检验点进行分类。这里介绍两种归纳原理分别为经验风险最小化( e r m ) 原理 和结构风险最小化( s r m ) 原理。 经验风险最小化是说在最小化风险函数时,基于整个函数空间选择与实际函 数有最小偏差的函数。由于我们未知联合分布函数f ( x ,y ) ,也没有对应工点的y 9 电子科技大学硕士学位论文 值,定义经验风险泛函: ( 口) = 三( 厂( 而,口) ) ( 2 1 ) i f , i = 1 我们用以上经验风险函数来代替期望风险函数。这个归纳原理就称为经验风 险最小化,即在有限样本中基于经验能力选择出的一个决策。对于实际当中的模 式分类问题,需要满足如下关系式: rsk + 上式中,r 为实际风险,右边为风险边界, ( 2 - 2 ) 为v c 置信值, h 是学习机的v c 维。支持向量机的思想就是若样本数目足够,选取一个合适的v c 维h ,使分类间隔最大,也就可以使实际风险r 最小。 结构风险最小化就是同时最小化经验风险和置信范围。将决策函数集 f ( x ,口) ,aea 】分解为一个函数子集序列并使序列按照v c 维的大小排列 j l l 吃h n ,然后选择一个合适的子集达到最小化边界的目的。 2 2 支持向量机理论 1 9 9 2 年,a t & t 贝尔实验室,v a p n i k 研究团队首次提出支持向量机机器学习 算法,并在随后二十年间得到广泛应用发展,从最初应用于神经信息处理系统 ( n e u r a li n f o r m a t i o np r o c e s s i n gs y s t e m ) 到之后优点被越来越多学者们所接受。支 持向量机优点可归纳为: ( 1 ) 运用结构风险最小化原则; ( 2 ) 良好的推广能力,适用性强; ( 3 ) 通过核函数使线形分类器应用于非线性变换; ( 4 ) 特征维数与问题复杂度没有直接联系; ( 5 ) 存在唯一极值点,最终转化为二次优化问题; ( 6 ) 可以代替多种传统方法,能较好的进行模型选择。 现在,支持向量机应用于统计学、神经网络、机器学习、人工智能等领域。 支持向量机理论涵盖三类学习问题分别为:模式识别、回归分析和密度估计。支 持向量机分类目的是在高维空间中通过学习训练构造分类超平面,本章先从理论 1 0 第二章支持向量机理论 我们假设最简单两类识别问题,假定n 个训练样本五r ,i = 1 ,2 ,n ,对于 每个训练样本薯我们假设他们的类标为乃 - 1 ,+ 1 】,样本之间互相独立,我们的 任务就是要寻找一个映射对应训练样本五和他们的类标以,这里的映射厂就是 分类器,我们用口来表示参数向量,则函数厂( 口) 被称为假设,函数集合 厂( 口) 】称 为假设空间。 最早提出的分类模型是最大间隔分类器。对于线形可分数据,可以作为简单 介绍易于理解,但是不能被广泛采纳实际应用。这里我们定义一个线形超平面 ( w ,b ) 。向量w 是权重向量,我们需要在正点x + 和负点x 一之间实现函数间隔为1 。 由以下两个等式表示: w 。x + b = 1 ( 2 - 3 ) 几何间隔y 能够如下计算: 7 2 毒 一 。2 4 , 2 赤( ( w 。) 一( w x - ) 1 : 为了找到这两个超平面间最大距离7 ,必须最小化1 1 w 0 。 即: m i n i m i z e w ,6 ( w w ) s u b j e c tt 0 乃( ( w x f ) + 6 ) 1 ,i = 1 ,刀 ( 2 5 ) 进一步,这个超平面能够被对偶表示: 厂( x ,口,6 ) = 主咒( x x f ) + 6 ( 2 6 ) 在现实情况中,非线性样本情况也是存在的,所以我们引入线形变换矽( x ) : ( x ,口,6 ) = 羔咒删( x 。) 7 ( x ) + 6 ( 2 7 ) 2 3 核函数 尽管如此,在1 9 9 2 年,b e r n h a r db o s e r , i s a b e l l eg u y o n 和v a p n i k 提出通过运用 核函数解决非线性问题,并取得不错实验结果4 5 1 。我们可以定义核函数: 电子科技大学硕士学位论文 k ( x ,z ) = ( 妒( x ) 妒( z ) ) ( 2 8 ) 其中,矽为两个自变量函数的特征映射,可以通过求解内积得到此映射,但这个函 数需满足有限半正定性质。 定理( m e r c e r 条件) :设定x 为一个彤的紧凑子集,七为一个连续对称函数。 对于积分因子五:厶( x ) _ 厶( z ) ( t k f ) ( ) = r 尼( 吖) 厂( x ) 出 ( 2 9 ) 为正,即有: k j j ( 础) 厂( x ) 厂( z ) 砒o ( 2 1 0 ) 我们在收敛序列形式下展开k ( x ,_ z ) : k ( x ,z ) = 谚( 石坊( z ) ( 2 1 1 ) j = l 。 2 这时,级数8 哆( x ) 0 是收敛的。 j = l 由上可得,只要核函数k ( x ,z 1 满足m e r c e r 条件,则对应特征空间可用内积表示。 核函数的封闭性质: 令白、屯为定义在x 彳上的核,x r “,a er + ,厂( ) 为实值函数, 妒:xjr ,缸是定义在r _ 上的核,b 是一个,l ,l 半正定矩阵,则下列核 函数成立: ( 1 ) k ( x ,z ) = 岛( x ,z ) + 岛( z ,z ) ( 2 ) k ( x ,z ) = 口局( z ,z ) ( 3 ) k ( x ,z ) = 岛( x ,z ) 如( x ,z ) ( 4 ) k ( x ,z ) = 厂( x ) 厂( z ) ( 5 ) k ( x ,z ) = 包( 妒( x ) ,矽( z ) ) ( 6 ) k ( x ,z ) - x 瑟 定理:令毛( x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论