(计算机应用技术专业论文)基于统计模式的人脸识别.pdf_第1页
(计算机应用技术专业论文)基于统计模式的人脸识别.pdf_第2页
(计算机应用技术专业论文)基于统计模式的人脸识别.pdf_第3页
(计算机应用技术专业论文)基于统计模式的人脸识别.pdf_第4页
(计算机应用技术专业论文)基于统计模式的人脸识别.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机应用技术专业论文)基于统计模式的人脸识别.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 人脸识别是生物特征识别技术的一个主要方向,与其他生物特征相比,人脸 识别具有主动、方便等许多优点。该领域的研究具有广泛的应用价值,可用于身 份鉴别、信息安全、人机交互等多方面。 本文介绍了人脸识别技术的研究背景及发展过程,简单阐述了人脸识别各个 模块的基本功能。主要从人脸图像总体信息出发,对基于统计模式的人脸识别方 法进行了更加深入的研究,提出了改进的方法。 在特征提取部分,提出了使用d l d a 与k d d a 算法对特征进行提取。d l d a 算法采取了对类内离散度矩阵和类间离散度矩阵同时进行特征分析,克服了传统 的p c a 、f i s h e r f a c e s 算法计算复杂的缺点;k d d a 算法利用了基于核的分析方 法,首先通过非线性变换将原始空间变换到高维空间,使得样本线性可分,然后 再利用d l d a 方法提取最优的特征向量,它避免了利用线性方法处理问题产生 的缺陷。 在分类器设计部分,重点研究了径向基函数网络分类器在人脸识别方面的应 用。提出了利用非监督学习与监督学习结合的聚类算法,确定隐层基函数的参数, 解决了常用的k 均值算法等存在的问题;学习过程包括正反两个阶段,通过调整 权值、计算误差、修正隐层单元的参数,以达到最优结果。克服了常用方法中收 敛速度慢,局部极小等问题。 通过对o r l 图像库中的人脸图像进行训练和检验,表明改进的径向基函数网 络分类器具有学习能力强、收敛速度快的优点。只要选取的特征合适,识别率能 够达到9 5 以上,优于最近邻分类器。所以本文采用的算法具有很强的实用性。 关键词人脸识别;特征提取;分类器设计:径向基函数网络分类器 北京工业大学工学硕士学位论文 a bs t r a c t f a c er e c o g n i t i o ni so n eo ft h e m a i ni n t e r e s t so fb i o m e t r i ci d e n t i f i c a t i o n t e c h n o l o g y c o m p a r e dw i t ho t h e rb i o m e t r i c ,f a c er e c o g n i t i o nh a sm a n ya d v a n t a g e s , s u c ha s :i n i t i a t i v e ,c o n v e n i e n c e t h er e s e a r c hi nt h i sf i e l dh a sf o u n daw i d er a n g eo f a p p l i c a t i o n s ,f r o mi d e n t i t ya u t h e n t i c a t i o n ,i n f o r m a t i o ns e c u r i t y t oh u m a n - c o m p u t e r i n t e r a c t i o n t h i sa r t i c l ef i r s ti n t r o d u c e st h eb a c k g r o u n da n dd e v e l o p m e n to ff a c er e c o g n i t i o n t e c h n o l o g y , t h e l lt h eb a s i cf u n c f i o n so f e a c hm o d u l eh a sb e e nd i s c u s s e di nb r i e t h e r e s e a r c hi s b e g i n n i n gf r o mt h eh n l i s t i ci n f o r m a t i o no ff a c ei m a g e s m o r ed e t a i l e d d i s c u s s i o n sh a v eb e e nc o n c e r n e db a s e do i lt h es t a t i s t i c a lp a r e mo ff a c er e c o g n i t i o n s o m e i m p r o v e d m e t h o d sh a v eb e e n p r e s e n t e d i nt h ep a r to ff e a t u r e e x 仃a c f i o n ,d l d aa n dk d d aa l g o r i t h m sh a v eb e e n a d o p t e d t oe x t r a c tf e a t u r e s d 一乙d a a l g o r i t h m 1 i e st l l ei d e ao fs i m u l t a n e o u s l y e i g e n a n a l y s i s b o t hb e t w e e n c l a s ss c a t t e rm a t r i xa n dw i t h i n c l a s ss c a t t e rm a t r i x , w h i c hs o l v e sc o m p u t a t i o n a lp r o b l e m sa s s o e i a t e dw i t ht r a d i t i o n a lp c aa n df i s h e r f a e e s a l g o r i t h m s b yu s i n g k e r n e l b a s e da n a l y s i sm e t h o d k d d a a l g o r i t h m f i r s tn o n l i n e a r l y m a p s t h e o r i g i n a li n p u ts p a c e t oah i g h - d i m e n s i o n a lf e a t u r e s p a c e ,w h e r e t h e d i s t r i b u t i o no ff a c ep a t t e r n si sh o p e dt ob el i n e a r i z e d t h e nt h ed l d am e t h o di s i n t r o d u c e dt od e r i v et h e o p t i m a l d i s e r i m i n a n tv e c t o r si nt h ef e a t u r e s p a c e 1 1 1 e a l g o f i t h m a v o i d st h ep r o b l e me x i s t e di nl i n e a rm e t h o d s i nt h ep a r to fc l a s s i f i e rd e s i g n ,t h ea r t i c l ep a y sm o r ea t t e n f i o nt ot h er e s e a r c ho f r a d i a lb a s i sf u n c t i o nn e u r a lc l a s s i f i e ri nt h ea p p l i c a t i o no ff a c er e c o g n i t i o n i m p r o v e d c l u s t e r i n ga p p r o a c hc o m b i n e du n s u p e r v i s e dl e a r n i n gw i t hs u p e r v i s e dl e a r n i n gh a s b e e np r o p o s e dt od e t e r m i n et h e p a r a m e t e r s o fh i d d e nn o d e s w h i c hs o l v e st h e p r o b l e m so f c o n v e n t i o n a lk - m e a n sc l u s t e r i n g l e a r n i n gp r o c e d u r ec o n s i s t so ff o r w a r d p a s s a n db a c k w a r d p a s s t h r o u g ha d j u s t i n gw e i g h t ,c o m p u t i n g e r r o rr a t ea n d m o d i f y i n gt h ep a r a m e t e r so f h i d d e nn o d e s ,o p t i m a lr e s u l t sw i l lb ea c h i e v e d t h e a l g o r i t h m a v o i d st h es l o w c o n v e r g e n c es p e e d a n dl o c a lm i n i m ae x i s t e di n c o n v e n t i o n a lm e t h o d t h r o u g h 廿a i m n ga n dt e s t i n gt h ei m a g e si n t h eo r lf a c ed a t a b a s e ,w ec a n c o n c l u d et h a tt h ei m p r o v e dr a d i a lb a s i sf u n c t i o nn e u r a lc l a s s i t i e rh a st h ea d v a n t a g eo f s t r o n gl e a r n i n ga b i l i t ya n df a s tc o n v e r g e n c es p e e d t h er e c o g n i t i o na c c u r a c yw i l lb e a b o v e9 5 w h e nt h es e l e c t e df e a t u r e sa r es u i t a b l e a sar e s u l t t h ea d o p t e da l g o r i t h m s h a v es t r o n g p r a c t i c a l i t y k e y w o r d s f a c e r e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;c l a s s i f i e rd e s i g n ;r a d i a l b a s i s f u n c t i o nn e u r a lc l a s s i f i e r i i 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人己经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:日期 关于论文使用授权的说明 p 印、5 够 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名黝彤导师签名: 日期:盔丝:! 7 芦 第l 章绪论 第1 章绪论 1 1 课题研究的目的和意义 随着社会的发展,各个方面对快速有效的自动身份验证的要求日益迫切。由 于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份 验证的最理想依据。个人身份的生物特征主要包群1 ,2 】:虹膜特征、视网膜特征、 讲话人的语音特征、人脸特征、指纹特征等。其中,利用人脸特征进行身份验证 又是最自然直接的手段,相比其它人体生物特征,它具有直接、友好、方便、成 本低、可靠等特点,易于为用户所接受。因而在众多的生物测定技术中倍受青睐。 人脸是人类视觉中最为普遍的模式,人脸所反映的视觉信息在人与人的交流 和交往中有着重要的作用和意义。计算机人脸识别技术试图使计算机具有人的脸 像识别能力口】。依托于图像理解、模式识别、计算机视觉和神经网络等技术,人 脸识别技术在近三十年里得到了广泛的关注和研究。 人脸识别技术具有广阔的应用前景,机关单位的安全和考勤、网络安全、银 行、海关边检、物业管理、军队安全、计算机登录系统等方面都可以用到人脸识 别技术。在机关等单位,基于人脸识别的门禁系统既可以保障单位的安全,又可 以对职工自动进行考勤:在电子商务、国际贸易、银行交易等场合,人脸识别技 术可以在一定程度上克服口令和密码的缺陷;在银行系统,人脸识别系统不需任 何电子或机械的“钥匙”,可以减少因丢失钥匙、遗忘密码而带来的问题。 目前人脸识别技术在一定应用范围内已经获得了成功,并且正在被推向以下 的应用领域。 身份鉴别 人脸作为一种高普遍性、可以非接触式采集的重要生物特征,可以用以进行 身份鉴别。人脸识别技术可以被应用在多种不同的安全领域:证件( 如:驾驶执 照、护照) 中的身份认证;楼宇进出的安全控制;重要场所中的安全检测和监控; 智能卡中的身份认证。 信息安全 人脸识别技术在信息安全领域也有着巨大的潜在应用价值。随着网络技术日 益走进人们的日常生活,越来越多的用户可以访问互联网,越来越多的信息被置 北京工业大学工学坝士学位论文 入互联网。而由于网络信息访问的便捷性,网络的安全控制成为一个日益迫切的 重要问题。利用人脸识别技术,可以进行计算机的登录控制,可以进行应用程序 的安全使用、数据库的安全访问和文件加密,可以实现局域网和广域网的安全控 制,可以保护电子商务的安全性。 人机交互 人脸识别技术可以用于创建友好自然的人机交互方式,是智能计算机领域研 究的重要内容之一。一个可以识别使用者人脸的智能计算机,可以按照其特点为 该使用者提供工作环境,从而使人与计算机之间的交互如同人与人之间的交互一 样轻松自如。 图像库检索 人脸识别技术还被用在图像库检索技术中,在大型人脸库中检索出与索引脸 像相同或相近的脸像。例如:公安部门可以利用人脸识别技术进行罪犯库的管理 和查询。 在日常生活中,人们识别周围的人用的最多的就是人脸,因而人脸识别是一 种最容易被接受的身份鉴定方法。由于人脸识别具有非侵犯性、直接、友好、方 便的特点,因此它是人们最容易接受的身份鉴别方式。一般的人脸识别系统通过 c c d 摄像机将脸像采集、提取特征、存储在模板库中,在身份鉴别时首先将脸 像从背景中分割出来,再把现场采集的图像与库中模板进行比对。 随着网络技术和桌上视频的广泛采用,图像捕捉设备正在成为个人计算机的 标准外设,同时电子商务等网络资源的利用也对身份验证提出了新的要求。因此, 人脸识别成为最有潜力的生物身份验证手段。 1 2 国内外研究状况及分析 人脸识别是人类视觉最杰出的能力之一,它的研究涉及模式识别、图像处理、 生物学、心理学、认知科学,与基于其它生物特征的身份鉴别方法以及计算机人 机感知交互领域都有密切联系。 人脸识别早在六七十年代就引起了研究者的强烈兴趣【”。2 0 世纪6 0 年代, b l e d s o e 提出了人脸识别的半自动系统模式与特征提取方法。7 0 年代,美、英等 发达国家开始重视人脸识别的研究工作并取得进展。1 9 7 2 年,h a r m o n 用交互人 第1 章绪论 脸识别方法在理论上与实践上进行了详细的论述。同年,s a k a i 设计了人脸图像 自动识别系统。8 0 年代初t m i n a m i 研究出了优于s a k a i 的人脸图像自动识别 系统。但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进 入九十年代,由于各方面对人脸识别系统的迫切需求,人脸识别的研究变得非常 热门。人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,如: k a r h u n e n - - l 0 6 v e 变换等或新的神经网络技术。人脸识别研究得到了前所未有的 重视,国际上发表有关人脸识别等方面的论文数量大幅度增加,仅从1 9 9 0 年到 2 0 0 0 年之间,e i 可检索到的相关文献多达数千篇,这期间关于人脸识别的综述 也屡屡可见。 国外有许多学校在研究人脸识别技术,研究涉及的领域很广。这些研究受到 军方、警方及大公司的高度重视和资助。国内的一些院校也开始从事人脸识别的 研究,上海交通大学、清华大学、复旦大学等都在这方面做过不少工作。 1 3 研究中的不足及发展趋势 人脸识别是一个跨学科富挑战性的前沿课题,但目前人脸识别还只是研究课 题,尚不是实用化领域的活跃课题。虽然人类可以毫不困难地由人脸辨别一个人, 但利用计算机进行完全自动的人脸识别存在许多困难,其表现在:人脸是非刚体, 存在表情变化;人脸随年龄增长而变化;发型、眼镜等装饰对人脸造成遮挡;人 脸所成图像受光照、成像角度、成像距离等影响。 人脸识别的困难还在于图像包括大量的数据,输入的像素可能成百上千,并 且每一像素都携带了大量的信息,计算的复杂度将会增加。现有的识别方法中, 通过从人脸图像中提取出特征信息,来对数据库进行检索的方法速度快,而利用 拓扑属性图匹配来确定匹配度的方法则相对慢。然而随数据库增加,前者的识别 率要比后者下降得快,因此改进的思路是将两者相结合,首先用快速的特征信息 匹配,来缩小检索范围,再进行拓扑图慢匹配,此外,用减小拓扑图存储量的方 法也能够加快匹配速度,但这需要提取有效特征和去掉冗余信息。另外,在大多 数的数据库中,存储的图像都是单样本人脸图像,能提取的特征信息非常有限, 识别起来比较困难。 由于人脸识别的理论还不完善,具体算法的实现也有很多的因素待研究,因 北京工业大学工学硕士学位论文 此计算机人脸识别的实用化还需要众多研究人员的不懈努力。但是人脸识别是生 物特征鉴别技术的一个主要方向,与其他生物特征相比,人脸识别依然具有主动 性、非侵犯性和用户友好等许多优点。因此,计算机人脸识别研究具有较为广泛 的意义。 1 4 人脸识别技术涉及的理论 模式识别 模式识别系统由两个过程所组成:设计和实现【5 】。设计是指用一定数量的样 本( 训练集或学习集) 进行分类器的设计。实现是指用所涉及的分类器对待识别 的样本进行分类决策。模式识别系统主要由4 个部分组成:数据获取,预处理, 特征提取和选择,分类决策。 本文研究的人脸识别实际上就是一个模式识别的问题,也就是利用计算机实 现人的模式识别能力,每一个人就是一个模式,预先存储在数据库里的图像就是 样本,人脸识别的最终目的是:输入新的待识别图像,利用计算机进行处理,判 别待识别的人究竟与数据库里的哪个人是同一个人。 神经网络 神经网络技术作为智能科学的领头羊,是近年来发展起来的一门十分活跃的 交叉学科。它涉及生物、电子、计算机、数学、物理等学科,有着广泛的应用前 景。 人工神经网络是由人工神经元互联组成的网络,它是从微观结构和功能上对 人脑的抽象、简化、是模拟人类智能的条重要途径,反映了人脑功能的若干基 本特征,如并行信息处理、学习、联想、模式分类、记忆等。本文在分类器设计 部分还有更加详细的论述。 计算机视觉 计算机视觉是计算机科学和人工智能的一个重要分支。它的研究目的和内容 有两个方面,一是如何用计算机实现部分人类视觉的功能,二是由此帮助理解人 类视觉的机理。通常,人类进行人脸识别依靠的感觉器官包括视觉、听觉、嗅觉、 触觉等,一般人脸的识别可以用单个感官完成,也可以是多感官相配合来存储和 检索人脸,而计算机的人脸识别所利用的则主要是视觉数据。另外,计算机人脸 第1 章绪论 识别的进展还受限于对人类本身识别系统的认识程度。研究表明,人类视觉数据 的处理是一个分等级的过程,其中最底层的视觉过程( 视网膜功能) 起信息转储的 作用,即将人眼接收的大量图像数据变换为一个比较规则的紧凑表达形式。 心理学和神经生理学 生理学的研究表明,人眼视网膜上存在着低层次和高层次的细胞。其中,低 层次的细胞对空间的响应和小波变换的结果相似:而高层次的细胞则依据一群低 层次细胞的响应,而做出具体的线、面乃至物体模式的响应。以此为依据,在计 算机人脸识别中,可以将那些通过大量图像数据简单处理后获得的特征定义为低 层次特征,而将线、面、模式等描述特征定义为高层次特征。 具体说来,远处辨认人,主要是整体识别,而在近距离的人脸识别中,特征 部件的识别则更重要。另外,人脸的各部件对识别的贡献也不相同,如眼睛和嘴 巴的重要程度大于人的鼻子,人脸上半部分重要性大于人脸下半部分,其中特别 的人脸更容易被识别记住,没有个性的人脸相对就需要更长的时间来辨认。根据 对人脑的研究表明,人脸的表情识别和人脸识别虽然存在联系,但总体说是分开 的、并行的处理过程。这些结论对于设计有效的识别方法起到了定启发作用。 1 5 本文主要研究内容 本文对于基于统计模式的人脸识别技术进行了定的研究,利用计算机完成 了人脸的识别。它的主要功能是对于输入的人脸图像,提取其中蕴含的特征信息, 并将其与已知人脸库中的人脸进行对比,从而鉴别每个人脸的身份。 在特征提取过程中,采用了d l d a 与k d d a 算法,通过与传统的p c a 、 f i s h e r f a c e s 算法进行分析与比较,可以表明:d l d a 算法克服了传统算法计算 复杂的缺点;k d d a 算法利用基于核的非线性分析方法解决阀题,避免了光照、 成像角度等外在因素对于线性方法处理问题产生的缺陷。 在分类器设计过程中,主要研究了径向基函数网络分类器在人脸识别中的应 用,对于径向基函数网络中参数的选择以及网络的学习过程都提出了改进的方 法。经过多次的实验表明,径向基函数网络分类器学习能力强,收敛速度快,识 别率优于最近邻分类器,具有较高的实用性。 北京工业大学工学硕士学位论文 本文对于人脸自动识别技术的研究包括特征提取、分类器设计两个主要功能 模块,它的组成结构和功能如图卜1 所示: 图卜1 人脸识别结构图 f i g u r e l 一1t h e s l r u c t u r eo f f a c er e c o g n i t i o n 本文分为五章: 第一章:人脸识别的研究背景以及发展状况进行简要的介绍; 第二章:阐述人脸识别的一些基本技术环节,对当前的人脸识别技术进行 介绍和比较: 第三章:基于人脸整体信息进行特征提取与选择: 第四章:分类器的设计,着重阐述径向基函数网络分类器; 第五章:实验结果与分析: 最后结论部分是对本文研究工作的总结。 一6 一 第2 章人脸识别技术 第2 章人脸识别技术 2 1 简介 完整的计算机人脸识别至少要包括两个主要技术环节【“。首先,就是要在输 入图像( 或图像序列) 中找到人脸的位置,并将人脸从背景中分割出来;其次, 根据分割后的人脸图像进行特征提取与识别。人脸特征主要包括人脸的全局特 征、几何特征、各个器官的特征等。与指纹识别的不同之处在于,脸像会随着表 情、年龄等的变化而发生改变;而且光线、背景和姿态等变化对人脸识别的效果 也会有或多或少的影响,如何消除这些因素的影响是人脸识别的难点所在。 一人脸识别的分类 鉴另i ( i d e n t i f i c a t i o n ) :鉴别回答“是谁”。将给定的人脸图像与计算机中存储 的n 个人的图像逐个比较,输出m 幅图像,按照与给定图像的相似度从大到小 排列,再由人来确定这是谁。 验i t 正( v e r i f i c a t i o n ) :回答“是否为某人”。将给定的人脸图像与计算机中存储 的某人的图像比较,回答给定的图像是否为某人的图像。 监控( w a t c hl i s t ) :监控同时具有鉴别和验证,回答“这是否为要找的人”。将 未知身份的人的图像输入计算机,计算机决定这个人是否在监控名单中,如果在, 还必须确定这个人的身份。 一技术流程 通常一个完整的人脸识别过程主要由5 个功能模块组成:人脸定位模块、预 处理模块、特征提取模块、人脸图像训练模块和识别模块。如图2 1 所示: 人脸定位模块完成从原始图像中确定出人脸的位置,得到人脸图像以便后续 处理。在具体摄像条件可控制时,这一步还可省去。 预处理模块完成对人脸图像的大小归一化、消除噪声、灰度归一化等,可视 具体应用而选用,以便在同一条件下完成训练和识别。 特征提取模块完成提取人脸特征,如何提取稳定和有效的特征是识别系统成 败的关键。 北京工业大学工学硕士学位论文 人脸图像训练模块完成对已有人脸图像库的训练,得到参数以供识别模块完 成判别。它是人脸识别研究的核心,与所采用的算法关系极大。 识别模块根据训练所得的参数完成人脸的最后判别工作。 圈2 一1 人脸识别流程图 f i g u r e 2 1t h ef l o wc h a r to f f a c er e c o g n i t i o n _ 识别指标 人脸识别系统的指标主要有人数、正识率、拒识率和识别时间。 正识率是指属于该系统的某个人被正确判定是谁的概率。 拒识率是指不属于该系统的人被正确判定为不属于该系统的概率。 在本文中识别率就是正识率。实际应用中,以上几个指标中可以根据具体情 况加以折衷。系统都是在一定限制条件下达到一定指标,一般而言,限制越多, 则越容易识别,识别率越高。 人脸的特征提取与人脸识别关系较密切,很多场合认为它们属于同一个阶 段,本文所研究的主要就是这个阶段的工作,所以下面对于人脸的检测和定位作 一个简要的阐述。 2 2 人脸的检测与定位 人脸检测是指在输入图像中确定所有人脸的位置与大小,人脸检测系统的输 入是可能包含人脸的图像,输出是关于图像中是否存在人脸以及人脸的数目、位 置、尺度等信息的参数化描述。 然而人脸作为人类自身再熟悉不过的一个组成部分,其检测问题却是一个极 第2 苹人脸识别技术 具挑战性的课题。首先人脸是一个包含五官、毛发等的极不规则的复杂待测目标, 不同的人脸在形状、大小、颜色、质地等方面有很大的变化性:其次为了实现检 测方法的鲁棒性,要考虑人脸在各种复杂的背景中,不同的方向、角度、尺度等 情况下所展现出来的不同表象;再次,所给予的检测对象或环境大多是由图像捕 捉设备所采集的数字图像或视频流中的数字图像序列。所以采集条件特别是光照 条件包括光源的方向、明暗、色彩等都会对图像的效果产生很大的影响,进而影 响对人脸的检测;另外,人脸上还可能长有胡须、戴有眼镜或其他饰品等,这些 也同样是设计一种有效的人脸检测算法时不可忽视的因素。 可见人脸检测有一定的难度和复杂性,但对这一问题的深入研究必将推动模 式识别等计算机科学分支的发展。人脸的检测问题在近十年中得到了广泛的关 注,国内外很多研究人士提出了很多方法,在不同领域取得了一定进展。但是对 于一种能够普遍适用于各种复杂情况的准确率很高的检测算法,还有很大的探索 空间。 人脸检测的方法大致可分为基于知识和基于统计两类。基于知识的人脸检测 方法主要是利用人的先验知识对待检测对象建立若干规则从而将人脸检测问题 转化为假设验证问题;基于统计的人脸检测方法将人脸图像看作一个高维矢量 把对人脸检测的问题转化为对高维空间中分布信号的检测问题。 2 3 人脸识别方法综述 虽然人脸识别方法的分类标准可能有所不同,但是目前的研究主要有两个方 向 7 - 9 1 :一类是从人脸图像整体( h o l i s t i ca p p r o a c h e s ) 出发,基于图像的总体信 息进行分类识nc i o - 1 5 。它重点考虑了模式的整体属性,其中较为著名的方法有: 人工神经网络的方法、统计模式的方法等。另一类是基于提取人脸图像的几何特 征参数( f e a t u r e b a s e da p p r o a c h e s ) ,例如眼、嘴和鼻子的特征,再按照某种距离 准则进行分类识别 1 6 。1 引。这种方法并不非常有效,因为人脸不是刚体,有着复杂 的表情,对其严格进行特征匹配会出现困难。 下面分别介绍一些常用的方法,前两种方法属于从图像的整体方面进行研 究,后三种方法主要从提取图像的局部特征进行研究。 北京工业大学工学硕士学位论文 2 3 1 基于特征脸的方法 特征脸方法( e i g e n f a c e ) 是从主元分析方法p c a ( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 导出的一种人脸分析识别方法,它根据一组人脸图像构造主元子空间,由于主元 具有人脸的形状也称作特征脸。识别时将测试图像投影到主元子空间上得到了一 组投影系数,然后和各个已知人的人脸图像进行比较识别,取得了很好的识别效 果。在此基础上出现了很多特征脸的改进算法。 特征脸方法原理简单、易于实现,它把人脸作为一个整体来处理,大大降低 了识别复杂度。但是特征脸方法忽视了人脸的个性差异,存在着一定的理论缺陷。 研究表明:特征脸方法随光线角度及人脸尺寸的影响,识别率会有所下降。 2 3 2 基于神经网络的方法 神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主 要是k o h o n e n 自联想映射神经网络,用于人脸的“回忆”。所谓“回忆”是指当 输入图像上的人脸受噪声污染严重或部分缺损时,能用k o h o n e n 网络恢复出原来 完整的人脸。i n t r a t o r 等人用一个无监督监督混合神经网络进行人脸识别。其输 入是原始图像的梯度图像,以此可以去除光照的变化。无监督学习的目的是寻找 类的特征,有监督学习的目的是减少训【练样本被错分的比例。这种网络提取的特 征明显,识别率高,如果用几个网络同时运算,求其平均,识别效果还会提高。 与其他类型的方法相比,神经网络方法在人脸识别上有其独到的优势,它避 免了复杂的特征提取工作,可以通过学习的过程获得其他方法难以实现的关于人 脸识别的规律和规则的隐性表达。此外,神经网络以并行方式处理信息,如果能 用硬件实现,就能显著提高速度。神经网络方法除了用于人脸识别外,还适用于 性别识别、种族识别等。 2 3 3 弹性图匹配法 弹性图匹配方法是一种基于动态链接结构d l a ( d y i l a m i c l i n k a r c h i t e c t u r e ) 的方法2 0 1 。它将人脸用格状的稀疏图表示,图中的节点用图像位置的g a b o r 小波 分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先寻 第2 章人脸识别技术 找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产 生一个变形图,其节点逼近模型图的对应点的位置。弹性图匹配方法对光照、位 移、旋转及尺度变化都不敏感。此方法的主要缺点是对每个存储的人脸需计算其 模型图,计算量大,存储量大。为此,w i s k o t t 在原有方法的基础上提出聚束图 匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相应目标上。 对于大量数据库,这样可以大大减少识别时间。另外,利用聚束图还能够匹配不 同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相关信息。 2 3 4 基于模板匹配的方法 模板匹配法是一种经典的模式识别方法2 1 2 2 】,这种方法大多是用归一化和互 相关,直接计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目标 要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的 工作。最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的 椭圆。另一种方法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、 鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓, 而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的 边缘,也很难从中自动提取所需的特征量。 模板匹配方法在尺度、光照、旋转角度等各种条件稳定的状态下,它的识别 的效果优于其它方法,但它对光照、旋转和表情变化比较敏感,影响了它的直接 使用。 2 3 5 基于人脸几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小 和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和 结构关系的几何描述,可以作为人脸识别的重要特征。几何特征最早是用于人脸 侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著 点导出一组用于识别的特征度量如距离、角度等。采用几何特征进行正面人脸识 别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形 状作为分类特征。 北京工业大学工学硕士学位论文 定位眼睛往往是提取人脸几何特征的第一步,由于眼睛的对称性以及眼珠呈 现为低灰度值的圆形,因此在人脸图像清晰端正的时候,眼睛的提取是比较容易 的,但是如果人脸图像模糊,或者噪声很多,则往往需要利用更多的信息( 如眼 睛和眉毛、鼻子的相对位置等) ,而且这将使得眼睛的定位变得很复杂。而且实 际图像中,部件未必轮廓分明,有时人用眼看也只是个大概,计算机提取就更成 问题,因而导致描述同一个人的不同人脸时,其模型参数可能相差很大,而失去 识别意义。尽管如此,在正确提取部件以及表情变化微小的前提下,该方法依然 奏效,因此在许多方面仍可应用,如对标准身份证照片的应用。 2 4 本章小结 本章简要介绍了人脸识别技术,论述了人脸识别各个模块的主要功能,阐述 了人脸识别技术中的两个主要阶段:人脸的检测和定位,以及人脸的特征提取和 识别。由于实验中使用的人脸图像都是经过归一化后的标准图像。所以研究中不 再进行预处理这一步,主要研究的是人脸的特征提取和识别。 本章重点介绍了人脸识别中常用的一些方法,特征脸方法、神经网络的方法 是从人脸图像的整体出发进行研究:模板匹配法、弹性图匹配法、以及基于几何 特征的方法是对人脸图像的局部特征进行研究。它们有着各自的优缺点: _ 特征脸法:原理简单、易于实现,它把人脸作为一个整体来处理,大大降低 了识别复杂度。但是特征脸方法忽视了人脸的个性差异,存在着一定的理论 缺陷。研究表明:特征脸方法随光线角度及人脸尺寸的影响,识别率会有所 下降。 神经网络法:避免了复杂的特征提取工作,可以通过学习的过程获得其他方 法难以实现的关于人脸识别的规律和规则的隐性表达,其识别效果较好。但 是可能随着神经元数目的增多,会导致训练时间变长 弹性图法:整体识别性能优于特征脸方法,但计算量以及存储量都很大,使 得识别速度较慢。 一模板匹配法:在尺度、光照、旋转角度等各种条件稳定的状态下,它的识别 效果优于其它方法,但它对光照、旋转和表情变化比较敏感,影响了它的直 接使用。 第2 章人脸识别技术 _ 基于几何特征法:符合人类识别人脸的机理,易于理解;对每幅图像只需存 储一个特征矢量,存储量小:对光照变化不太敏感。但是从图像中抽取稳定 的特征比较困难,特别是特征受到遮挡时;对强烈的表情变化和姿态变化的 鲁棒性较差:一般几何特征只描述了部件的基本形状与结构关系,忽略了局 部细微特征,造成部分信息丢失,更适合于粗分类。 总的来说,基于整体脸的识别不仅保留了人脸部件之间的拓扑关系,而且也 保留了各部件本身的信息,而基于特征的识别则是通过提取出局部轮廓信息及灰 度信息来设计具体识别算法。因此,基于整个人脸的分析要优于基于局部特征的 分析,理由是前者保留了更多信息。但是这种说法也值得研究,因为基于人脸特 征的识别要比基于整体的方法来得直观,它提取并利用了最有用的特征,如关键 点的位置以及部件的形状分析等,而对基于整个人脸的识别而言,由于把整个人 脸图像作为模式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因 此如何能够有效地去掉这些干扰比较关键。虽然如此,对于基于特征分析的人脸 识别,如何建立好的模型来表达识别部件依然是个难点。如果特征模型选择不好, 那么就会影响整个识别效果。所以本文依然选择从图像的整体出发进行研究。 本章只是对目前应用于人脸识别的技术作了选择性的介绍,由于人脸识别的 理论还不完善,具体算法的实现也有很多的因素待研究,因此计算机人脸识别的 实用化还需要众多研究人员的不懈努力。 北京工业大学工学硕士学位论文 第3 章人脸的特征提取 3 1 特征提取和选择 为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本 质的特征,这就是特征提取和选择的过程。人脸图像存在着复杂的变化,因此如 何提取有效的特征,是人脸识别研究中的一个主要问题。通常人脸特征的提取, 可以分为两个主要方向: 根据人脸图像的全局信息提取特征 提取人脸的几何特征参数 提取人脸的几何特征更加直观,如:眼睛、鼻子、嘴等,但是如何确定这些 关键点的正确位置以及对人脸上各个部件形状的分析,依然是个难点。从人脸的 全局出发提取特征,虽然可能受到光照、表情、姿态等的影响,但是可以对提取 的特征进行选择,去除那些属于外在因素影响的特征,保留最本质的特征。 3 2 本文中研究的特征提取方法 本文研究的特征提取方法是从人脸图像整体出发,基于图像的总体信息进行 分类识别,它重点考虑了模式的整体属性,对基于统计模式的特征提取方法进行 了较为深入的研究。通过与传统的p c a 、f i s h e r f a c e s 方法进行比较和分析,采用 了d 。l d a 和k d d a 方法,无论在理论上,还是在计算复杂度上,都得到了进一 步的提高。 对于计算机中的一幅图像,用f ( x ,y ) 表示,那么在任意点( x ,y ) 上的厂值正 比于图像在该点的亮度( 灰度级) 。在计算机中,图像f ( x ,y ) 在空间坐标上和亮 度上都已经被离散化。因此可以把一幅数字图像看成一个矩阵或一个数组,用 b ( i ,) 表示,其行和列标出了图像上的一个点,而矩阵中的相应元素的值则标出 了该点的灰度等级。 第3 章人脸的特征提取 3 2 1p c a 方法 理论基础: p c a ( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 方法的理论基础是k l 变换,k l 变换是 图像压缩中的一种最优正交变换。人们将它用于统计特征提取,从而形成了子空 间法模式识别的基础。若将k l 变换用于人脸识别,则需假设人脸处于低维线性 空间,且不同人脸具有可分性。由于高维图像空间k l 变换后可得到一组新的正 交基,因此可通过保留部分正交基,以生成低维人脸空间。而低维空间的基则是 通过分析人脸训练样本集的统计特性来获得。k l 变换的生成矩阵可以是训练样 本集的总体散布矩阵,也可以是训练样本集的类间散布矩阵,即可采用同一人的 数张图像的平均来进行训练,这样可在一定程度上消除光线等的干扰,且计算量 也得到减少,而识别率不会下降。其中,采用主分量作正交基的方法称为主分量 方法僻c a ) 。 k l 交换在9 0 年代初受到了很大的重视,实际用于入脸识别也取得了很好的 效果,其识别率从7 0 1 0 0 不等,这取决于人脸库图像的质量。从压缩能量的 角度来看,k l 变换是最优的,它不仅使得从n 维空间降到m 维空间前后的均方 误差最小,而且变换后的低维空间有很好的入脸表达能力。 具体思想: p c a 方法认为图像的全局结构信息对于识别最重要,将图像看作一个矩阵, 计算矩阵的特征值和对应的特征向量进行识别。 一幅n x n 大小的人脸图像可被视为2 维空间中的一个点。当把这样的人 脸图像归一化后,这些图像在这一超高维空间中不是随机或散乱地分布的,而是 存在某种规律,通过p c a 方法用一个低维子空间描述人脸图像,同时又保存所 需要的识别信息。 假设人脸图像库中有个图像,用向量表示为五,x :工。( 向量维数设为 三) ,其人脸平均图像为: 以w2 专荟五( 3 - i ) 由此可得到每幅图像的均差为: z i = x ,一z 。,i = 1 , 2 ,( 3 - 2 ) 这样可计算协方差矩阵: c = 吉z ( z ) 7 ( 3 3 ) 智”“ 计算矩阵c 的特征值 和对应的特征向量,这些求出的特征向量所形成 的向量空间,就可以表示人脸图像的主要特征信息。将人脸图像库中所有个 图像均向此空间投影,得到各自的投影向量墨,e ,: ( z ) 7 = 陟。,y 。l 江1 ,2 ,n 。( “,) 7 爿t ,= 1 ,2 ,上( 3 - 4 ) 对于待识别的人脸图像x ,将计算其与五。差的投影向量r : 乃= ( ”,) 7 ( j 一兄。) ,= l ,2 ,l ( 3 5 ) 再与人脸图像库中n 个人脸图像对应的投影向量i ,巧,y 比较,按照一 定的规则完成识别。 实际计算中,矩阵c 的大小是上上,即使对尺寸较小的图像,其值也很大。 为了求矩阵特征值和对应的特征向量,直接计算十分困难,所以需要降维。将每 幅图像的均差形成一个矩阵: x = 防:,z i ,x 0 】 ( 3 6 ) 则协方差矩阵可写成 c :上彳( x ) 7 、 。 ( 3 7 ) 根据线性代数理论,将计算z 。( x ) 的特征值 和对应特征向量心的问题转 化为求( x ) 7 x 。的特征值 和对应特征向量h ,( x ) z 。的大小仅为n ,一 般都远小于三,因此可以简化计算。在求出唯后,可由下式得到: 1 “= 莘x 。v k ( 3 8 ) q ,l l 将特征值从大到小排序,其对应的特征向量为巩。这样,每一幅人脸图像 都可以投影到由“。,“:,u 。组成的子空间中,每幅人脸图像对应于子空间中 的一个点。同样子空间中的任一个点也对应于一幅图像。这些图像很像人脸,被 称为“特征脸”,任何一幅人脸图像都可以表示为这组“特征脸”的线性组合。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论