已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 一直以来。人脸识别是一个难点众多、备受各国关注的科研课题。很多国家 对人脸识别研究投入大量的经费,它有着广泛的应用前景。本文从纯代数的角度 出发,解决了从幅大数据量的图像中如何提取主成分的问题,即实现了主元特 征的提取。 本文对已有的各种人脸识别特征提取算法进行归纳总结,并分析其优劣。分 析结果表明主成分分析是目前应用比较成功且广泛的方法。于是,对主成分分析 的神经网络算法进行进一步探讨和研究,对a p e x 算法做了理论推导得出改进算 法,并采用o r l 图像库下载的图像对改进的算法进行了验证。 在对图像进行主元提取之前,运用了前人的成果对下载的图像进行了一些预 处理,这些预处理都是为了方便试验并且不影响试验结果。采用的预处理方法为 目前比较常用但实用的一些方法。 对图像进行特征提取之后,对原来的算法和改进后的算法进行了一些算法分 析和比较。并对提取出的主元特征进行了简单的人脸图像重构,获得良好的效果。 本文主要对人脸识别中主元特征提取算法进行分析,将a p e x 算法进行了理 论推导和改进,使得提取速度有了较大的提高。并且对后续工作的前景进行展望, 提出了一些自己的观点。 关键宇人脸识别;主元特征;特征提取:主成分分析:人工神经网络 a b s t r a c t f a c er e c o g n i t i o ni s a l w a y sas c i e n t i f i cr e s e a r c hp r o b l e mw h i c hh a sl o t so f d i f f i c u l t i e sa n di ss u p p o r t e da n d p a i da t t e n t i o nt ob ye v e r yc o u n t r y m a n yc o u n t r i e s h a v eb e e n s p e n d i n gm u c hm u c hm o n e y i nf a c er e c o g n i t i o n r e s e a r c h ,b e c a u s ei tw i l l b ea p p l i e df a ra n dw i d e t h i s p a p e rs o l v e sap r o b l e mf r o m aa l g e b r a v i e w , t h a th o w t o e x e c u t et h ep r i m a r yc o m p o n e n t a n a l y s i sf r o mai a r g eo fp i c t u r ed a t a ,a , s r e a l i z et h e p r i m a r yf e a t u r ee x a c t i o n t h i sp a p e rs b r n su pf o ra l lk i n d so fe x i s t e n tf e a t u r ee x a c t i o na r i t h m e t i cf o rf a c e r e c o g n i t i o na n dc o m p a r e st h e i rs u p e r i o r i t ya n di n f e r i o rp o s i t i o n i tc a nb ec o n c l u d e d t h a tt h ep r i m a r y c o m p o n e n ta n a l y s i sm e t h o di sae f f e c t i v ea n dp o p u l a rm e t h o d t h e n , t h en n ( n e r v en e t w o r k ) a r i t h m e t i co ft h ep r i m a r yc o m p o n e n ta n a l y s i si sd i s c u s s e d m o r ea n dc o n c l u d e di nt h e o r yt h ei m p r o v e da r i t h m e t i cf o ra p e xa r i t h m e t i c a tl a s t , t h ei m p r o v e da r i t h m e t i ci se x a m i n e di ne x p e r i m e n t a t i o n ,i nw h i c ht h ep i c t u r e su s e d a r ef r o mo r lf a c ep i c t u r ed a t a b a s e b e f o r et h ep r i m a r yc o m p o n e n te x a c t i o n ,t h ep i c t u r e s ,d o w n l o a d e df r o mo r l , a r e p r e t r e a t e du s i n go t h e rp e o p l e sr e s e a r c hh a r v e s ti n o r d e rt oh a v ee x p e r i m e n t s u c c e s s f u l l ya n da l lo fp r e t r e a t m e n td on o ta f f e c tt h ee x p e r i m e n t t h ep r e t r e a t m e n t m e t h o d sa r ep o p u l a ra n d a p p l i e d a f t e rf e a t u r ee x a c t i o nt ot h ep i c t u r e ,s o m ec o m p a r i s o na n da n a l y s i sb e t w e e nt h e f o r m e ra r i t h m e t i ca n dt h e i m p r o v e d h a v e b e e nt a k e n t h e n ,t h ef a c e i m a g e r e c o n s t r u c t i o ni sm a d ea c c o r d i n ga st h ep r i m a r yf e a t u r e sa n dt h eg o o de f f e c t i s g a i n e d t h i sp a p e ra n a l y z e sm a i n l yt h ef e a t u r ee x a c t i o na r i t h m e t i cf o rf a c er e c o g n i t i o n , a n dc o n c l u d e st h ei m p r o v e da p e xa r i t h m e t i ct h e o r e t i c a l l ys ot h a tt h ee x a c t i o ns p e e d h a sa na d v a n c et ot h eo l d e r a tt h ee n do ft h ea r t i c l e ,t h i sp a p e ri n t r o d u c e st h er e c e n t a d v a n c e dm e t h o d sa n dt h ep r o s p e c t so f t h ef o l l o w i n gw o r k k e yw o r d s :f a c er e c o g n i t i o n ;p r i m a r y f e a t u r e ;f e a t u r ee x a c t i o n ;p r i m a r y c o m p o n e n ta n a l y s i s ;a r t i f i c a l n e r v en e t w o r k 1 t 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及 取得的研究成果尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 北京工业大学或其它教育机构的学位或证书而使用过的材料与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示了谢意 签名醛嗍4 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以 公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保 存论文。 ( 保密的论文在解密后应遵守此规定) 签名;醯师签名:经叠丝日期:弘壁垂! 兰:7 第1 章绪论 第1 章绪论 在人脸识别过程中,原始图像的大量数据中包含着许多彼此相关的因素,是 信息的重复和浪费,而且,过多的数据造成占用大量的存储空间和机器处理时间; 哪些特征是人脸识别中的重要因素? 哪些特征是系统识别中的冗余信息? 因此, 去除冗余信息、选择主要特征,在人脸识别研究中至关重要。 本文介绍了一种以神经网络实现主成分分析的结构和算法,并对a p e x ( a p t i v ep r i n c i p a lc o m p o n e n te x t r a c t i o n ) 算法进行修改和分析。通过实验验证这 种修改后的算法比原来的算法更具有先进性。 1 1 背景 随着社会的发展,各个领域对快速有效的自动身份验证的要求日益迫切。由 于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特 征是身份验证的最理想依据。所谓人体生物特征识别技术,是依据人体本身所固 有的生理特征( 面像、指纹、掌纹、视网膜、虹膜、签名、语音等) 或行为特征, 利用图像处理和模式识别技术来达到身份鉴别或验证的目的。人体生物特征识别 技术主要包括:人脸识别、指纹识别、掌纹识别、虹膜识别、语音识别、签名识 别和视网膜识别等。其中,人脸识别技术作为最自然、最直接、最容易隐蔽使用 的识别技术,是当今国际反恐安防最重视的科技手段和攻关目标之一。 人脸识别是当前人工智能和模式识别的研究热点。它可以用于身份认证、公 共场合对人的监视、图像数据库的检索、提高人和计算机的交互能力等。与其他 的识别方法,如虹膜、指纹、d n a 检测等相比,人脸识别具有直接、快速、方 便等特点,容易为用户接受。因此,人脸识别的应用必定有广大的市场前景。尤 其在国家重要机关、社会安防及经济领域具有广泛而特殊的用途。自从美国遭遇 恐怖袭击后,这一技术更是引起广泛关注。 北京1 + 业大学理学硕士学位论文 1 2 当前的研究现状 人脸识别涉及人工智能、模式识别、智能控制、数字图像处理、生理学、心 理学、认知科学等领域,是- r 涉及数学、计算机科学、自动化技术和电子工程 技术的边缘学科。 早在六七十年代。人脸识别就引起了研究者的强烈兴趣。进入二十世纪九十 年代以后,由于各方面对人脸识别系统的迫切需求,人脸识别的研究变得非常热 门。 目前,美国等国家有许多研究组织在从事人脸识别的研究,这些研究受到军 方、警方及大公司的高度重视和资助,美国军方每年还专门组织人脸识别比赛以 及关注这一领域的发展。在国内,也有很多的学校( 清华大学智能技术与系统国 家重点实验室、上海交通大学模式识别实验室等) 和研究所( 中科院计算所,自动 化所等) 进行人脸的相关研究。 近几年人脸识别的研究取得了很大的进步,国际上发表有关论文的数量也大 幅度增加。i e e e 的p a m i 汇刊也专门出版了人脸识别的专辑,每年的国际会议 ( 如,i c c v 、i c p r ) 上关于人脸识别的专题也屡屡可见。第三届中国生物识别学 术会议学术报告中,人脸识别专题的报告题目是最多的。 到现在为止,人脸识别实验库中以美国军方的f e r e t 库最为权威。另外, m i t 、o r l 等图像库可以用来验证某些算法或者在某方面的能力。在国内,自动 化所也向国内研究人员提供人脸图像特征库。 人脸的特征提取和识别主要面临的问题有: 图像采集过程中的不确定性 天气、光照条件的改变,使得获取的图像可能模糊甚至混乱;由于仪器的原 因也会造成信息不完全或者信息丢失。这些都会给将来的特征提取和识别工作增 加难度。 预处理技术的不成熟性 由于现阶段的预处理技术( 如图像分割、增强等) 也在研究阶段,没有完全 成熟,就不存在一种最好的预处理技术。因此,如果对图像的预处理不是很到位, 那么对以后的特征提取会带来无法估量的后果。 第1 章绪论 1 1 1 1 i _ 皇皇墨薯蕾岛曼曼曼量曼鼍皇薯量矗量曼岛_ 曩墨皇皇毫目量墨皇薹皇舅蔓曼葛皇摹穗 人脸模式的多样性 不同年龄段或不同肤色的人脸,正面或是侧面等等,哪怕是某人脸上有一颗 不该出现的痣,也可能会使程序发生识别错误。 快速高效的限制性 为了能达到实际应用的水平,必须要求能够在及短时间内的对人脸进行正确 的识别,这就对提取特征的要求很高。因此在保证识别率的同时不能让算法过于 复杂,特别是禁用n p 算法,而大多数的传统方法时间复杂度都较大,无法达到 实时的要求。这就要求改进算法或者提出更好的算法,寻求一种快速精确的特征 提取和识别的方法。 由于这些因素的影响,各国的研究都还处在摸索和研发阶段。迄今为止还没 有正式的人脸识别软件产品问世。 本文当前的研究也仅限于一定基础上的应用研究。 1 3 应用范围 人脸识别的应用范围非常广泛,这也是各个国家都积极支持的重要原因,它 主要包括: 公安布控、监狱监控; 司法认证、民航安检、口岸出入控制; 海关身份验证、银行密押、司机驾照验证、智能身份证; 智能门禁、智能视频监控、智能出入控制; 各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证; 社会保险身份验证、绝密文件加密等。 尽管人脸识别技术尚未完全成熟,不能达到实用化的要求,但是已经有 很多国家都试图在一些固定场合使用人脸识别系统。目的就在用于推动此项 技术的发展。 北京: 业大学理学硕士学位论文 1 4 人脸识别的框架及主元特征的提取方案 人脸识别是人类视觉最杰出的能力之。任何正常的成年人都可以很迅速的 从一幅人脸照片中精确地标出各个特征点的位置,究竟大脑采用的是种什么算 法,才能在极短的时间内精确地做到这一步呢? 没有人知道。看似非常简单的一 个目标,用计算机实现起来却并不那么容易。人脸识别的研究涉及模式识别、图 像处理、计算机视觉、生理学、心理学、认知科学它与基于其他生物特征的身 份鉴别方法以及计算机人机感知交互领域都有密切的联系。 人脸识别系统包括4 个主要技术环节: a ) 人脸图像的定位与分割:从一定的场景中检测人脸的存在并进行定位, 分割出一个人脸。这是一个极为重要的步骤,如果不甚将会给以后的工 作带来麻烦。这个步骤的结果主要受获得人脸图像的仪器和分割技术影 响。 b ) 人脸图像的预处理:为方便提取特征,这个步骤主要是对采集到的图像 进行各种处理,e 匕如:除去噪声、增强边缘等。 c ) 人脸图像的特征提取:采用某种方法表示出数据库中的已知人脸和检测 出的人脸,通常的方法有几何特征、代数特征、固定特征模板等。本文 主要是对人脸图像的代数特征进行研究。 功人脸图像的识别:根据上一步得出的特征,选择适当的判别策略将待判 的人脸图像与已知人脸相比较,并得到判别结果。 这四个环节的研究独立性都很强。由于在很多特定情况下,背景不复杂造成 “定位与分割”比较简单。只有近几年人们逐渐关心复杂情形下的人脸自动识别 系统,人脸定位才得到较多的重视。因此,“特征提取与识别”这一节得到了更 为广泛和深入的研究。 本文也只是对“特征提取”这一环节进行了一些研究,其流程如下图1 - 1 : 第1 章绪论 - 改 进 网 的 a 呻巨r p e i jx 算 法 1 5 本文结构 图1 1 流程图 本文第二章介绍了数字图像处理及相关领域的基础知识:第三章主要介绍了 人脸图像特征提取的一些主要方法和技术,侧重介绍p c a 原理和应用:第四章 主要介绍了a p e x 神经网络的结构、算法以及特点:第五章着重讲述a p e x 的 改进和此改进算法在人脸图像特征提取中的应用;第六章对全文进行了分析总 结。 北京工业大学理学硕士学位论文 i l li _ 蕾霸置_ - 皇l 矗_ 墨l _ 量量| 皇曼曼摹皇皇基曼曼_ 皇量皇量墨_ 皇皇囊墨皇_ 蔓置皇曼皇量| 皇舞罾 第2 章图像预处理、相关领域及一些说明 人脸识别、数字图像处理都是近几十年发展起来的新兴学科,跨越了许多领 域。为此,本章将迸行一些相关的简要介绍。 2 1 数字图像处理概念 数字图像的处理是在以电子计算机为中心,包括各种输入、输出及显示设备 在内的数字图像处理系统上进行的,是将连续的模拟图像变成离散的数字图像 后,用建立在特定的物理模型和数学模型基础上编制的程序( 软件) 控制,运行 并实现种种要求的处理。 利用计算机对图像信息的处理,其处理特点可以基本分成两大类: 一类是以最终恢复原图像为前提的信息压缩和用与原图像相异的形式有效 的表现和显示图像的图像变换处理。基于图像数据压缩的图像传输和存储,通过 图像变换来改善图像的增强和恢复,都属于这一类。 另一类对图像的处理,主要是提取特征信息,其处理的最终目的是为了识别。 处理时,对于那些用于判别景物的特征信息给予抽取,而其他信息则尽量予以舍 弃,达到高度的信息压缩,并根据抽取的特征信息进行分类和识别。这一类对图 像的计算机处理,属于数字模式识别的范畴。 2 2 灰值图像的数字化 为了利用数字计算机来处理图像,首先必须把连续的图像变换成离散的数字 图像。一幅数字图像厂 ,y ) 是在其空间坐标上和灰度上都离散化并进行数字编 码的图像。图像厂0 ,y ) 在空间坐标上的离散化称为采样;图像,扛,y ) 在灰度上 的离散化则称为量化。经过采样和量化,图像f ( x ,y ) 可以用一个矩阵来表示, 取行和列的交点标出图像的每个像素,每一像素对应一个灰度值。为实现数字化, 灰度值必须离散,例如分成个等级。一般量化与采样数值都取为2 的正整数幂。 6 第2 章图像预处理、相关领域及一些说明 如一幅图像用1 1 2 行x 9 2 列的矩阵来表示( 即像素数为5 1 2 x 5 1 2 ) ,灰度量化2 5 6 ( 2 的8 次方) ,那么其二进制信息量为:1 1 2 x 9 2 x8 = 8 2 4 3 2b i t 。 2 3 涉及的领域 图像处理涉及了多种学科理论和应用知识,包括人工智能、计算机视觉、机 器人技术、拓扑学等多种学科。下面我们大概简单介绍下。 人工智能:人工智能简称a l ( a r t i f i c i a li n t e l l i g e n c e ) ,是一门5 0 年代中期才诞 生的新兴学科。人工智能学者认为,计算机不仅是一种会做数学计算的机器,而 且能做原来只有人才能做的具有智能的工作。人工智能就是用计算机来模拟人的 思维和行为,如问题求解、学习、推理、理解自然语言等。 人工智能的研究是多方面的,但从根本上来说,一是问题求解中的搜索问题, 二是知识信息的处理问题即获取知识,表达知识和利用知识。搜索是经典人工 智能研究的核心。知识及其表示、基于知识的推理以及机器学习是当代人工智能 研究的热门课题。 计算机视觉:计算机视觉就是用计算机模拟人的眼睛和大脑,对客观世界进 行视觉感知和解释。众所周知,视觉对人类来说是最有用的,但也是最复杂的一 种感知周围环境的手段。随着科学技术的日益发展,计算机视觉的应用范围正在 不断扩大。计算机视觉是入工智能及第五代计算机的关键因素之。计算机视觉 的一般目的是根据从某一景物的图像中提取的信息对这一景物作结构描述、识别 和理解。 模式识别:模式识别问题指的是对一系列过程或事件的分类和描述。要加以 分类的一系列过程或事件可以是一系列物理的对象,也可以是一些比较抽象的如 心理状态等。具有某些相类似的性质的过程或事件就分为一类。对于一个具体问 题,模式类的总数由具体应用所决定。 人工神经网络:人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ,简称 a n n 1 是在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能 行为的一种工程系统。早在上世纪4 0 年代初期,心理学家m cc u l l o c h 、数学家 p i t t s 就提出了人工神经网络的第一个数学模型,从此开创了神经科学理论的研究 北京工业大学理学硕士学位论文 时代。其后,e r o s e n b l a t t 、w i d r o w 和j j h o p f i e l d 等学者又先后提出了感知模型, 使得人工神经网络技术得以蓬勃发展。人工神经网络是由大量的神经元广泛互连 而成的系统,它的这一结构特点决定着人工神经弼络具有高速信息处理的能力。 由于人工神经网络中神经元个数众多以及整个网络存储信息容量的巨大,使得它 具有很强的不确定性信息处理能力。即使输入信息不完全、不准确或模糊不清, 只要输入的模式接近于训练样本,系统就能给出正确的推理结论, 数字图像处理:数字图像处理一般都用计算机处理或实时的硬件处理,因此 也称之为计算机图象处理。优点:处理精度高,内容丰富,可以进行非线性处理。 缺点:处理速度比较慢,这和目前的硬件条件和算法都有一定关系。后面将更详 细讲述图像处理部分,这里不再详述。 图像平滑:图像平滑实际上是利用低通滤波器( 1 0 w p a s sf i l t e r ) 将图像中的噪 声点进行有效的衰减,使噪声对图像所产生的影响减小到人们视觉可以接受的程 度。在灰度连续变化的图像中,如果出现了与相邻像素的灰度相差很大的点, 比如说一片较暗的区域突然出现了一个亮斑。这种情况被认为是一种噪声。在频 域下,我们知道灰度突变代表了一种高频分量。那么,我们利用低通滤波器可以 滤掉图像频谱中的高频分量,从而达到减少噪声的目的。由于本文对平滑有具体 应用,下面一节将详细介绍。 遗传算法:遗传算法是3 i - i o l l a n d 在7 0 年代受生物进化论思想启发而提出的 一种基于自然选择和群体遗传机理搜索最优解的概率算法,对自然选择和自然遗 传过程中发生的繁殖、杂交和变异现象进行模拟。在求解问题时,一个可能的解 被编码成一个染色体,若干染色体即个体构成种群产生初始神群后,根据目标 函数或适应度估算公式给出染色体的适应度值,利用该值选择个体构成种群。产 生初始种群后,根据目标函数或适应度估算公式给出染色体的适应度值,利用该 值选择个体作为父代来复制子代。选择操作体现了适者生存原理,适应度值高的 个体被选中的机会也大。选择出的父代再以一定的交叉概率和变异概率进行交叉 和变异操作而产生子代。这样,通过复制、杂交和变异逐代进化,积累染色体的 优势,直到某个子代中出现适应度值足够高的满意解。 支持向囊机器( s v m ) :s v m 是基于统计学理论的学习方法,它通过构造最 优超平面,使得对未知样本的分类具有最优的推广能力。根据结构风险最小化归 第2 章图像预处理、相关领域及一些说明 纳原则。为了最小化期望风险的上界,s v m 通过最优超平面的构造,在固定学 习机经验风险的条件下最小化v c 置信度( v a p n i k - - c h e r v o n e n k i sc o n f i d e n c e ) 对 于两类线性可分情形,可直接构造最优超平面。使得样本集中的所有向量满足如 下条件:( 1 ) 能被某一超平面正确划分;( 2 ) 距该超平面最近的异类向量与超平面 之间的距离最大,即分类间隔最大。其中,条件( 1 ) 是保证经验风险最小,条件( 2 ) 是使vc 置信度最小,从而使期望风险最小。这里,最优超平面的构造问题实质 上是约束条件下求解一个二次规划问题。 隐马尔可夫模型:人脸的隐马尔可夫模型是一种用参数表示的,用于描述随 机过程统计特性的概率模型。隐马尔可夫过程是一个双重的随机过程:一个潜在 的过程称为“状态”过程。另一个可观测过程称为“观察序列”,观察序列是由 隐含的状态过程决定的。 2 。4 预备知识以及说明 常用的定义 邻域和邻接:对于任意像素( f ,力,把包含该像素在内的一个集合称为( f ,) 的 邻域。从直观上看,这是像素( i ,) 及其邻近某些像素组成的一个小区域。在数 字图像处理中,最常用的是某像素的4 邻域和8 邻域。 像素的4 邻域:对像素( f ,) ,将它以及其上( f i ,力、t ( i + i ,) 、左( f ,j 一1 ) 、 右( f ,+ 1 ) 四个点构成的集合,称为像素( i ,) 的4 邻域。有时也称4 近邻。如图 2 一l 所示。 像素的8 邻域:对像素( f ,j ) ,将它和上、下、左、右四个像素以及对角线 的四个像素构成的集合,称为像素( f ,- ) 的8 邻域。有时也称8 近邻。如图2 - - 2 所示。 北京工业大学理学硕士学位论文 ( i - i j ) ( i j 一1 )( i j )( i 一1 ) ( i + 1 j ) 图2 1 ( i j ) 4 - 邻域 ( i 一1 j - 1 )( i - 1 j )( i - 1 j + 1 ) ( i j - 1 )( i j )( j j + 1 ) o + i j i )( i + 1 j )( i + 1 j + 】) 图2 2 ( i j ) 8 - 邻域 像素微分:用f ( x ,_ y ) 表示数字图像的像素( x ,y ) 的灰值,z 厂表示像素关于x 的一次微分,一厂表示灰值关于y 的一次微分。a ;2 表示像素灰值关于x 的二 次微分,2 ,表示像素关于y 的二次微分。在实际操作中用差分来实现微分效 果,它们的计算如下表示: 蚶= 等锁x + l , y h ( w ) ,_ ,= 面a f = f ( x , y + 1 ) 似,y ) ,2 厂= ,( x + 1 ,y ) ,( x ,y ) = ,( 工+ l ,y ) + 厂( x l ,y ) 一2 f ( x ,y ) ,2 厂= ,( x ,y + 1 ) 一,( x ,y ) = 厂( x ,y + 1 ) + 厂( x ,y 一1 ) 一2 f ( x ,y ) 模板:利用模板( t e 唧l 砒e ) 实现图像平滑是“将原图中每一点的灰度和它周 围8 个点的灰度进行加权加法运算,然后将结果除以模板系( t e m p l a t e c o e f f i c i e n t ) ,作为新图中对应点的灰度( 色度) ”。这其中我们最常用的是g u a s s 吉c 幻 去2 三。i24 1( b ) 1 6 i1:11 。 ( a ) 是b o x 模板,( b ) 是g u a s s 模板,中间的黑点表示中心元素,即 第2 苹图像预处理、相关领域及一些说明 一点和周围8 个的平均来去除突然变化的点,从而滤掉一定的噪声,其代价是 图像有一定程度的模糊,b o x 模板是将中心点的邻域点一视同仁,忽略它们的 位置关系,所以这种模板的平滑效果并不理想。实际上我们可以想象离中心点 越近的点对该点的影响应越大,反之亦然。所以,我们应该在模板中引入加权 系数,也就是( b ) 式,g u a s s 模板:离中心点越近,加权系数越大。 图像的说明 文中使用的图像向量是指将二维的图像按列排成的列向量,这个列向量共 5 6 x 4 6 维。下文中使用的n = 5 6 4 6 。 2 5 本章小结 本章主要介绍了数字图像处理以及相关领域的主要研究内容及其所涉及的 研究范围,图像的数字化以及一些相关知识。 北京工业大学理学硕士学位论文 第3 章特征提取的主要方法 特征提取的方法种类繁多,各种提取方法都有大量的研究人员在研究、试用。 下面简单介绍一下目前较为常见的一些方法。 3 1 现阶段的主要方法 人脸识别大概可以分为三个发展阶段。第一阶段,早期的人脸识别为了识别 面部特征,主要依赖于人工操作( 主要代表是b e r t i l i o n ) ;第二阶段主要是采用 人机交互的手段进行识别,利用几何特征数来表示人脸特征,根据该方法设计的 识别系统已经能够比较快地识别人脸( 代表性的工作是k a y a ) ;第三阶段是真正 利用机器进行对人脸的自动识别,随着计算机的快速化和人脸识别方法的发展, 提出了许多种人脸自动识别的系统。 下面简要介绍目前些常用的特征提取及识别方法: 1 、基于几何特征的方法 这类识别方法首先将人脸用一个几何特征矢量表示,用模式识别中的层次聚 类思想设计分类器对人脸进行识别。它要求该矢量具有一定的独特性,可以反映 不同人脸特征的差别。由于该方法对脸部的偏移非常敏感,要求有一定的弹性, 以消除时间跨度和光照的影响。 识别工作的流程大体如下:首先检测出面部特征点,通过测量这些关键点之 间的相对距离,得到描述每个脸的特征矢量,比如眼睛、鼻子和嘴的位置和宽度, 眉毛的厚度和弯曲程度等,以及这些特征之间的关系。用这些特征来表示人脸。 比较未知脸和库中已知脸的特征矢量,来决定最佳匹配。 这种方法的缺点是:这些特征的准确提取较难实现。r o d e r 对这种方法的精 确性进行了实验性的研究,结果不容乐观。到目前为止,这种方法在实践中尚没 有成功的应用。 改进方法: 可变形模板法( 或称为活动梭板模型) ,基本思想是:设计一个参数可调的 器官模型( 即可变形模板,如下圈) ,定义一个能量函数,通过调整模型参数使 黛圣蔓 麟 卜_ 广+ 1 叫= 磊二叫上。” 北京工业大学理学硕士学位论文 化坐标系统。即对这个人脸子区域的坐标进行降维,使得每个人脸图像可以用很 少几个参数来表示,这就大大地降低了人脸识别的计算复杂度。下面将会对这种 方法进行详细介绍。 假如一副人脸图像由n 个象索组成,则它可以表示成一个n 维的矢量。 设 r i l i = 1 , 2 ,m ) 是人脸图像的训练集合。这m 个图像的平均人脸可以 表示成: 巾= ( r i ) ,m 则每个人脸r i 与平均人脸巾的脸差i 为: a 滓r i o ;i = l 2 ,m 训练图像集的协方差矩阵可按如下建立: c = a a t 其中:a = 【al ,2 ,a m 】 协方差矩阵c 的正交特征矢量就是人脸空间的基本矢量,称作本征脸 ( e i g e n f a c e ) 。 一般大小的图像,直接计算n n 矩阵c 的特征矢量非常困难,所以需要一 种简化方法。因为训练图像的数目通常要比图像的象素数要少的多,只有m 1 个( 而不是n 个) 有意义的特征矢量。所以首先通过计算m m 的矩阵l 的特 征矢量v i ( i = l ,。m ) 来计算本征脸。 l = a t a 矩阵c 的特征向量ui ( i = l 2 ,m ) ,可以表示为差脸ai ( i = l 2 ,m ) 以 v i ( i = l 2 ,m ) 为权值的线性组合。 u = 【ul ,u2 ,u 砌= a1 ,a2 ,m v l ,v 2 ,v 砌= a v 在实际的识别情况,更少的本征脸数m ( m - - 0 c ,则认为输入图像不是入脸图像。 如果 0 c 并且v k ,6k 0 c ,则认为输入图像包括一个未知人脸。 如果( o c 并且”- = r a i n k k ) o c ,则认为输入图像包含个体k + 的人脸。 基于代数特征的识别方法,特别是本征脸方法在应用中是比较成功的。 p e n t l a n d 等经过试验得到了相当好的结果,在2 0 0 个人的3 0 0 0 幅图像中得到9 5 的正确识别率,在f e r e t 数据库上对1 5 0 幅正面人脸象只有一个误识。 但是,该方法也存在一定的弊病,如光照、角度的稍微偏移,识别率都会急 剧下降。对表情更是无能为力。还有,在特征提取之前有大量的预处理工作。 改进方法; 1 、子空间选择法:由于特征值大的特征向量( 特征脸) 并不一定是分类性 能好的方向。就有了特征向量的选择问题。选择出来的特征向量构成原空间的一 个子空间。故叫做子空间选择法。 2 、局部特征方法:考虑到它是非局部化的,其核函数的支集扩展在整个坐 标空间中,同时它是非拓扑的,而局部性和拓扑性对模式分析和分割是理想的特 性,因此寻找具有这种特性的表达十分重要。基于此,a t i c k 提出基于局部特征 的人脸特征提取与识别方法。 3 、基于k l 变换的识别方法:它以类间散布矩阵为产生矩阵,通过k - - l 北京工业大学理学硕士学位论文 变换降维并提取人脸图像的代数特征,同时利用遗传算法进行特征选择,以构成 有利于分类的自适应子空间。在此子空间内,将图像进行正交分解,然后分别对 各类训练样本进行二次k l 变换,进一步构成其旋转予空间,从而最终实现了 一个分层次的最小距离分类器。 4 、神经网络方法 y a l e n t i n 等提出的一种方法:首先提取人脸的5 0 个主元。然后用自相关神经 网络将它映射到5 维空间中。再用一个普通的多层感知器进行判别,对一些简单 的测试图像效果较好; i n l r a t o r 等提出一种混合型神经网络( 分为非监督和监督神经网络) ,这种神 经网络对人脸图像进行训练,然后识别。 l e e 等人将人脸的特点用6 条规则描述,然后根据这6 条规则进行五官的定 位,将五官之间的几何距离输入模糊神经网络进行识别。 l a u r e n z 等人采用卷积神经网络方法进行人脸识别。 l i n 等提出基于概率决策的神经网络方法。 d a i 等提出h o p f i e l d 网络进行低分辨率人脸联想与识别。 还有,大量的研究人员用b p 神经网络进行人脸进行识别。 等等 神经网络方法比前几种方法具有一定的优势:在特征提取过程中很难对些 规则或者规律进行显性的描述,而神经网络可以通过训练隐性地表达这些规则, 具有较强的适应性。 5 、其它方法 a 。隐马尔可夫模型方法; b f a c er e c o g n i t i o n u s i n gc o m p o n e n t - b a s e ds v m c l a s s i f i c a t i o n c - ,j 、波方法等等。 上面简单介绍了目前科研人员主要使用的一些方法和技术。下面将主要介 绍和本文有关的p c a 相关知识。 1 6 第3 章特征提取的主要方法 曼恿i 圈置皇蔓量量日_ 皇墨皇墨皇曼皇皇! 曼舅量鼍曼皇皇鲁置皇e 曼章墨皇皇皇曼皇置皇舅詈 3 2p c a 原理与应用 主成分分析( p c a ,p r i m a r yc o m p o n e n ta n a l y s i s ) 是多元分析中最重要的方法 之一,它可以用几种不同的观点和方法来介绍。经典统计学家都认为,主成分分 析是确定个多元正态分布密度椭球面的主轴,而这些主轴由样本来估计。心里 学家则认为主成分分析是一种特殊的因子分析。 3 2 1p c a 原理 现在,从数据分析的角度出发,用一种与上不同的观点来考虑主成分分析。 在这种观点下,应用主成分分析不需要任何关于概率分布和基本统计模型的假 定。这种观点实际上是采用某种信息的概念,以某种代数或者几何准则最优化技 术对一个数据阵的结构进行描述和简化。 一个数据阵往往阶数很大,使人很难以抓住规律。主成分分析的主要任务就 是以某种最优方法综合一张数据表的信息。使得数据简化、降维而揭示它的主要 结构,同时提出关于数据阵所提供信息的合理解释,以期回答所要分析的问题。 在实际问题中,为了全面分析问题,往往涉及众多有关的变量x = ( x l ,x 2 ,x n ) ,但是变量太多不但会增加计算量的复杂性,而且也给合理地分析 问题和解释问题带来困难。一般来说,虽然每个变量都提供了一定的信息,但是 其重要性有所不同。实际上,众多变量间有一定的关系,通过主成分方法就可以 产生一些不相关的新变量y = ( y l ,y 2 ,y m ) ( m n ) ,并使得这些新变量带有尽可能 多的原有信息。这些新变量,称之为综合指标。这些综合指标的确定原则: 1 ) y i 是x 的线性函数,即要求y i = l 。1 x ,l i 是n 维待定的常数向量; 2 ) 要求d ( y i ) 尽可能大,即y ,能充分反应x 的变化情况; 3 ) 要求y l ,y 2 ,y m 互不相关,即c o v ( y i ,y j ) = o ,i j 。 这样,y 均称为x 的主成分。这是构造主成分的基本思想。 3 。2 。2p c a 的应用 为了获得特征脸,必须要先获得这样的投影轴:人脸图像在这个投影轴上的 1 7 北京工业大学理学硕士学位i 4 文 变化量最大。 由人脸向量x 求得的相关阵r = e ( x 一;) ( x ;) 7 ) 是n 行n 列的。所以, 半正定矩阵r 的特征根共有n 个。要求解r 的n 个特征根和n 个对应的特征向 量,是一个庞大的工程。 在具体实现中,采用大样本代替总体,所以r 的估计值为: 肛击秘_ - ) 函午1 m x x t 其中,1 1 1 是采用的样本数量,x n 。= 【( x 1 一;) ,( x 2 一;) ,( x ”一;) 】。 现在,证明r = i xx 7 的非零特征根个数和r ,:上) ( t x 一样,即相关阵r 的秩小于等于r r l 。 设震的特征根以,对应的特征向量是v 。,k = l ,2 ,n l ,则有: 一1x 7 x v = v 女 两边同时乘以x : z x x 7 v i ) = ( xv ) r 7 和r 具有相同的非零特征根,特征向量分别为:v 。和xv 。 所以,实际上只要求解r 的特征根和特征向量就能得到r 的特征根和特征 向量,并且r 实际上最多只有r r l 个非零的特征根。 3 3 小结 本章先总结了人脸识别特征提取的主要方法和技术,然后侧重讲述了主成分 分析的主要原理、算法和在图像中的应用。 第4 章a p e x 神经网络模型 第4 章a p e x 神经网络模型 本文主要是通过神经网络实现主元特征的提取,所以本章对a p e x 神经网络 作详细介绍。 4 1 人工神经网络 4 1 1 人工神经网络简介 “人工神经网络”( a r t i f i c i a l n e u r a l n e t w o r k ,简称a n n ) 是在对 人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工 程系统。早在本世纪4 0 年代初期,心理学家m e c u l l o c h 、数学家p i t t s 就提出了 人工神经网络的第一个数学模型,从此开创了神经科学理论的研究时代。其后, f r o s e n b l a t t 、w i d r o w 和j j h o p f i e l d 等学者又先后提出了感知模型,使得人工神 经网络技术得以蓬勃发展。 神经网络具有并行计算特性、分布式信息存贮和容错能力强以及具备自适应 学习功能等一系列优点。经大量样本训练后的神经网络,在识别字符时具有识别 率高和识别速度快等诸多优点。 神经网络模型是由大量处理单元广泛互连而成的网络。它反映了人脑功能的 基本特性,但并不是人脑的真实描写。网络的信息处理由神经元之间的相互作用 来实现:知识与信息存贮表现为网络元件互连间分布式的物理联系;网络的学习 和识别决定于各种神经元连接权的动态演化过程。 神经网络是一个具有高度非线性的超大规模连续时间动力系统,其最主要特 征为连续时间非线性动力学、网络的全局作用、大规模并行分布处理及高度的鲁 棒性和学习联想能力。同时它又具有一般非线性动力系统的共性,即不可预测性、 耗散性、不可逆性、高维性、广泛联结性与自适应性等。因此它实际上是一个超 大规模非线性连续时间自适应信息处理系统。 北京 :业大学理学硕士学位论文 量_ 高田量毫_ 簟皇_ 墨一t i l l j b i il i _ 舞摹舞醺 4 1 2人脸识别中主要使用的神经网络 下面将对用在人脸图像特征提取和识别中的神经网络进行进行简单介绍a b p 神经网络模型,如下图4 - 1 : 1 输出层1 0 2 4 + 输八层1 0 2 4 t 特征攫取网络。l 图4 - 1b p 神经网络模型 b p 提取网络的输入为标准化后人脸图像各点的灰度值( 经过处理后的) 。特 征提取网络的期望输出和其输入桐同。其隐层输出作为识别网络的输入,识别网 络的期望输出为赋予每个人的标识号。此网络可以根据训练人数的多少,适当增 加或者减少输出层的结点数。详细内容诸参看参考文献 3 3 1 a 自联想神经网络模型。如下图4 2 : 惧殍j n n 。 图4 - 2 自联想神经网络 2 0 第4 章a p e x 神经网络模型 上图是自联想神经网络用于提取、识别的示意。网络输入为人脸图像向量x , 输出为人脸图像逼近向量y ,隐层结点数少于输出点数。网络对输入的人脸图像 进行训练,使得输出y 是人脸图像的最佳逼近,即两者的距离小于或者等于预 定的阈值。此网络认为隐层输出足输入人脸图像的特征向量,再将该特征向量作 为识别神经网络的输入来训练识别神经网络,识别输出为r 。详细内容请参看参 考文献 3 0 1 。 当然,还有其他神经网络用于人脸特征的提取和识别,这里就不一一列举。 并且,有一些研究者在上述两种神经网络的基础上做了一些改进。 本章的下一节开始,介绍神网络和p c a 如何相结合使用。 4 2 o j a 的最大主元特征提取 最大主元的提取采用叠代方式,起源于数值分析方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东财经大学招考2名非事业编制工作人员易考易错模拟试题(共500题)试卷后附参考答案
- 广东清远市代建项目管理局招考工程造价管理人员易考易错模拟试题(共500题)试卷后附参考答案
- 校车接送运营协议书
- 广东中烟工业限责任公司2025年下半年度公开招聘员工171人易考易错模拟试题(共500题)试卷后附参考答案
- 山西大同市平城区医疗集团招聘119人易考易错模拟试题(共500题)试卷后附参考答案
- 冒名申请住房协议书
- 出租婚庆房屋协议书
- 宁波市江东区事业单位登记管理局招考编制外用工易考易错模拟试题(共500题)试卷后附参考答案
- 核酸委托检测协议书
- 格力股权激励协议书
- 离婚委托律师合同范本
- 2025 年事业单位招聘考试新闻类专业能力测 试试卷(新闻类)新闻评论写作与技巧
- 大学职业生涯规划课
- 2025黑龙江省交通投资集团有限公司招聘348人笔试历年备考题库附带答案详解2套试卷
- 《数控铣削编程与加工》试卷及答案
- 设备管理部经理竞聘
- 以能为本-2025年互联网职场新人流动趋势报告-脉脉高聘人才智库
- (2025年)事业单位招聘会计笔试题及答案
- 体检中心护理管理
- 2025年大学《新能源科学与工程-地热能利用技术》考试备考试题及答案解析
- 模拟日语教师招聘面试的流程与准备要点
评论
0/150
提交评论