(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf_第1页
(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf_第2页
(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf_第3页
(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf_第4页
(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(计算机软件与理论专业论文)基于核判别分析的人脸识别算法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨理工大学工学硕士学位论文 基于核判别分析的人脸识别算法 摘要 人脸识别是一个典型的图像模式分析、理解与分类计算问题,它涉及到 模式识别、图像处理、计算机视觉、统计学习和认知科学等多个学科。人脸 识别问题的深入研究和最终解决,可以极大的促进这些学科的成熟和发展。 同时作为生物特征识别主要研究内容之一的人脸识别技术在安全部门、身份 鉴别、数字监控等领域的应用前景十分广阔,研究人脸识别技术具有十分重 要的理论价值和应用价值。 本文首先介绍了人脸识别技术的研究背景和主要方法,然后针对人脸识 别技术中的关键环节一人脸图像预处理、特征提取和分类进行了深入研究。 人脸图像的预处理就是将由图像采集设备采集到的人脸图像调整成规范 化的图像,主要包括几何规范化和灰度规范化。 如何有效的从人脸图像中提取使之区别于其他个体的特征,是人脸识别 研究的一个关键问题。本文重点研究了基于线性投影的特征提取方法,以及 非线性核方法。对于线性投影方法,本文主要阐述了主成分分析( p c a ) 、线 性判别分析( l d a ) 方法,并且针对人脸识别中的小样本问题提出了先用p c a 方法减少特征空间维数,再利用l d a 实现对人脸的识别。 实际问题中原始样本的分布通常是高度复杂和非线性的,受支持向量机 理论中有关核方法的启发,本文把p c a 和l d a 进行了非线性推广,研究了 k p c a 和k f d a 两种非线性特征提取方法。在k f d a 方法中要求总体散度 矩阵可逆,而在人脸识别中该矩阵往往是奇异的。针对这一问题本文提出了 基于核的正交补空间法,该方法先在原始样本里利用核方法,在变换后的特 征空间里,利用正交补空间思想提取用于判别分析的特征,较好地解决了 k f d a 方法中的奇异性问题。 本文采用b p 神经网络对所提取的人脸特征进行训练和识别。在o r l 人脸数据库上的实验结果验证了本文方法的有效性。 关键词特征提取;核函数;小样本问题;入脸识别 哈尔滨理工大学工学硕士学位论文 f a c er e c o g n i t i o na l g o r i t h mb a s e do nk e r n e l d i :r i m i n a , n t anal)iscriminanta n a l y s l s a b s t r a c t a u t o m a t i cf a c er e c o g n i t i o ni sat y p i c a lp a t t e r na n a l y s i s ,u n d e r s t a n d i n ga n d c l a s s i f i c a t i o np r o b l e m ,w h i c hi sc l o s e l yr e l a t e dt om a n yd i s c i p l i n e ss u c ha s p a t t e r nr e c o g n i t i o n ,i m a g ep r o c e s s i n g ,c o m p u t e rv i s i o n ,s t a t i s t i c a ll e a r n i n g ,a n d c o g n i t i v ep s y c h o l o g ye t c t h ei n - d e p t hs t u d ya n df i n a ls e t t l e m e n to fa f r c a n g r e a t l yp r o m o t et h em a t u r i t ya n dd e v e l o p m e n to ft h i sd i s c i p l i n e s a so n eo ft h e m a i nr e s e a r c ha r e a si nb i o m e t r i c s ,f a c er e c o g n i t i o ni sb e l i e v e dh a v i n gag r e a t d e a lo fp o t e n t i a la p p l i c a t i o n si ns e c u r i t ys y s t e m ,h u m a ni d ,d i g i t a ls u r v e i l l a n c e a n ds oo n r e s e a r c h i n go nt h ef a c er e c o g n i t i o nt e c h n o l o g yh a sg r e a tt h e o r e t i c a l a n dp r a c t i c a lv a l u e s t h ed e v e l o p m e n ta n dm a i n l ym e t h o d so ff a c er e c o g n i t i o nt e c h n i q u ea r ef i r s t i n t r o d u c e di nt h i sp a p e r t h e nt h ep r o b l e mo fp r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o n a n dc l a s s i f i c a t i o na r ed i s c u s s e d t h ea i mo ff a c ei m a g ep r e p r o c e s s i n gi st or e g u l a r i z et h ef a c ei m a g ew h i c hi s c a p t u r e db yi m a g ec o l l e c t i n gd e v i c e st on o r m a l i z e di m a g e ,i ti n c l u d e st w os t e p s m a i n l y :g e o m e t r yn o r m a l i z a t i o na n dg r e yv a l u en o r m a l i z a t i o n ac e n t r a li s s u et oas u c c e s s f u la p p r o a c hf o rf a c er e c o g n i t i o ni sh o wt o e x t r a c td i s c r i m i n a t ef e a t u r ef r o mt h ef a c i a li m a g e s l i n e a ra n dn o n l i n e a rk e r n e l p r o j e c t i o na l g o r i t h m sa p p l i e df o rf e a t u r ee x t r a c t i o na r ef o c u so n a sf o rl i n e a r p r o je c t i o n ,p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) a n d l i n e a rd i s c r i m i n a n t a n a l y s i s ( l d a ) a r ee x p o u n d e d a sf a ra ss m a l ls a m p l es i z ep r o b l e m ,t h i sp a p e r p r o p o s e dan e wm e t h o d b a s e do np c aa n dl d a i nm a n yr e a l - w o r l da p p l i c a t i o n st h ed i s t r i b u t i o n so fo r i g i n a ls a m p l e sa r e u s u a l l yh i 曲l yc o m p l e xa n dn o n l i n e a r w et a k ea d v a n t a g e o ft h ek e m e lm e t h o di n s u p p o r tv e c t o rm a c h i n e ( s v m ) a n dr e s e a r c ho nk e r n e lp r i n c i p a lc o m p o n e n t a n a l y s i s ( k p c a ) a n dk e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s ( k f d a ) h o w e v e r ,i n i i - 哈尔滨理工大学工学硕士学位论文 k f d at h et o t a ls c a t t e rm a t r i xi s r e q u i r e dt ob ef u ur a n k ,w h i c hi ss e l d o m s a t i s f i e di nt h ef a c er e c o g n i t i o nt a s k s i no r d e rt oo v e r c o m et h i sp r o b l e m ,t h e o r t h o g o n a lc o m p l e m e n t a r ys p a c em e t h o db a s e do nk e r n e lm e t h o di sp r e s e n t e di n t h i sp a r t i nt h en e wa p p r o a c h ,t h ek e r n e lm e t h o di su s e df i r s t l yt op r o j e c tt h e o r i g i n a ls a m p l e si n t oa ni m p l i c i ts p a c ec a l l e df e a t u r es p a c eb yn o n l i n e a rk e r n e l m a p p i n g ,t h e nt w oe q u i v a l e n tm o d e l sb a s e do ng e n e r a l i z e df i s h e rc r i t e r i o nh a v e e s t a b l i s h e db yt h et h e o r yo fr e p r o d u c i n gk e r n e li nt h ef e a t u r es p a c e ,a n dt h e o p t i m a ld i s c r i m i n a n t v e c t o r sa r es o l v e d f i n a l l yb yu s i n gt h et e c h n i q u eo f o r t h o g o n a lc o m p l e m e n t a r ys p a c e a f t e rt h ef e a t u r e so ft h ei m a g e sa r ee x t r a c t e d ,ab a c kp r o p a g a t i o n ( b p ) a l g o r i t h mi si n t r o d u c e dt ot r a i nt h en e u r a ln e t w o r kf o rr e c o g n i t i o n t ov e r i f yt h e e f f e c t i v e n e s so ft h ep r o p o s e dm e t h o d ,e x p e r i m e n ti st e s t e do no r lf a c ed a t a b a s e t h ee x p e r i m e n tr e s u l t sd e m o n s t r a t et h ee f f e c t i v e n e s so ft h ep r o p o s e dm e t h o d s k e y w o r d s f e a t u r ee x t r a c t i o n ,k e r n e lf u n c t i o n ,s m a l ls a m p l es i z ep r o b l e m ,f a c e r e c o g n i t i o n i i i 哈尔滨理工大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文基于核判别分析的人脸识别 算法,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研 究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表 或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以 明确方式注明。本声明的法律结果将完全由本人承担。 作者签名: 弘峭 日期:聊年;月2 日 哈尔滨理工大学硕士学位论文使用授权书 基于核判别分析的人脸识别算法系本人在哈尔滨理工大学攻读硕士学 位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大 学所有,本论文的研究内容不得以其它单位的名义发表。本人完全了解哈尔滨 理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论 文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影 印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。 本学位论文属于 保密口,在年解密后适用授权书。 不保密口。 ( 请在以上相应方框内打) 作者签名:多长协肇 日期:弘锯年弓月二日 导师签名:紫瓤吼沙啤多月,己日 哈尔滨理工大学工学硕士学位论文 1 1 课题背景 第1 章绪论 信息技术的飞速发展推动了社会的发展,随之现代社会又对信息技术提出 了更新、更高的要求,例如计算机使得经济与金融网络化,而网络经济与金融 又要求更可靠的信息安全系统。身份验证是人们加强信息安全性的基本方法之 一。传统的身份验证是基于标识物( 如证件、钥匙等) 或者知识( 如密码、p i n 等) 来完成的,然而这些方法不方便、不安全、不可靠的缺点不言而喻:证 件、钥匙携带不便,容易丢失伪造;密码和p i n 可能被遗忘或蓄意窃取等等。 每年都会因密码被盗、证件丢失或伪造等给银行、通讯公司和政府等部门造成 数亿美元的损失n 1 。因此这些传统的身份识别方法已经越来越不能适应社会发 展的需求,人类亟需更加方便、可靠、安全的身份验证技术。人体自身所固有 的生物特征为解决这些问题提供了有效的途径。 利用人体本身所拥有的生物特征( 如人脸、指纹等) 来进行身份识别的技术 称为人体生物特征识别技术( b i o m e t r i c s ) ,简称为生物识别技术n 。5 1 。人的生物特 征不会被偷,不会丢失或遗忘,也很难伪造或模仿,所以能有效克服传统身份 识别方法的缺陷。 在过去几年里,生物识别技术的市场份额大幅度持续增长,特别是在恐怖 分子对美国发动“9 1 1 ”恐怖袭击之后,社会各界对安全性的要求越来越高, 因而对生物识别技术的需求日益增多。 人脸识别作为一种生物识别技术,能在最自然、最直接,特别是在非接触 环境和不惊动检测人的情况下进行,可应用于如安全认证、刑事侦察、视频监 控、视频会议、档案管理以及人机交互等各种应用系统中。 1 2 人脸识别的研究意义 人脸识别的研究始于二十世纪七十年代,3 0 多年来得到了长足的发展,尤 其是近几年来,更成为一个热门的研究课题,国内外各知名大学、科研机构、 i t 公司等都得到了大量的项目支持。人脸识别问题之所以得到重视,是因为 它有重要的研究意义,突出表现在其对学科发展的贡献和潜在的巨大应用前景 哈尔滨理工大学工学硕士学位论文 两个方面: 1 人脸识别研究可以极大地促进相关学科的发展人脸识别作为一个典型 的图像模式分析、理解与分类计算问题,它为模式识别,图像处理、分析与理 解,计算机视觉,人工智能,人机交互,计算机图形学,认知科学,神经计 算,生理学,心理学等多学科提供了一个良好的具体问题,有利于构建这些学 科领域的基础实验平台,用于尝试新方法,验证新理论,解释新现象。人脸识 别问题的深入研究和最终解决,可以极大的促进这些学科的成熟和发展。例 如,作为一个模式识别问题,人脸识别被认为是最具有挑战性的问题之一,模 式种类数目庞大,不同类别模式的差别非常微妙,这一点由于数据采集过程的 噪声、成像设备的精度、外界条件的变化以及数据缺损等原因而显得更加突 出。再如,作为一个计算机视觉问题,如何融合人脸的一般性先验形状信息来 准确地恢复特定人脸的3 d 结构也是一个非常有价值的研究问题1 。从图形学 的角度,研究3 d 人脸在光源照射下的成像过程,以指导人脸图像的3 d 形状 分析、光照模式分析及其生成虚拟光照、不同视角视图问题也已经成为一个重 要的研究课题盯1 。另外,人脸识别也是智能人机接口领域的重要研究内容之 一。人脸识别本质上是要赋予计算机区分不同人类个体的能力,也就是“看 的能力,这恰恰是智能人机接口研究需要解决的问题之一,也是机器智能的重 要表现。人脸识别问题的最终解决可以极大的改善目前呆板、不方便的人机交 互环境,从而在一定程度上改变人们的生活方式。 2 作为生物特征识别技术的人脸识别具有潜在的巨大应用前景身份识别 与验证是人类社会日常生活中的基本活动之一。尽管有时是无意识的,我们每 天都要对很多人的身份做出判别,同时,每个人也都要经常通过各种方式和手 段证明自己的身份,比如在a t m 上进行金融业务时需要输入密码,进入自己 的计算机系统需要输入用户名和密码等等。显然,目前在大多数情况下仍然依 赖于传统的身份验证手段来完成身份识别过程,这些手段包括身份证卡等各类 标识物( 如身份证、学生证等各类证件) ,钥匙,密钥( 如密码、口令等) ,然而 这些方式不方便、不安全、不可靠的缺点不言而喻:证件、钥匙携带不便;证 件可以被伪造;钥匙可能会丢失;密码可能会遗忘或被蓄意窃取。这些缺点使 得他们已经越来越不能适应社会发展的需求,我们亟需更方便、更可靠、更安 全的身份验证方式。同时,国家公共安全、信息安全等关系国计民生的领域更 需要高可靠性、高安全性的身份验证技术,而生物特征识别技术被认为是这些 需求的极佳解决方式。与传统的身份验证方法相比,生物特征识别突出的优势 表现在生物特征可以从根本上杜绝伪造和窃取,而且是人类自身拥有的,从而 哈尔滨理工大学工学硕士学位论文 具有更高的可靠性、安全性和可用性。因而,人们对生物特征识别技术寄予厚 望,期望能够满足从国家公共安全,社会安全,到金融安全以及人机交互等方 面的各类需求。 1 3 人脸识别技术简介 自动人脸识别研究至今已经有了3 0 多年的历史,人脸识别技术取得了长 足的进步,尤其是1 9 9 0 年以来发展更为迅速,人们提出了许多新思想,新方 法和新技术。按照研究内容和技术方法可将人脸识别研究大体分为四个阶段。 利用计算机进行人脸识别的研究最早可以追溯到上世纪七十年代,这个阶 段采用的主要技术路线是以提取人脸的几何特征( g e o m e t r i c a lf e a t u r e ) 作为分类 依据。手工标注出眼睛、鼻子、嘴角等重要器官的位置,然后依赖这些基准点 ( f i d u c i a lp o i n t s ) 的空间几何关系( 比如角度,长度比等) 实现人脸的分类。基于 这种思想,k a n a d e 开发出第一个基于几何特征的全自动人脸识别系统哺1 。这种 基于几何特征的体系结构的研究持续了大概二十多年,但绝大多数方法不够成 熟,即使是在很小规模的人脸库上都很难得到满意的识别结果。 到了8 0 年代,神经网络被成功地应用到人脸识别中,并且逐渐成为研究 热点阳1 。神经网络方法从根本上改变了以几何结构特征进行人脸识别的研究思 路。它是将图像空间投影到隐子空间,由于投影变换具有非正交、非线性的特 性,而且可根据不同的需求构造不同的网络,因此可以获得较好的识别效果, 直到现在还有神经网络在人脸识别中的成功应用的文献不断发表。在这个时 期,有一个十分重要的工作是b r u n e u i 和p o g g i o n 在1 9 9 2 年左右完成的基于 结构特征的方法与基于模板匹配的方法的对比实验,他们给出了一个比较确定 的结论:基于模板匹配的方法优于基于结构特征的方法。这一导向性的结论基 本上中止了纯粹的基于结构特征的人脸识别方法的研究。 人脸识别研究的里程碑是以1 9 9 1 年t u r k 和p e n t l a n d 提出的著名的“特征 脸”( e i g e n f a c e ) 方法为标志的1 ,现在e i g e n f a c e 已经成为人脸识别中性能测评 的基准算法,其后涌现的很多人脸识别算法都或多或少与特征脸有关系。基于 表象的线性子空间方法成为这个阶段的主流技术,包括主成分分析( p r i n c i p a l c o m p o n e n ta n a l y s i s ,p c a ) 、线性判别分析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) 和 独立成分分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 等。在此阶段,人脸识别 的研究热点转变为基于表象的子空间建模和基于统计理论的识别技术。 b e l h u m e r 等提出了f i s h e r f a c e 方法n 铂,该方法成功地将f i s h e r 判别准则应用到 哈尔滨理工大学工学硕士学位论文 人脸分类中,线性判别分析目前依然是人脸识别的主流方法之一,人们提出了 大量不同的变种方法。例如,m o g h a d d a m 在特征脸的基础上,提出了基于贝 叶斯概率估计的人脸识别方法n 3 1 。该方法通过人脸特征矢量的两两差分,将两 幅人脸图像的相似性度量问题转换为一个两类分类的概率计算问题,即类内差 和类间差。在这个时期,还出现了一些其它具有重要影响的方法,比如弹性图 匹配技术( e l a s t i cg r a p hm a t c h i n g ,e g m ) 和局部特征分析技术( l o c a lf e a t u r e a n a l y s i s ,l f 。e g m 的基本思想是将人脸建模为二维或三维网格表面,应用 塑性图形或可变形曲面匹配技术进行识别n 引;l f a 考虑到人脸显著的特征信息 并不是均匀分布于整个图像中n 趵,可能少量的局部区域却包含了大部分的判别 信息,而且这些局部特征在投影前后的关系保持不变。总体而言,这一阶段入 脸识别技术发展非常迅速,所提出的算法在较理想情况下能够达到不错的性 能。 近几年来,人脸识别更是得到了显著的发展,主要以统计理论在人脸识别 中的成功应用为特点,研究者们提出了很多重要的思想和新颖的方法,这其中 包括主动形状模型( a c t i v es h a p em o d e l ,a s i v l ) 、主动表观模型( a c t i v e a p p e a r a n c em o d e l ,aa 蛐,支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 和自适应 的b o o s t i n g 方法( a d a p t i v eb o o s t i n g ,a d a b o o s t ) 。a s m 和a a m 同属于柔性模型 ( f l e x i b l em o d e l ) n 耵,两者将人脸描述为2 d 形状和纹理两个分离的部分,分别 用p c a 统计方法建模。s v m 是v a p n i k 等提出的基于结构风险最小化原理 ( s t r u c t u r a l r i s km i n i m i z a t i o n p r i n c i p l e ,s r m ) 的统计学习理论n 钔,s r m 使 v c ( v a p n i kc h e r o v n e n k i s ) 维数的上限最小化,使得s v m 方法比基于经验风险 最小化( e m p i r i c a lr i s km i n i m i z a t i o np r i n c i p l e ,e r m ) 的神经网络方法具有更好的 泛化能力。a d a b o o s t 为特征选择和非线性分类提供了一种简单而有效的阶段性 学习策略,其基本思想是基于少量的最有效特征构建弱分类器,这些弱分类器 通过加权线性组合为强分类器。v i o l a 和j o n e s 结合简单的矩形特征成功地将 a d a b o o s t 应用到人脸检测和人脸识别中啪1 。 1 4 人脸识别研究现状 人脸识别经过3 0 多年的发展,技术上已经达到了一定的成熟度,也陆续 出现了一些成功的人脸识别商业系统,主要包括i d e n t i x 公司的f a c e l t 系统、 v i i s a g e 公司的v i s s a g ef a c et o o l s 与e t u r e 公司的t u r e f a c e 系统等等。这些 商业系统基本上代表了知名研究机构多年的研究成果,比如f a c e l t 系统的主要 哈尔滨理工大学工学硕士学位论文 技术是局部特征分析( l o c a lf e a t u r ea n a l y s i s ,l f a ) ;v i i s a g e 系统应用的是特征 脸技术,后来结合了独立成分分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 幢u 技 术和弹性图匹配( e l a s t i cg r a p hm a t c h i n g ,e g m ) 技术;t u r e f a c e 的核心是多层 神经网络( m u l t i p l en e u r a ln e t w o r k ,m n n ) 技术。这些商业系统的成功预示着人 脸识别存在巨大的市场需求和广阔的应用前景。 每年都有大量的学术论文发表和研究成果发布,国际顶级的学术会议如 i c c v 、c v p r 和e c c v ,还有期刊如i j c v 、p a m i 、p r 、p r l 等对人脸识别 都给予了充分的重视。近两年在顶级的学术会议上都会有一个专门关于人脸识 别方面的w o r k s h o p ,比如i c c v 上的a m f g ( a n a l y s i sa n dm o d e l i n go ff a c e a n dg e s t u r e ) 和c v p r 上的f p i v ( f a c ep r o c e s s i n gi nv i d e o ) 。国外许多著名的大 学和研究机构都有专门从事人脸识别的研究小组,包括麻省理工学院( m i t ) 、 卡内基一梅隆大学( c m u ) 、耶鲁大学( y a l e ) 、南加州大学( u s c ) 、马里兰大学 ( u m d ) 、m i s c r o s o f t 、i b m 和s a m s u n g 等。 近年来国内的人脸识别研究也取得了长足的进步。国内顶级的学术期刊包 括计算机学报、软件学报、自动化学报和电子学报等每年都会发表不少人脸识 别方面的论文;此外,国内很多大学和研究机构也有专门的小组从事着人脸识 别的研究,包括中科院自动化所、中科院计算所、清华大学、北京大学、北京 交通大学、北京工业大学、上海交通大学、南京大学与浙江大学等等。 1 5 本文的主要研究内容 本文围绕人脸识别的问题,在人脸图像的预处理、人脸特征提取和分类器 设计上作了一些理论和实验研究工作。主要内容如下: 1 全面概述人脸识别技术的应用背景、研究意义和发展方向,重点描述了 人脸识别技术的研究内容、方法、应用前景,介绍了人脸识别技术在国内外的 研究现状与发展趋势。 2 对人脸图像预处理的两个主要过程进行了详细的介绍。 3 分析了主成分分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 方法的基本思 想,该方法在最小均方误差意义上能实现对人脸的最优表达。基于此优点将其 用到人脸识别中而且获得较高的识别率。对基于f i s h e r 判别准则的线性判别分 析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) 的理论构架进行了深入分析,提出了在人 脸识别中典型的小样本问题。p c a 方法所确定的投影方向使得特征系数对原图 像具有很好的表达能力,重构出的图像效果很好。l d a 所确定的投影方向使 哈尔滨理工大学工学硕士学位论文 得样本间具有很好的线性的、或类似线性的区分性。针对人脸识别中经常遇到 的小样本问题提出了p c a + l d a 方法,即先用主成分分析方法将高维图像数据 投影到低维的特征脸空间,然后再用线性判别分析方法对投影后的特征进行分 类。 4 实际问题中原始样本的分布通常是高度复杂和非线性的,受支持向量机 ( s u p p o r tv e c t o rm a c h i n e ,s v m ) 理论中有关核方法的启发,将第三章中提出的 线性投影方法利用核方法推广到非线性领域,研究了k p c a 、k f d a 方法,并 针对k f d a 中存在的奇异性问题,提出基于核的正交补空间法。从理论上巧妙 的解决了奇异性情况下最优判别矢量集的求解问题,该方法全面考虑了核类内 散度矩阵零空间信息和非零空间信息。 5 在分类器设计方面,研究了b p 神经网络在人脸识别中的应用。 6 结果展望,分析本课题不足之处,找到改进点,期待进一步的提高。 - 6 - 哈尔滨理工大学工学硕士学位论文 2 1 引言 第2 章人脸图像的预处理 人脸图像的预处理,作为特征提取和识别的前提步骤,是计算机人脸识别 系统中的必要环节。其目的是去除噪声、加强有用信息、对输入设备或其他因 素造成的退化现象进行复原,为后续的特征提取和识别做准备。 人脸图像的预处理主要包括几何规范化和灰度规范化两个步骤。人脸图像 的几何规范化是通过仿射变换来实现的,常用的仿射变换包括:平移、旋转、 缩放等;而灰度规范化则包括:图像平滑、直方图均衡化、灰度变换等。 2 2 几何规范化 几何规范化是通过仿射变换将人脸区域从输入图像中分割出来,然后将分 割出来的人脸图像统一到给定的尺寸,并以图像上给定的特征点为基准将其对 正。任何一种几何变换都是由两个独立的算法组成:一个算法定义空间变换本 身,也就是确定从初始位置变换到终止位置的法则;另一个算法是灰度级插值 算法,以保持图像在变换前后的连续性。 2 2 1 仿射变换 人脸图像的几何规范化是通过平移、旋转、缩放等仿射变换来实现的。仿 射变换的表达式为: _ 口。l 口1 2 o l q 却忆a 2 20 l j 陆1 ) l 口3 l 口3 2l j 其中,( “,v ) 表示输入图像中像素的坐标,( x ,y ) 表示输出图像中像素的坐 标。将上式展开可得: x 2 口1 l 甜+ a 2 1 v + a 3 1 ,一 ,、 y 2 q 1 2 u + g 2 2 v + 口3 2 厶一厶, 1 平移平移变换就是在z n ,平面上图像中所有点的坐标都分别加上a u 和 哈尔滨理工大学工学硕士学位论文 咄v 雌习 p 3 , b 川咄圳i 声c o s oc s i 芎n o 口习c 2 卸 却v - p 5 , 2 2 2 灰度级插值 图像经过空间变换以后,在变换后的空间中各像素的灰度值应等于变换前 图像对应位置像素的灰度值。但变换以后的图像往往会出现某些像素挤压在一 起或者分散开,这样使得变换后图像的一些像素对应于变换前图像上非整数坐 标的位置,为此通常采用插值的方法求得这些像素的灰度值。常用的插值方法 包括:最近邻插值、双线性插值和双三次插值乜2 2 射。 1 最近邻插值最近邻插值是一种最简单的插值方法,这种方法插值输出 的像素灰度值就是输入图像中与其最邻近的像素的灰度值。最近邻插值的运算 量非常小;但其缺点是变换后图像的灰度值有明显的不连续性,能够放大图像 的高频分量,产生明显的块状效应。 2 双线性插值双线性插值输出像素的灰度值是它在输入图像中2 x2 邻域 采样点的平均值,利用周围四个相邻像素的灰度值在水平和垂直两个方向上作 线性插值。 令f ( x ,) ,) 为两个变量的函数,且其在单位正方形顶点的值已知。通过下列 8 哈尔滨理工大学工学硕士学位论文 双线性插值方程可以得到正方形内任意一点的函数值: f ( x ,y ) = a x + b y + c x y + d( 2 6 ) 式中,口,b ,c ,d 四个参数由已知的四个顶点的函数值确定。插值计算通过 三个步骤来实现:首先对上端的两个顶点进行插值计算可得: f ( x ,o ) = f ( o ,o ) + x f ( 1 ,o ) 一f ( o ,0 ) 】 ( 2 - 7 ) 类似地,对底端的两个顶点进行插值计算: f ( x ,1 ) = f ( o ,1 ) + x f ( 1 ,1 ) 一f ( o ,1 ) 】 ( 2 8 ) 最后,做垂直方向的线性插值: f ( x ,y ) = f ( x ,0 ) + y f ( x ,1 ) 一f ( x ,0 ) 】 ( 2 9 ) 将式( 2 6 ) 、( 2 7 ) 代入( 2 8 ) ,展开等式并合并同类项可得: f ( x ,y ) = 【f ( 1 ,o ) - f ( o ,0 ) h + 【厂( o ,1 ) 一f ( o ,o ) l y , + f ( 1 ,1 ) + f ( o ,0 ) 一f ( o ,1 ) 一f ( 1 ,o ) l x y + f ( o ,o ) 、7 这种方法计算量较最近邻插值法大,变换后图像的灰度值没有明显的不连 续性;但这种方法具有低通滤波的性质,它使高频分量受损,图像轮廓模糊。 3 双三次插值双三次插值利用三次多项式来逼近理论上的最佳正弦插值 函数,其插值邻域的大小为4 4 ,计算时用到周围1 6 个相邻像素的灰度值,这 种方法计算量较大,但能克服前两种算法的缺点,计算精度较高。 2 3 灰度规范化 灰度规范化是通过图像平滑、直方图均衡化、灰度变换等图像处理方法来 改善图像质量,并将其灰度统- n 给定的水平。 2 3 1 图像平滑 为了抑制噪声,改善图像质量所进行的处理称为图像平滑乜4 龉1 ,它可以在 空间域和频率域中进行。常用的方法包括:邻域平均、空域滤波和中值滤波 等。邻域平均法是一种局部空间域处理的方法,它用像素邻域内各像素的灰度 平均值代替该像素原来的灰度值,实现图像的平滑。由于图像的噪声属于高频 分量,空域滤波法采用低通滤波的方法去除噪声。中值滤波法用像素邻域内各 像素灰度的中值代替该像素原来的灰度值。 哈尔滨理工大学工学硕士学位论文 2 3 2 直方图均衡化 灰度直方图反映了图像中每一灰度级与具有该灰度级的像素出现的频率之 间的关系,可以表示为: e ( r k ) = 等( 2 - 1 1 ) 式( 2 1 1 ) 中,丘表示第k 个灰度级,力。为第k 级灰度的像素数,为一幅 图像的像素总数,灰度直方图是图像的重要统计特征,它可以被认为是图像灰 度概率密度函数的近似。直方图均衡化就是将原图像的直方图分布转换为均匀 直方图分布。对于对比度较小的图像来说,其灰度直方图分布集中在某一较小 的范围之内,经过均衡化处理后,图像所有灰度级出现的概率相同,此时图像 的熵最大,图像包含的信息量最大。 以,和s 分别表示归一化了的原图像灰度和直方图均衡化后的图像灰度, 即:0 ,1 ,0 s 1 。 r ( r ) 为变换函数,在【o ,1 】区间的任意一个,经变换以后都对应一个s : j = 丁( ,)( 2 1 2 ) s 为变换后的灰度值,丁( ,) 满足下列条件: 1 s 在0 ,1 区间内为单调递增函数,且满足0 丁( ,) l 。 2 在0 s 1 区间内,反变换,= t q ( s ) 存在,且为单调递增函数。 条件1 保证灰度级从黑到白的次序,条件2 确保映射后的像素灰度在允许的 范围内。由概率理论可知,已知随机变量,的概率密度函数为只( ,) ,而随机变 量s 是,的函数,则随机变量s 的概率密度函数只( s ) 可由p r ( r ) 求出。假定随 机变量s 的分布函数为只( s ) ,根据分布函数的定义: 只( s ) = 1 只( s ) d s = ll r ( r ) d r ( 2 - 1 3 ) 根据概率密度函数和分布函数之间的导数关系,将上式两边对s 求导得: 只( s ) = 只( ,) 车i( 2 1 4 ) a s l ,一( j ) 从式( 2 - 1 4 ) 可以看出,通过变换函数r ( ,) 可以控制图像灰度的概率密度函 数,因为直方图均衡化后有只( s ) = 1 ,则: d s = 只( r ) a r = d 口( r ) 】( 2 - 1 5 ) 两边积分得: 哈尔滨理工大学工学硕士学位论文 s = 7 1 ( r ) = r 只( r ) d r 式( 2 1 6 ) 表明变换函数为原图像直方图的累积分布函数。 对于灰度为离散的数字图像来说,用频率代替概率, 形式可以表示为: ( 2 1 6 ) 变换函数r ( r ) 的离散 & = 丁( ) = p ( 住) = 等 ( 2 1 7 ) 七 n r = or = 0 t ( 2 1 7 ) q b ,0 r k 1 ,k = 0 , 1 ,2 ,l 一1 ,三灰度级数目。图2 - 1 为o r l 人脸 i 茔审的唾始图像和其真方图 图2 - 1 原始人脸图像和直方图 f i g 2 - 1o r i g i n a li m a g e a n dh i sc o r r e s p o n d i n gh i s t o g r a m 经过直方图均衡处理后的图像和直方图如图2 2 所示。 图2 - 2 直方图均衡化后的人脸图像和直方图 f i g 2 - 2t h ef a c ei m a g ea n d h i sh i s t o g r a ma f t e rh i s t o g r a me q u a l i z a t i o n 经过直方图均衡化后,图像的细节更加清楚,直方图各灰度等级的分布更 加平衡,图像的灰度级几乎变为均匀分布,从而将由于光照不同产生的影响消 _ 哈尔滨理工大学工学硕士学位论文 除掉。 2 3 3 灰度归一化 通过灰度变换,可以将不同图像的灰度分布参数统一调整到预定的数值, 称为灰度归一化。图像灰度分布的均值和均方差是两个最基本的统计量,通常 通过灰度变换将分布的这两个参数调整到预定的数值。设一幅尺寸为m n 的 图像的灰度分布可以表示为矩阵:i ( x ,y ) ,且0 x m 一1 , 0 y n l ,则该 图像的灰度均值和均方差分别为: 1肘一l - i = 南m ,力 ( 2 - 1 8 ) ( 2 1 9 ) 为了将图像的灰度均值和均方差分别调整到给定的值。和c r o ,对图像的 每个像素点灰度值进行如下线性变换: j ( x ,) ,) :c r o ( x ( x ,y ) 一) + 。( 2 2 0 ) o - 式( 2 2 0 ) 中j 7 ( x ,y ) 为变换后图像的灰度分布矩阵,通常取参数:。= 0 , o o = 1 。 2 4 本章小结 人脸图像的预处理就是将由图像采集设备采集到的人脸图像调整成规范化 图像的过程。人脸图像的预处理主要有两个环节:几何规范化和灰度规范化。 本章主要介绍了几何规范化和灰度规范化的具体实现方法。 哈尔滨理工大学工学硕士学位论文 3 1 引言 第3 章基于线性方法的特征提取 从模式识别的观点看,世界上的各种事物都属于某一特定的类,那么如何 从大量的冗余信息以及表面现象中抓住事物的本质,对事物正确分类,这个问 题在网络迅速膨胀的今天具有重要的意义。而模式识别可以比较完美地解决这 一问题。 模式识别的任务就是根据选择好的特征在k 维空间对模式进行分类,特征 的好坏直接决定了模式识别系统的性能。特征提取的算法很多,大多数算法都 是面对问题的。目前,通过极小化准则函刻2 射,寻找某种映射提取变换域特征 的算法已经成为模式识别各个领域的热点算法。 一般来讲,判别函数是样本x 的函数,函数有线性函数和非线性函数之 分。最简单的判别函数是线性函数,它是所有模式样本的线性组合。如果不同 类样本可以由超平面无错误地分开,则样本是线性可分的,在这种情况下,线 性的判别函数就可以满足分类要求。而如果样本不能由超平面无错误地分开, 但是可以由曲面分开,就需要使用非线性的判别函数,提供超曲面的分界面。 因此,判别函数有线性和非线性之分。在本章中,主要研究线性判别函数算 法,而对非线性判别函数的研究将在第四章中展开。 不失一般性,判别分析的目的就是在事先定义的优化准则j ( ) 以及某种 约束条件s 下,寻找一个有利于分类的投影矩阵矽,w = w 1 ,w 一,w 。】,其中 的任- - n 矢量w ,均为有利于分类的判别方向。对于广泛使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论