




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s t r z c t it s weu kno 俩 . 也 掀the 协 c bno fo gyofb u n 妞 口俪e 翻6 onb asbecome a h o t t o p ic inp a tt e mre cognit io n field . 仆阳沙a lotofprogressh a s beenm ade bym any re se ai c h ers 山 e s eyears, m 胡yk e yp r o b le ms stinhav eto be s o lv e din o r d e rto p o p u l arize th e a p p 1 ic ationoffa c e r e c 0 g ni t io n bec ause ofthe complexityofface re cog ni t 1 呱 t 五 e b a c k 乎 o un d , d e v e l o p m ent an d m e t h o dsofface re co gnit i onale 劝 ltr o d u c e d 6 r st l y inthis p al 姆 r , 由 e n a 俪e re cognj桩 o n m e th o d w hi chisb as e d onwavel ettr 田 ” fo n l l , k l tr a n s fo n nand b p n e ur a l n e 七 刀 o r ksis仪 d int h e p aper.heret h e face fe a t ur e e x t r a c t i o n incl u d e s 、 v a v e lettr ansfo rm a n d k ll r 田 招 fo rin. moreo v e r , 也 e re c o 9 苗 t i on d as si fi erisb p ne也 a l n e 妇 邢 o rk s . the s 1 m u 1 at in n te s t in g inth e p a p erhold s g 。 。 d rec。 加t l onr a t e . t h e main w o r k inthis p a p erisi n t r o d u c edasfo n o 、 v s : 1 . inthe p r e p r o ce ss in g s t a g e , eve ry俪e 加a g e isadjus t e d , le c ated and s t and a rd i zed tog etthe i m age o f the s ame s 说 e : 3 2 x 3 2 a n e r t h a t , the i n fl u e nce s onthe fa c e re c 0 g n 1 ti o n c aus edbyd i ffer e n c e ofs c al e and i l l umin a t 1 o n i n t e n s 1 onare e 1 im ina t e d . 2 . t b e p re 一 p ro c e s s e d 而a g e s are d e al e d w i t h 、 , a v e l ett r a n s fo rm ino rd e r tog e t t h e l ow freq u e n c y 云 n a g e s t h e l ow fi e q u e n c y l m a g e s , 叭 七 i chare co m p r e s s e d from3 2 x 3 2 tos x s , c o n ta l n the mosti 刊 fo rma t l onand ene r g y o f t h e 伽e llnage s . 3 . t b e k lt r a n s fo rm, w hi chc o m p r e s s t b e d a tab 睽d on t h e rule o f the le ast squ ar e di 月 免 r e n c e , isa 俪d el y used m e t h o d infe al 泊 r e e x t r a c t i o n . t 七 e k lt r a n s fo rm in而s p aper 引 刁 d s withthe co l l e c t 扮 i tys p r e adm at ri x o f the l ow 丘 e q u e n c y l m a g e s fromthe wav el et t 班 in s fo n n tog a i n the ei g e n v e c t o r o f the 俪e u n a g e 而后者主要是通过计算模板和图 像灰度值的自 相关性来 进行识别的. 1 9 93年, b ertol71 对这 两 类方法进行了比 较 全面的比 较, 认为 基于模板 匹配的人脸识别方法要优于基于几何特征的人脸识别方法。 进入二十世纪九十年代, 随着社会经济和计算机技术的突飞猛进, 社会各个领域, 特别是安防监控领域对可靠、 精确的身份识别方法的需求日 益迫切, 人脸识别的课题 2 硕士论文墓于即神经网络的人脸识别技术的研究 研究迅速兴起,成为倍受重视的热门学科。 总的来说,人脸识别技术的发展可以分为以下四个阶段: 第一阶 段: 以b ertin on、 all en 8l 和p ar k e 9 1 为 代表, 这一阶段的 人脸识别主 要 侧重 于人的面部特征。 该阶段人脸识别过程全部依赖于操作人员, 不能自 动完成识别的系 统. 第二 阶 段:以g o l d stionllo , h 别 山 ” o n 和l e sk为 代表, 侧重于用几何 特征参数 来 表示人脸正面图像。他们采用21维特征矢量表示人脸面部特征,并设计了基于这一 特征表示法的识别系统。 这类方法需要利用操作员的某些先验知识, 仍然需要人的干 预,属于人机交互的人脸识别系统. 第三阶段: 真正实现了 人脸的机器自 动识别。 近十余年来, 计算机技术和机器学 习的发展, 为人脸模式识别方法的发展奠定了基础, 出现了多种机器全自 动识别系统。 同 时 出 现了 大 量 优秀的 研究 方法,比 如: 特征脸 (e i ge 刘 ra c e ) 的 方法, fi s h e r f ac 。的 方 法 ll1, 基 于 奇 异 值 分 解 (s v d ) 的 方 法 lz, 人 脸 等 密 度 线匹 配的 方 法 113, 弹 性图 匹 配 归astio g r a p h m atch) 的 方 法, 隐 马 尔 可 夫 即d den m a r k o v m od el)的 方 法 141 , 人 工 神 经 网 络 的 方 法 ls 1 , 支 持 向 量 机 (s u p p e r vector m a c h in e s) 的 方 法 16 等 等。 其中 主 分 量 分 析 、 线性判别分析、 弹性图匹 配、 局部特征分析、 独立分量分析、 支持向量机、 神经网络、 隐 马 尔可 夫 模型、 a a m( a c t iv e a p p e 份 e m odel)等方 法获得了 较大的 发 展, 成为了 目 前人脸识别的主流方法. 但这类方法采用的预处理技术大多比较简单, 当 人脸表情、 光照和姿态等发生变化时, 往往无法获得好的识别效果。 第四阶段: 是当前鲁棒的人脸识别技术的研究。 近几年来, 针对影响人脸识别的 一些主要因素, 例如光照、 姿态、表情、年龄、 遮挡、 低分辨率等提出了很多解决方 法。 如对于光照变化的处理方法有嫡图像法、 亮度锥法、 球谐波函数法、 九点光源法 等。 对于姿态变化的处理有多视角法、 局部一整体几何特征变换匹配法、 通用3 d模 型法,3 d形变模型法、 光流场法等。 对于表情、年龄、低分辨率图像、 遮挡等变换 因素的处理技术也有一些初步的研究。 这类方法侧重于通过对这些变化因素描述和补 偿,来改善识别算法的性能。 1 . 4 人脸识别的困 难 人脸识别有其先天的易于为人们接受的 优点, 但是人脸识别技术的 研究仍存在着 很多困 难. 其主要难点 在于: 1 、人脸的相似性 所有的 人脸都具有相似的结构, 在纹理上也比较接近, 因而构成了一种在空间上 极为接近的类别。 人脸识别系统只能利用不同人脸之间的细微差别来实现正确识别的 任务。 3 硕士论文基于bp神经网络的人脸识别技术的研究 2 、人脸的刚体性 ( 1)姿势: 在人脸图 像摄取中,由 于照相器材、人的主观因素或实际条件限制, 很容易造成人的姿势变化,进而造成人脸的姿势差异。 (2 ) 脸部结构成 分 缺 损: 鉴于 各 种实际需 要, 人脸可能 佩戴眼 镜、 蓄留 胡 须、 化 妆等, 而人脸的这些外部结构成分是不固定的、 随意的, 对人脸识别造成很大的困 难。 比如识别留有胡须的拉登与剃光胡须的拉登是有困难的。 (3 ) 面 部表情: 人 体喜、 怒、 哀、 乐 等面部 表情的 变化会 造成人 脸特征的 显 著变 化, 对识别算法提出了更高的要求。 3 、图像获取的不确定性 图 像的畸变:由 于光照、 视角、 摄取角度不同, 可能会造成图 像的 灰度畸变、 角 度旋转等.降低了图 像的质量,增大了识别难度。 1 . 5 人脸识别的 研究内 容 人 脸识别(f ac e reco g n i t i o n ) 一 般 可描述为: 给定一静止或动态图 像, 利用已 有的 人脸数据库来确认图 像中的一个或多个人。 从广义上来讲, 其研究内容包括以下五个 方面冈 : ( 1)人脸检测( f ac e recog ni t i on):即从各种不同的场景中 检测出 人脸的存在并确 定其位置。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响。 (2 ) 人脸表征作 ac e r e p r e s e n tatl o n):即确定表示检测出的人脸和数据库中的己 知 人脸的描述方式。 通常的表示方法包括几何特征 ( 如欧氏 距离、曲 率、角度等) 、代 数特征 ( 如矩阵特征矢量) 、固定特征模板、特征脸、云纹图等。 (3 ) 人脸鉴别(f 暇 id e n t i fi c a t i on): 即通常所说的人脸识别, 就是将待识别的 人脸 与数据库中的已知人 脸比较, 得出 相关信息。 这一过程的核心是选择适当的人脸表示 方式与匹配策略。 (4) 表 情分析少 ac ial e x p r e s sion a 刀 a l ys is): 即 对待识 别 人脸的 表情 进行分析, 并 对其加以 分类. (5) 物理分类( p h y s l c alcl as s 沂 catio n) :即 对待识别人 脸的 物理 特征 进行分 类, 得 出其年龄、性别、种类等相关信息。 本文主要研究狭义的 人脸识别方法, 不涉及表情识别和物理分类方面。 一个人脸 自 动识别系统主要包括三个主要技术环节,如图1 . 5. 1 所示: 神 塑驾人 脸 检 , 与 定 位藉 旋 奚 司 二 一 井 灭 篮 镇 痢 律 娄 酬 图1 :5 人脸自 动识别系统构成 硕士论文基于bp神经网络的人脸识别技术的研究 首先是人脸检测与定位, 即检测图像中 有没有人脸, 若有, 将其从背景中分割出 来, 并确定 其在图 像中的 位置。 在某些场合, 拍摄图像的 条件可以 控制, 比如替察拍 罪犯的 照片时要他们将脸的某一部分靠近标尺, 这时 人脸的定位很简单。 普通证件照 片上的 头部占 据图 片中 央的大部分地方, 定位也比 较容易。 在另一些情况下, 人脸在 图像中的 位置预先是未知的, 比 如一些复杂背景中拍摄的照片, 这时人脸的检测与定 位将受以 下因素的 影响: 人脸在图 像中的 位置、 旋转角度和尺度不固定; 发型和 化妆会遮盖某些特征; 图像中出 现的噪声. 其次是 特征提取. 特征提取之前一般需要做几何归一化和灰度归一化的工作。 其 中前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小: 后者是指对图 像进行光照补偿等处理, 以克服光照变化的影响。 具体的 特征形式随识别方法的不同 而不同。 比 如在基于几何特征的识别方法中, 这一步主要是提取特征点, 然后构造特 征矢量; 在统计识别中, 特征脸方法是利用图像相关矩阵的特征矢量构造特征脸, 而 隐马尔可夫方法则是对多个样本图像的空间序列训练出一个隐马尔可夫模型, 它的参 数就是特征值: 模板匹配法用相关系数做特征: 而大部分神经网络方法则直接用归一 化后的 灰度图像作为输入,网络的 输出 就是识别结果, 没有专门的 特征提取过程。 最后是人脸识别. 数据库里预先存放了已 知的人脸图像或有关的特征值, 识别的 目的就是将待识别的图像或特征与库里进行匹配。 识别的任务主要有两个: 一个是人 脸辨认, 即确定输入图 像为库中的哪一个人, 是一对多的匹配过程; 另一个是人脸证 实, 即验证某个人的身份是否属实, 是一对一的匹配过程。 根据输入图 像的性质, 可 以将人脸识别分为静态图像的人脸识别和动态图像序列的人脸识别两大类。 前者主要 是用静态图像如从证件照片、 罪犯照片、 场景照片上扫描的图像进行识别, 后者则是 用摄像机摄取的时间图像序列进行识别。 1 . 6 人脸识别的 主 要方法 人脸识别最早是由ble d s o 于1 9 64年提出的, 迄今为止已 形成了几十种较为成熟 的 识 别 方 法, 如: 特 征脸 1 1 刀 、 r i s h e d 泊 c e l l 81 、弹 性模板1 1 刃 、 神经网 络、 s v m、 h m m 、 基于 几 何 特征的 方 法 20l等, 很多学 者对 这些方 法进 行了比 较 和总 结。 下 面主 要介 绍几 种常用的识别方法。 1 , 6 . 1 基于几何特征的 人脸识别方法 常采用的几何特征有人脸的五官如眼睛、 鼻子、 嘴巴等的局部形状特征, 脸型特 征以 及五官在脸上分布的几何特征.提取特征时往往要用到人脸结构的一些先验知 识。 在这种基于几何 特征的识别中, 识别总归为特征矢量之间的匹配, 基于欧氏距离 硕士论文墓于bp神经网络的人脸识别技术的研究 的判决是最常用的识别方法。 侧影识别是最早的基于几何特征的人脸识别方法, 主要 是从人脸侧面轮廓线上提取特征点入手。 一般将侧影简化为轮廓曲 线, 从中抽取若干 基准点, 用这些点 之间的几何特征来进行识别。 由于现在的证件照片多为正面, 而且 侧面照片约束很多, 所以 对侧面人脸识别的 研究最近己 不多见。 正面人脸识别最关键 的 一步 是合适的归 一化, 使之不依赖于图 像中 人脸的 位置尺度和旋转变化。 识别所采 用的 几何特征是以 人脸器官的形状和几何关系为基础的特征矢量, 其分量通常包括人 脸指 定 两点间的 欧 式 距 离、 曲 率、 角 度等. 例如, p oggi 。 和b ru n e ili用积分投 影法提 取出35维人脸特征矢量用于模式分类。 基于几何特征的 识别方法具有如下优点: 符合人类识别人脸的机理, 易于理解; 对每幅图像只需存储一个特征矢量, 存储量小; 对光照变化不太敏感。 这种方法 同 样存在如下问 题: 从图像中 抽取稳定的特征比较困难,特别是特征受到遮挡时; 对强烈的 表情变化和姿态变化的鲁棒性较差; 一般几何特征只描述了 部件的基本 形状与结构关系,忽略了局部细微特征,造成部分信息丢失,更适合于粗分类。 1 . 6 . 2 基于 模板匹 配的 人脸识别方法 模板匹配法是一种经典的模式识别方法, 这种方法大多是用归一化互相关, 直接 计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目 标要有相同的尺 度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。 最简单的人脸模板是将人脸看成一个椭圆, 检测人脸也就是检测图像中的椭圆。 另一种方法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴 模板、鼻子模板、 眉毛模板和下巴模板等。 但这些模板的获得必须利用各个特征的轮廓, 而传统的基于 边缘提取的方法很难获得较高的连续边缘。 即使获得了可靠度高的边缘, 也很难从中 自 动提取所需的特征量。 为此, 用弹性模板方法提取特征显示出其独到的优越性。 弹 性模板由 一组根据特征形状的先验知识设计的可调参数所定义。为了求出这组参数, 需要利用图像的 边缘、 峰值、 谷值和强度信息及特征形状的先验知识设计合适的能量 函 数。 参数向 能量 减小方向 调整, 当能量达到最小时, 这组参数对应的 模板形状最符 合特征形状。 pog gi 。 和b rune lli 专门 比 较了 基于 几 何 特征的 人 脸识 别 方 法 和 基于 模 板 匹 配的 人 脸识别方法, 并得出结论: 基于几何特征的人脸识别方法具有识别速度快和内存要求 小的优点, 但在识别率上模板匹配要优于基于几何特征的识别方法。 增加几何特征对 于基于几何特征的人脸识别方法只能轻微地提高识别率, 因为要提高几何特征的提取 质量本身就十分困 难, 而且随着图像质量的下降和人脸遮挡的引入, 基于几何特征的 人脸识别效果会大幅下降。总之,模板匹配法要优于几何特征法。 硕士论文墓于即神经网络的人脸识别技术的研究 1 . 6 . 3 特征脸方法 特征 脸伍 i ge nfac e ) 方法是从主成 分分析 伊 nnc i 叫 c o mpo n e n t a 刀 a lys is , p c a)导出 的一 种人脸识别和描述技术。 p c a实质上是k l 展开的网 络递推实现, k l 变换是图 像压缩中的一种最优正交变换, 其生成矩阵一般为训练样本的总体散布矩阵。 特征脸 方法就是将包含人脸的图像区域看作是一种随机向量, 因此可以 采用k l 变换获得其 正交k l 基底。 对应其中较大特征值的 基底具有与人脸相似的形状, 因此又称之为特 征脸。 利用这些基底的线性组合可以描述、 表达和逼近人脸图像, 因此可以 进行人脸 识别和合成。 识别过程就是将人脸图像映射到由 特征脸张成的子空间上, 比 较其与已 知人脸在特征脸空间中的位置。 在传统特征脸方法的基础上, 研究者注意到特征值大的特征向量 ( 即特征脸) 并 不一定是分类性能最好的向量, 而且对k l变换而言, 外在因素带来的图像差异和人 脸本身带来的差异是无法区分的, 特征脸在很大程度上反映了光照等的差异。 实验表 明, 特征脸方法随着光照、 角度和人脸尺寸等因素的引入, 识别率急剧下降,因此特 征脸方法还存在着理论的缺陷。 近年来, 据此发展了多种对特征脸的改进方法, 如双子空间法、 相形歧义分析方 法、 fi s h e r 脸方法 等。 其中fi s he r 脸方 法又称为 线性判别 分析 方 法( li near dis c 石 m in at e a 刀 a l y sis, l d a), 它 选 择以 类内 散 布正 交的 矢量作为 特征脸空间, 从而能 压制图 像之 间的与识别信息无关的差异, 对光照及人脸表情变化都不太敏感。 l u l s 等人从传统特 征脸发展出自身特征脸的概念, 使用这种技术并结合人脸颜色信息, 可以 有效地从动 态图 像序列中识别出 指定的 人脸。 另一方面,以p c a为基础的传统特征脸方法没有 利用人脸的几何拓扑特征,为此 alb ert 等将 p c a与人脸拓扑关系结合起来提出 ,c a ( top o fo gi calp r i n c 加 al c o 攻 rp one ni a 习 a lvsis) 方 法, 识别 率较 单一的p c a类方法有 所提高。 m o g h a d d a m等将人 脸图 像差异分为 脸内 差 异和脸间 差异, 其中 脸内 差异属 于同一个人脸的各种可能变形, 而脸间差异则表示不同人的本质差异, 而实际人脸图 的差异为两者之和. 通过分析人脸差异图, 如果脸内 差异比 脸间 差异大, 则认为两人 脸属于同 一个人的 可能性大,反之属不同 人的 可能性大。 这种算法在1 9 96年进行的 f e r 卫 t人脸识别测试中 取得了最好的识别效果, 其综合识别能力优于其它任何参加 测试的 算法,尤其是在克服光照变化对识别的影响方面。 此外, 与k l 变换的思想比较接近但不是从统计角度出发的另一种变换是奇异值 分解 (s v 功的 方 法, 即 将图 像矩阵的 奇异 值作为 模式的 特征 矢量。 s v d 方法具有如 下 优点: 人脸图像的 奇异值具有良 好的稳定性, 当图像上有小的扰动时, 奇异值变化 不大; 奇异值表示了图 像的 代数特征, 是一种本质的内 在特征, 在某种程度上, s v d 特征同时拥有代数与几何两方面的不变性,即对图像灰度值的比例变化、 平移、 旋转 硕士论文基于bp 神经网络的人脸识别技术的研究 和伸缩不变性。 1 . 6 . 4 隐马尔可夫模型 隐 马 尔可夫模型 仙d d e n m 肚 k o v m o de l , h m m ) 是用于描述信号统 计 特性的 一组 统计模型。 h m m使用马尔可夫链来模拟信号统计特性的变化, 而这种变化又是间接 地通过观察序列来描述的,因此,隐马尔可夫过程是一个双重的随机过程。 在h m m 中, 节点表示状态, 有向 边表示状态之间的转移, 一个状态可以 具有特征空间中的 任 意特征, 对同一特征, 不同状态表现出 这一特征的概率不同。 由 于i d 润 m是一个统计 模型, 对于同一特征序列, 可能会对应于许多状态序列, 特征序列与状态序列之间的 对应关系是非确定的。 这种模型对于状态序列来说是隐藏的, 故称为隐马尔可夫模型。 h m m有三个主要问题: 评估、估计及解码。 我们关心的是前两个问 题。 评估用 于解决识别问 题, 一般采取比 较有效的“ 向前向 后” 法: 估计用来产生用于识别的各 个单元的h mm,采取b auln w匕 i c h 方法。 1 . 6 . 5 基于神经网络的方法 神经网络在人脸识别应用中有很长的历史。 早期用于人脸识别的神经网络主要是 k o h o n e n自 联想映射神经网络,用于人脸的“ 回 忆” 。 所谓“ 回 忆”是指当 输入图 像 上的 人脸受噪声污染严重或部分缺损时,能用k o honen 网络恢复出原来完整的人脸。 c o tt r e l l 等人使用级联b p 神经网 络进行人脸识别, 对部分受损的人像、 光照有所变化 的 人 像, 个 人识别能 力较好。 i n t r ator 等 人用一 个无监督 / 监督(bc m j b p) 混合 神经网 络 进行人脸识别。 其输入是原始图像的梯度图像, 以此可以去除光照的变化。 无监督学 习的目 的是寻找类的特征, 有监督学习的目的是减少训练样本被错分的比例。 这种网 络比 用b p 网 络提取的 特征更明显, 所以 识别率更高, 如果用几个网络同时 运算, 求 其平 均, 识别效果 还 会提高。 l a , 理 a n c e 和gil es等人 用一 个自 组 织特征映 射 ( s 0 m ) 神 经网 络与卷积神经网 络结合的系统对一个有4 00幅人脸图像、人均 10幅的 数据库进 行了人脸识别研究。其中s o m网络的作用是将图像样本量化到降维的拓扑空间,它 使原 空间中 相邻的 输入点在输出 空间中仍相邻。 卷积网 络用以实现相邻像素之间的相 关性知识, 从而在一定程度上实现了图 像平移、 旋转、 尺度和局部变形的不变性。 l in 和k u n g 将 神经网 络 方法和统计 方法结 合在一 起, 提出了 一种基于概率决 策的 神经网 (p robab ili sti 。 d e c i si onb as edn e u r a l n e tw o r k , p d b n n ) 用 于 识别 人 脸。 其主 要 思 想 是 采 用虚拟样本 ( 正反例) 进行强化和反强化学习, 从而得至 嫩 理想的概率估计结果, 并 采用模块化的网 络结 构加快网 络的 学习。 这种网 络结构继承了决策神经网 络口b n n ) 的结构,并加入概率变化.每个子网对应一个人,这种结构不仅有利于训练和识别, 硕士论文基于bp神经网络的人脸识别技术的研究 而且有利于做硬件。 用 于 人脸 识别 的 其 他神经网 络还 有: 用ho西el d 网 络进行 低分辨率 人 脸联想和识 别;将rbf与树型分类器结合起来进行人脸识别的混合分类器模型; 采用统计学习 理论中的支持向量机进行人脸识别。 在人脸识别中 用得较多的另一种神经网络是时滞 神经网 络 ( 下 m o d el ayn e u r al n e t w o rk , 和n n ) , 它是m l p 的 一 种变形。 此 外, 由 于单 个神经网 络有一定的局限性, 现在出 现了多模态的神经网络, 如t d n n 十 r b f 等,即 由两种类型的神经网络共同来完成人脸识别任务。 神经网络方法在人脸识别上比 其他类型的方法有其独到的 优势, 它避免了复杂的 特征提取工作, 可以 通过学习的过程获得其他方法难以实现的关于人脸识别的规律和 规则的隐性表达。 此外, 神经网络以 并行方式处理信息, 如果能用硬件实现, 就能显 著提高速度。神经网络方法除了用于人脸识别外,还适用于性别识别、种族识别等。 1 . 6 . 6 弹性图匹配方法 弹 性图 匹 配方 法 2ll是 一 种 基 于 动 态 链 接结 构 (dyn 田 盯 ic l ink aic h ite c ture , d l a ) 的 方法。 它将人脸用格状的稀疏图表示, 图中的节点用图像位置的g 曲or小波分解得到 的特征向 量标记,图的边用连接节点的距离向 量标记。 匹配时, 首先寻找与输入图像 最相似的模型图, 再对图中的每个节点位置进行最佳匹配, 这样产生一个变形图, 其 节点逼近模型图的对应点的位置. wis k o t t 等人使用弹性图匹配方法, 以f e r e t图像 库做实验, 准确率达到973 %。 弹性图匹配方法对光照、 位移、 旋转及尺度变化都不 敏感, 是一种优于特征脸方法的人脸识别方法。 此方法的主要缺点是对每个存储的人 脸需计算其模型图, 计算量大,存储量大。为此,wis k o tt在原有方法的 基础上提出 聚束图匹 配, 部分克服了 这些缺点。 在聚束图中, 所有节点都已经定位在相应目 标上。 对于大量数据库, 这样可以大大减少识别时间. 另外, 利用聚束图还能够匹配不同人 的最相 似特征,因此可以 获得关于未知人的性别、胡须和眼镜等相关信息. l ee等提 出了 一 种基于弹性图 动态链接模型的 方法, 既取得较高的识别速度, 也获 得了 较理想 的识别率,在一定程度上克服了以 往方法总是在速度与识别率之间进行折中的缺点。 1 . 6 . 7 其他人脸识别方法 以 上介绍的是几种典型的人脸识别方法, 从分析中可以 看出, 每种方法各有其优 缺点,因此一些学者倾向于将多种方法综合起来,或同时利用不同 种类的特征。 如 ji a等 指出,要从大量人脸数据库中 进行识别, 单靠扩展单一种类的 特征数目 是不够 的, 而要扩展与原特征集正交的其它种类特征, 他们在正面人脸几何特征的基础上, 将侧面轮廓特征、 眼睛形状特征以 及人脸轮廓特征也加入特征矢量, 获得了比采用单 硕士论文基于bp神经网络的人脸识别技术的研究 一正 面人 脸几何特征为 特征矢量方法更高的识别率。 l ai等结合小波变换与傅立叶变 换提出与平移、缩放、平面内旋转无关的光谱脸人脸表征方法。 目 前人脸识别研究的 对象基本上都是针对二维灰度图 像, 除此之外, 还有深度人 脸图 像识别和红外人脸图像识别方法。深度图像包含了人脸的深度信息, g 。 川 。 n针 对深度图 像提出了一种基于模板的用图像数据的曲 率作描述子的识别方法。 他使用一 个旋转的 激光扫描系统获得人脸深度图像, 获得的曲 面数据以柱坐标形式存储, 然后 根据曲 面上各点法向最大和最小曲率的振幅和相位值定位眼睛、鼻子和两侧脸部区 域。 红外人脸图像 ( 也叫 温谱图) 对每个人来说都是唯一的, 所以可以 利用温谱图识 别人脸。 另外在黑暗中也能捕捉红外光, 因此用红外人脸图像在黑暗中也能进行识别。 对 于多c c d摄像 机系统, 可以 得到多视点人脸图 像, 从而可以 获得人脸的 立体 模型, 含有三维信息的特征能有效解决人脸在光照、 伪装或年龄变化等情况下的识别 问题。 1 . 7 人脸识别的测试平台 人脸识别是近年来研究的热点, 不少文献提出了各种新的识别算法, 为测试和比 较各种识别技术的优缺点及其识别率高低, 世界各研究机构相继建立了 通用的人脸测 试数据库。 (l) f e r e t 数 据 库是由 美国国 防 部建立的, 包含了5 0 00多幅不同 视角的正 面人 脸黑白 像,每幅图 像都具有单纯的背景色,常用于测试不同人脸识别方法的优缺点, 非常适合建立和测试人脸识别算法, 可惜的是, 此数据库只能在美国本土范围内使用。 (2) 冉 t 二是降低输入 特征向 量的维数。 本文重点讨论了小波变换和k l 变换的基本原理和算法, 以 及它们 在特征提取中的应用。 3 、 人脸识别分类 识别问 题其实质就是分类器的设计问题。该部分从尽可能提高识别率角度出发, 分析了以b p 神经网 络为分类器的设计过程: 然后进行实验和测试, 取得的一定的识 别效果。 本文的特点: 1 、 在预处理阶段, 首先对人脸图像进行了定位和校准, 去除了大量的千扰信息, 得到了 大小相同的 纯 人脸图 像, 这样在特征提取之前就大大降 低了 输入图 像的 维数。 然后对人脸进行了 标准化处理,得到了尺度归一化,大小相同的人脸图像。 2 、 采用了二次小波变换和k l变换相结合的特征提取方法。通过二次小波变换 和k l 变换的特征提取, 输入向量的维数仅为30, 而以 这样少的特征向量进行人脸识 别, 仍取得了不错的识别效果。 小波变换在一定程度上对人脸的表情和姿势不敏感的 特点, 弥补了k l 变换特征提取的不足。 3 、 在分类器的 设计上, 本文选取了b p 神经网络分类器, 并以改进的b p 算法对 网络进行了 训练,采用完全训练和批量训练相结合的训练册策略。 l l 硕士论文墓于bp神经网络的人脸识别技术的研究 本文研究的人脸识别系统,以mat l ab6. 5 为开发平台,完成了图像的 预处理、特 征提取、网络训练和人脸识别全过程。 1 . 9 本文的内 容安排 本文各章安排如下: 第一章 绪论,概述了人脸识别的应用背景和发展情况, 并对主要的 人脸识别方 法进行分类介绍, 讨论其优缺点。 第二章 阐述了本文人脸识别的预处理过程。 本文采取基于人眼位置估计的纯脸 分割方法, 通过对人眼瞳孔定位, 对输入图像进行定位和校准, 剔除了如头发和背景 等干扰信息, 得到尺度归一化的图 像, 然后对人脸图 像的灰度进行了标准化处理。 这 样,在预处理阶段就大大降低的图 像的维数,也为 特征提取做了必要的准备。 第三章 分析了对人脸图像的特征提取,介绍了基于 k l变换和小波变换的两种 特征提取方法。 并在此基础上, 提出了 本文采用的一种基于小波变换和k l 变换相结 合的特征提取方法。 第四 章 介绍了 人工神经网络的基本原理, b p网络的结构及其学习算法, 具体阐 述了本文b p网络设计过程中输入、输出层的设计、隐层结点数的选择、激励函数的 选择和初始值的 选取中 需要注意的问题. 在此基础上, 用一种改进的bp 算法对网络 进行训练,取得了不错的识别效果。 第五章 概括了 本文人脸识别仿真实验的步骤,并对实验结果进行了分析并与其 他方法进行了比较。 第六章 总结了 全文并展望了未来的工作。 硕士论文 基于bp神经网络的人脸识别技术的研究 2 人脸图像的预处理 对输入图像的 预处理是图像识别系统中非常重要的一步, 预处理的目 的是去除噪 声, 加强有用的信息, 并对输入测量仪器或其他因素所造成的退化现象进行补偿和复 原。 预处理的 执行与否完全决定于图像的质量和研究的问 题。 如果图像不清晰, 一般 改善的方法有直方图均衡、 图像锐化等, 某些背景的去除等也属于预处理操作。 背景 的 去除 是 必要的, 否 则 人 脸识别 将不是“ 纯脸” 的 人脸识别。 文献口 2 1 同 时 指出, 人 脸识 别的 对象应该 是 纯 脸 ( p 世 e face) , 而不应该 包 括 头发、 肩膀和背景等不 相关的 数 据, 因为这些不相关数据会导致不正确的决策边界集。 如果待识别的人脸图 像中含有 其它非纯脸的信息, 则很有可能是非脸部信息对决策起到了关键作用, 也就不再是真 正 意义 上的 人脸识 别。 本文 使 用基于眼睛 位置 估计的 纯 脸分割 方法【23 从原 始人脸中 分 割出对识别起关键作用的纯脸。 为了使在不同成像条件 ( 光照强度、 方向、 距离、 姿态等) 下拍摄的人脸图像具 有一致性, 尽量减少环境因素的影响, 保证具有较好的识别效果, 必须对人脸图像进 行预处理, 以实现归一化。 良 好的归一化, 会有效增强系统对成像过程不确定性的抵 抗能力。 归一化主要包括两方面内 容: 一是尺度归一化, 也称为位置校准, 有助于解 决由 于成像距离和人的姿态造成的人脸尺寸和头角度上的差异; 二是灰度归一化, 用 来对不同光强、 光源方向 下得到的图像进行补偿, 以 减弱单纯由 于光照变换造成的图 像信号的变换。 本文 是采用小波变换结 合k l 变换的 方法来 进行特征抽取的, 虽然同 一人脸在不同的光照角度、 光照强度下的差异反映到特征空间中有较大的差异, 但是 由 于采用了小波变换, 提取的低频图像部分具有对角度、 光照、 尺寸及表情等千扰信 息的不敏感性, 因此本文对于灰度归一化就略去了. 对人脸图像进行了尺度归一化后, 我们接 着对人脸图 像进行标准化处理, 最后得到灰度相同、 大小均为3 2 x 犯的纯人脸 图像。 2 . 1 人眼的定位 在绝大部分人脸识别技术中, 都需要进行人脸的 定位, 特别是眼睛的 准确定位, 这是由于两眼间距受光照或表情变化的影响最小, 所以常作为几何特征或图像尺寸的 归一 化标 准。 人 眼 定 位的 方 法有己 有很多, 有区 域 分割法网、 边缘提取 法25 , 灰度 投影 法 26l和模板匹 配 27 1 等方 法。 区域 分割法首 先 对人眼的 二 值图 像进行区 域分割, 然后设定一系列经 验值和支持函数粗定位眼睛, 该方法对于如人眼闭合、 戴眼镜等情 况定 位失败; 边缘提取法是首先进行对人脸图 像进行边缘提取, 然后用霍夫 变换检测 眼球, 构造一个包括眼睛、 眼睑的眼部模板, 用一系列函 数从能量角度找出眼睑, 该 l 3 硕士论文基于bp 神经网络的人脸识别技术的研究 方法需要做大量预处理, 参数过多的眼部模板不适合用于个体差异太大的人脸; 灰度 投影法对人脸图像进行水平和垂直方向的投影,根据波峰波谷的分布信息来定位眼 睛, 这种方法定位速度较快, 但波峰波谷的分布对不同的人脸和姿态的变化非常敏感, 定位精度较差, 并易陷入局部最小而导致定位失败; 模板匹配是一种有效的模式识别, 但需要对人脸图 像的大小和方向 进行归一化. 本文根据人眼位置的几何特征制定判定 规则, 依据这些规则找出二值图像中可能的人眼中心位置, 然后通过模板匹配, 找到 最优人眼中心位置对的纯脸分割。 2 . 1 . 1 基于人眼定位的纯脸分割 对眼睛进行精确定位以 后,依据人脸模型对人脸图像进行定位和尺度的归一化。 基于眼睛位置的人脸分割步骤如下: 根 据 分 割 及 定 位 算 法 得 到了 人 脸正 面图 像左、 右 两 眼中 心的 位置, 并 分 别 记 为凡 和凡, 根 据图2 . 1 1 . 1 所 示的 比 例 关 系, 进 行 人 脸 精 确定 位。 (l ) 进行图 像旋 转,以 使e,和式的 连线耳 ei, 保持水 平。 这保证了 人脸方向 的 一致性,体现了 人脸在图像平面内的旋转不变性。 (2)设 0 点 为 丽的 中 点 , 且 一 瓦卜 经 过 剪 裁 , 在 zd xz d 的 图 像 内 , 可 保 证。 点固 定 于 ( 0 5 d ,d) 处。 这保证了 人脸位置的 一致性, 体现了 人脸在图 像平面内 的 平移不变性。 具体缩放和剪切图 像时, 指定标准图像的两眼中心距离为d 个像素, 对两眼中心 距离不等于该值的图像按比 例缩放, 最后得到的标准人脸图 像两眼中心距离应该为d 个像素。以0点为中 心, 分别往上、下、左、右截取 0. 5d,1 . sd,d ,d 个像素而最 后得到大小相同的纯脸图像。 认一 孙 甄 黝 2 . l l i 纯脸分割示意图 2 . 2 本文的纯脸分割方法 本文使用的 南京理工大学人脸图 像库是由18人, 每人12幅2 56级的 灰度图 像组 成。其中人脸的位置、表情和姿态有不同的变化.图2. 2 . 1 是南京理工大学人脸图像 硕士论文墓于bp神经网络的人脸识别技术的 研究 3 特征提取 特征提取是模式识别研究的基本问题之一。 对于图像识别而言, 提取有效的图像 特征是完成图像识别的 首要任务。目 前用于图 像识别的 特征可以 分为如下几种四: ( 1)直观性 特征。 如图 像的 边缘、 轮廓、 纹理 或区 域等。 在 人脸识别中 用 得最多 的 直观性特征是几何 特征, 即 人脸的五官尺寸及相对位置。 这类特征虽然具有维数低 等优点, 但由于同一个人因表情及光照等条件变化往往会导致其尺寸及相对位置发生 较大的变化,因此识别效果并不令人满意。 (2) 灰度的 统 计 特征. 如 直方图 特征、 主 分量 特征等, 将图 像看作一种二维随机 过程, 可以引入统计上的各阶矩作为特征来描述和分析图 像, 它们能够在保留主要分 类信息的基础上大大降低特征的维数。 (3 ) 变换系数特征。 对图 像作各种数学变换, 可以 将变换的系数作为图 像的一种 特征, 例如foune r 变 换、 h o u gh变换、 h a d 翻ard 变 换等 在图 像特征提取方面 均有广 泛应用. 这类方法的优点是计算比较方便, 但其去相关能力不强. 系数特征的维数仍 较大。 (4 ) 代数特征。 它反映了图 像的一种内 在属性。 将图 像作为 矩阵看待, 可对其进 行各种代数变换, 或进行各种矩阵分解。 由于矩阵的 特征向量反映了矩阵的一种代数 属性, 并具有不变性,因此可用来作为图像特征。 在人脸识别中, 用来提取图像代数 特征的典型方法是 矩阵的 奇异值分解(s v 功。 特征提取的目 的是获得一组“ 少而精” 的分类特征, 即获得特征数目少且分类错 误 概率小的 特征向 量。 特征 提取常 常分以 下几步 进 行291: 第一步: 特征形成, 根据被识别的对象产生一组原始特征。 它们可以是传感器的 直接测量值,也可以是将传感器的测量值作某些计算后得到的值。以细胞识别为例, 通过图 像输入得到 细胞的 数字图 像。 根据细胞的数字图 像可以 计算出 细胞总面积、 总 光密度、 胞核面积、 核浆比 等等, 这些值我们称为 原始特征, 产生这些原始特征的过 程称为特征形成。 第二步: 特征 选择, 由 特征形成过程得到的原始特征可能很多, 如果把所有的原 始特征都作为 分类 特征 送往分类器, 不仅使分类器复杂, 分类计算判别量大, 而且分 类错误概率也不一定小。 因此需要减少特征数目 。 减少特征数目 的方法有两种: 一种 是特征选择,另一种是特征提取。 第三步: 特征提取, 特征提取是另一种减少 特征数目 的 方法。 对高维数据集合的 分析, 常常是一项很复杂的工作。 模式识别系统经常受到高维问 题的困 扰。 特征提取 过程是将数据空间 ( 模式空间)变换为特征空间, 在对象分类过程之前,它利用变量 硕士论文基于即神经网络的人脸识别技术的研究 变换使某些变量比其他变量更重要, 因此可以 将其看成是一种降维。 我们把那些更重 要的 变量称为 特征。 如果次要的 变量可忽略不计, 那么就达到了所需的降维的目 的. 虽然同 最初的 数据空间 相比, 特征空间 维数降 低得很多, 但它仍保留了 数据内 容的大 多 数本质信息。 此外, 从统计意义上讲, 次要分量有可能 来自 于噪声( 或者是来自 于 模式固 有 特性 无关的 外界 干扰) 。 因 此, 除去 这些 分量可能 会 有益处 13 010 人脸特征作为人脸表示的最有效方式,它的提取一般包括以下两个方面: (l) 特征 选择: 即 确定 一 种低维 特征向 量, 使之能 充 分、 完 整且 鲁棒 地表示 人脸。 (2 ) 特征 提取: 即 对原 始数 据进 行变换, 得到最 能 反映 模式 分 类的 本质 特征, 主 要是设计合 理的算法, 降低运算时间 和运算的复杂性。 由于本文采用的是小波变换和k l 变换结合的特征提取方法, 下面我们将着重加 以阐述。 3 . 1 基于小波变换的特征提取 3 . 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年四川省乐山市中考地理真题(原卷版)
- (教研室提供)2025年山东省临沂市沂水县中考二模英语试题
- 财务会计期末复习指导
- 部编版四年级下册第五单元《海上日出》教案
- 建筑施工特种作业-桥(门)式起重机司机真题库-10
- 建筑施工特种作业-建筑架子工(普通脚手架)真题库-10
- 2023-2024学年云南省临沧市云县高二下学期期末考试数学试卷(解析版)
- 2023-2024学年江苏省宿迁市高二下学期6月期末考试数学试题(解析版)
- 2023-2024学年河北省承德市高二下学期期末考试数学试题(解析版)
- 资助育人-课题
- 养老机构消防安全课件
- 主、被动防护网施工方案-图文
- GB/T 45565-2025锂离子电池编码规则
- 1、人教部编版二年级下册语文看拼音写词语(一类生字和书后词语)
- 2025年济南高新区九年级中考数学二模考试试题(含答案)
- 花椒库存收购协议书
- DB22-T2979-2019-基质沥青相似度检测红外光谱法-吉林省
- 《小王子绘本教学课件》
- 金华市皓升再生资源有限公司年回收拆解20万辆电动自行车生产线技改项目
- 2025年金融衍生工具试题
- 2025-2030中国陶瓷瓦行业市场现状供需分析及投资评估规划分析研究报告
评论
0/150
提交评论