(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf_第1页
(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf_第2页
(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf_第3页
(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf_第4页
(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(通信与信息系统专业论文)kl变换高斯模型的人脸检测算法研究及实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 人脸检测作为计算机视觉和交互领域以及模式识别的经典问题,长期以来一 直备受关注,近年来随着宽带无线通信网络迅速发展,人脸检测在安全访问、视 觉监测、数字视频处理、基于目标的视频压缩、基于内容的检索和新一代人机交 互等领域的广泛应用迫切需求,成为目前无线通信、安全监控及应急通信等研究 热点和关键技术。 本文在分析和比较现有经典人脸检测算法基础上,针对复杂背景下的多姿 态、有遮挡物人脸检测普遍存在的准确率不高,速度较低的问题,从现有高斯建 模人脸检测算法研究出发,剖析k l 正交变换算法应用在人脸肤色检测的优势, 提出基于k l 变换的高斯模型人脸检测算法,并在t m s 3 2 0 d m 6 4 3 7 平台上设计 并实现了整个算法。此外,结合d s p 平台优势,提出系统d s p 优化实现方案, 主要包括编译器优化,优化编译选项,提高代码性能;代码级优化,浮点算法定 点化,定点实现k l 变换算法;算法级别优化,针对耗时算法模块,改进算法, 包括高斯算法实现改进、腐蚀膨胀算法实现优化、快速人脸标记算法改进;最后 汇编级优化,对耗时核心代码部分采用线性汇编实现,提高代码并行处理能力。 最后构建了基于k l 变换高斯人脸检测试验系统,并对该系统采用自制人脸图像 数据库进行测试。实验结果显示本文提出的基于k l 变换高斯人脸检测算法在多 姿态、有遮挡物情景下检测率高,实时性好,鲁棒性强,对监控系统的智能化发 展具有重要的实际意义。 关键词:人脸检测;k l 变换:高斯模型;d s p 优化 a b s t r a c t a b s t r a c t h u m a nf a c ed e t e c t i o np l a y sa ni m p o r t a n tr o l ei na p p l i c a t i o n ss u c h 勰s e c u r e a c c e s s , v i d e os u r v e i l l a n c e , d i g i t a lv i d e op r o c e s s i n g ,v i d e oc o d i n gs y s t e m so f t a r g e t - b a s e d ,c o n t e n t - b a s e dv i d e or e t r i e v a la n dt h en e wg e n e r a t i o nh u m a nc o m p u t e r i n t e r f a c e r e c e n ty e a r s ,h u m a nf a c ed e t e c t i o ni st a k e ni n t oa c c o u n ta sa ni n d e p e n d e n t r e s e a r c hp r o j e c t i nv i e wo ft h ep o o rd e t e c t i o nr a t ea n dl o ws p e e do ft h ed e t e c t i o nf o rf a c e si n p r o f i l ev i e w ,p o s ev a r i e dh u m a nf a c e sa n df a c e sa g a i n s tc o m p l e xb a c k g r o u n dw h e n m a k i n ga na n a l y s i sa n dc o m p a r i s o ne x i s t i n gc l a s s i c a la l g o r i t h m s ,w ed ot h er e s e a r c h o fg a u s s i a nm o d e l i n ga l g o r i t h mf o rf a c ed e t e c t i o na n da n a l y s et h ea d v a n t a g eo ft h e k lt r a n s f o r ma l g o r i t h ma p p l i e di nf a c ed e t e c t i o n , t h e nw ep r o p o s et h ek l - g a u s s i a n m o d e l i n ga l g o r i t h mi ny c b c rc o l o rs p a c ef o rf a c ed e t e c t i o n , w h i c hi sd e s i g n e da n d i m p l e m e n t e do nt h et m s 3 2 0 d m 6 4 3 7p h t f o r m f u r t h e r m o r e , t od e v e l o pt h ed s p p l a t f o r ma d v a n t a g e ,t h eo p t i m i z a t i o ns c h e m ef o r0 1 1 1 d e s i g n e df a c ed e t e c t i o ns y s t e mi s p r o p o s e d ,i n c l u d i n gf l o a t i n gp o i n ta l g o r i t h mf i x e d p o i n tr e a l i z e d ;o p t i m i z i n gt h e c o m p i l e ro p t i o n st oi m p r o v ec o d ep e r f o r m a n c e ;d o i n gs o m eo p t i m i z a t i o ni na l g o r i t h m m o d u l e s ,s u c ha sg a u s s i a nm o d u l e ,c o r r o s i o ne x p a n s i o na l g o r i t h ma n df a s ta l g o r i t h m f o rf a c ec a n d i d a t ea r e al o c a t e d ,硒f o rs o m ei m p o r t a n tt i m e - c o n s u m i n gc o d e s ,w eu s e l i n e a ra s s e m b l yo p t i m i z a t i o n a tl a s t ,w ed os o m et e s t so n0 1 1 1 p r o p o s e df a c ed e t e c t i o n s y s t e mw i t hf a c et e s ts e tm a d eb yo u r s e l v e s ,t h er e s u l ts h o w st h a tt h ep e r f o r m a n c eo f t h es y s t e mi sg o o dw i mt l i g hd e t e c t i o nr a t ea n dg o o dr o b u s t n e s si nt h ec o n d i t i o nt h a t f a c e sw i t hd i f f e r e n t p o s e sa n da n g l e s ,w h i c h i s s i g n i f i c a n t t o t h e i n t e l l i g e n t d e v e l o p m e n to fv i d e os u r v e i l l a n c es y s t e m k e yw o r d s :f a c ed e t e c t i o n ;k lt r a n s f o r m ;g u a s s i a nm o d e l i n g ;o p t i m i z a t i o n h t a b l eo f c o n t e n t s t a b l eo fco n t e n t s c h a p t e r 1i n t r o d u c t i o n 1 1 1r e s e a r c hb a c k g r o u n d 1 2r e l a t e ds t a t u s 1 : 1 2 1 f a c ed e t e c t i o na p p r o a c h e sd i s c u s s e d 2 1 2 2 d i 伍c u l t yo f f a c ed e t e c t i o n 。4 1 2 3r e s e a r c ht r e n d s 5 1 3m a i nr e s e a r c ha n dl i h es t r u c t u r eo ft h e s i s 5 c h a p t e r2 f a c ed e t e c t i o na l g o r i t h md e s i g n 7 2 1s k i nc l u s t e r i n gi nc o l o rs p a c e 7 2 1 1 c o l o r s p a c ee x p r e s s i o n 7 2 1 2 s k i nc o l o rd i s t r i b u t i o n 7 2 1 3d i s t r i b u t i o no f s k i nc o l o ri nr g bs p a c e 8 2 1 z l 】 j :s ic o l o rs p a c e 9 2 1 5d i s t r i b u t i o no fs k i nc o l o ri ny c b cs p a c e 10 2 2g a u s s i a nm o d e l i n gb a s e do n 】 i e 【。t r a n s f o r mf o rf a c ed e t e c t i o n 1 1 2 2 1k lt r a n s f o r m 11 2 2 2g a u s s i a nm o d e l i n gb a s e do nk lt r a n s f o r mf o rf a c ed e t e c t i o n 12 2 2 3f a c ed e t e c t i o na l g o r i t h md e s i g nb a s e dg u a s s i o n - k lm o d e l i n g 15 2 3 c h a p t e rs u m m a r y c h a p t e r3 f a c ed e t e c t i o na l g o r i t h m i m p l e m e n t 17 3 1t m s 3 2 0 d m 6 4 3 7d e v e l o p m e n tp l a t f o r m 3 1 1t m s 3 2 0 d m 6 4 3 7p l a t f o r mr e s o u r c e 17 3 1 2c c s d e v e l o p m e n te n v i r o n m e n t 1 9 3 1 3t h ed e s i g nf o rf a c ed e t e c t i o ns y s t e mo nd s p 2 0 3 2 l i g h t i n gc o m p e n s a t i o ni m p l e m e n t 2 0 3 2 1n e e df o rl i g h t i n gc o m p e n s a t i o n 2 0 3 2 2 p r i n c i p l eo fl i g h t i n gc o m p e n s a t i o na l g o r i t h m 2 1 3 2 3l i g h t i n gc o m p e n s a t i o ni m p l e m e n ta n dr e s u l t 21 3 3k l - g a u s s i a nm o d e l i n ga l g o r r h mi m p l e m e n t 2 2 3 3 1k lt r a n s f o r ma l g o r i t h mi m p l e m e n ta n dd e t e c t i o nr e s u l t 2 2 3 3 2g a u s s i a nm o d e l i n ga l g o r i t h r ni m p l e m e n ta n dd e t e c t i o nr e s u l t 2 4 t 山l eo fc o n t e n t s 3 3 。3k l g a u s s i a nm o d e l i n ga l g o r i t h mi m p l e m e n tf o rf a c ed e t e c t i o n 2 5 3 4m a t h e m a t i c a lm o r p h o l o g yo p e r a t i o n 2 7 3 4 1 m o r p h o l o g i c a lp r o c e s s i n g 2 7 3 4 2c o r r o s i o ne x p a n s i o na l g o r i t h mi m p l e m e n ta n dr e s u l t 2 7 3 5f a c ec a n d i d a t ea r e al o c a t e d 3 1 3 5 1p i x e ll a b e l i n gm e t h o di m p l e m e n t 31 3 5 2r e g i o ng r o w i n ga l g o r i t h mi m p l e m e n t 3 3 3 5 3f a c ec a n d i d a t ea r e al o c a t e dr e s u l t 3 5 3 6 c h a p t e rs u m m a r y :;6 c h a p t e r4o p t i m i z a t i o nf o rf a c e d e t e c t i o na l g o r i t h mo nd s p 3 7 4 1 c o m p i l e ro p t i o n so p t i m i z e 3 7 4 1 1 p r i n c i p l eo f c o m p i l e ro p t i o n so p t i m i z a t i o n 3 7 4 1 2a c h i e v er e s u l t sa n da n a l y s i s 3 8 4 2s o u r c ec o d eo p t i m i z e 4 0 4 2 1k lt r a n s f o r ma l g o r i t h mf i x e d - p o i n ti m p l e m e n t 。4 0 4 2 2a c h i e v er e s u l t sa n da n a l y s i s 4 2 4 3 o p t i m i z a t i o nf o ra l g o r i t h m sm o d u l e 4 2 4 3 1g a u s s i a nm o d e l i n ga l g o r i t h mo p t i m i z e da n dr e s u l t s 4 3 4 3 2c o r r o s i o ne x p a n s i o na l g o r i t h m o p t i m i z e da n dr e s u l t 4 5 4 3 3f a c ec a n d i d a t ea r e al o c a t e do p t i m i z e da n dr e s u l t 4 6 4 4l i n e a ra s s e m b l yo p t i m i z a t i o n 。”4 8 4 4 1 i m p l e m e n t a t i o nf o rl i n e a ra s s e m b l yo p t i m i z a t i o n 4 9 4 4 2l i n e a ra s s e m b l yo p t i m i z a t i o nf o rm e a nf i l t e r 4 9 4 5 c h a p t e rs u m m a r y 5 0 c h a p t e r5 r e s u l ta n d a n a l y s i so f t h ef a c ed e t e c t i o ns y s t e m 51 5 1t h es t a n d a r df o rf a c ed e t e c t i o na l g o r i t h m 5 2c h o o s ef a c et e s ts e t 川m 川川川 5 1 5 3 d e t e c t i o nr e s u l t sa n d a n a l y s i s 5 2 5 3 1t e s tp l a t f o r m 5 2 5 3 2 d e t e c t i o nr e s u l t sa n da n a l y s i s 5 2 c h a p t e r6s u m m a r y a n d p r o s p e c t s 5 5 6 1r e s e a r c hs u m m a r y 。5 5 6 2f u t u r er e s a r c h v i i 5 6 t a b l eo f c o n t e n t s r e f e r e n c e s 5 7 p a p e r s p u b l i s h e d 5 9 a c k n o w l e d g e s 6 0 v i 第一章绪论 第一章绪论 1 1人脸检测研究背景 近年来,随着计算机技术日趋成熟,作为计算机视觉和交互领域基础技术的 人脸检测备受关注。早期人脸检测追溯到2 0 世纪6 0 , - - 7 0 年代的人脸识别研究。 相对指纹、语音、虹膜等生物特征识别技术,人脸信息量丰富,采集方便隐私性 不强,特征信息直接应用,不易假冒和盗用,人机界面友好,易于用户接受。因 此,人脸成为近年来发展迅速的人体生物识别特征之一。模式识别与人工智能技 术的发展以及安全、商业等领域的迫切需求更促使利用人脸图像进行自动的人脸 检测和身份验证的研究和应用得到空前的重视。 在机场、地铁、火车站、军事要害部门以及银行、商场、展厅等安全敏感性 场合,视觉监测无处不在,传统被动式监控无法自动分辨威胁是否存在,只能依 靠监控者根据大量监控画面主观判断,高强度的精神集中难以保证每次警报不被 疏忽。因而全天实时智能监控,自动分析捕捉的图像数据,发现可疑对象自动报 警监测系统有着较大市场需求,同时也节约了相应人力、物力和财力。人脸信息 检测或者步态的跟踪识别技术即是上述智能监控的重要技术。 人脸检测技术应用广泛,不仅限于全自动人脸识别系统及各种安全领域的监 控和身份识别系统,人脸检测已经开始涉及全新人机交互【l 】,即在高级用户接口 应用领域中,我们希望未来机器能与人类进行信息交流,这就要求设备感知外部 环境,代替传统的键盘或鼠标输入模式、独立提取周围环境的重要信息( 如人脸 信息等) ,结合面部表情、身体姿势分析来智能交互信息。这对于机场等高噪声 的场合,基于视觉的高级用户接口能够提供比语音识别更加准确的信息输入。 此外,人脸检测开始涉及视频压缩领域,新一代视频编码标准m p e g - 4 中引 入基于内容编码的这一概念,丰富变化的脸部表情蕴含大量信息,因而在基于内 容的编码中,人脸成为重点区域,算法在每帧图像中定位人脸,并把它从编码图 像中分割出来,采用低压缩率编码,其它非感兴趣区域如背景,就采用压缩率较 高的编码。目前这种编码方式在可视电话,视频会议等方面已经开始应用。 日常的身份认证、人口统计、社会调查、实时监测、视频搜索、电子商务等 第一章绪论 应用都与人脸检测息息相关,研究人脸检测技术具有十分重要的应用价值。目前, 国内外的文献中所涉及的人脸检测算法已经有很多种,许多重要的国际会议和期 刊都也都涉及到人脸检测问题研究论题。 1 2人脸检测研究现状 人脸检测是指对于任意一幅给定的图像,采用一定的方法对其进行搜索以确 定其中是否含有人脸,如果是则返回人脸的位置、大小和姿态【2 1 。各国的科研人 员作了很多的研究,国外比较著名的有卡内基梅隆大学( c m u ) 的机器人研究 所,美国麻省理工大学( m i t ) 的媒体实验室和人工智能实验室等;国内的有微 软亚洲研究院、中科院自动化研究所、清华大学等都有很多从事人脸检测方面的 研究。 1 2 1 现有人脸检测方法概述 一些最新的技术和方法也被应用到解决人脸检测问题当中,新方法、新技术 层出不穷。许多研究者已经提出大量人脸检测定位的方法,主要有: 1 基于肤色模型的方法 在彩色图像中,颜色是人脸表面最为显著的特征之一。y a n g 等【3 】在通过对不 同种族、不同个体的肤色分析后,得出人类的肤色在颜色空间有聚类性结论,指 出影响肤色不同最主要因素是亮度变化,从而根据肤色在颜色空间的分布来推断 该像素点是否为肤色区域。这种方法的最大优点是鲁棒性强,对姿态变化不敏感。 用彩色信息检测人脸的关键是合理选择色度坐标,常用颜色空间包括r g b ( 三 基色) 、h i s ( 色调、饱和度、亮度) 、y c b c r ( c c i r 6 0 1 编码方式的色度模型) 、 y i q ( 灰度、橙青色调、紫黄色调) 、c i e ( i n t e r n a t i o n a lc o m m i s s i o n o ni l l u m i n a t i o n ) 、 t s l ( t i t a t s a t u r a t i o n - l u m a ) 等。 2 基于知识的方法 基于知识的方法【4 】就是基于人脸的先验知识,先提取人脸的各种结构特征, 然后根据一些知识规则来检验它们是否符合人脸的先验知识,以此来确认图像中 是否包含人脸,它属于自上而下的演绎方法。这些特征主要包括:灰度特征、轮 廓和形状特征、结构特征、纹理特征等。比如人脸的眉、眼和嘴等区域的灰度值 较低,前额、脸颊、鼻梁和下颚等其他区域的灰度值较高,这就是人脸的灰度分 2 第一章绪论 布特征。y a n g 等【4 】在1 9 9 4 年提出基于镶嵌图( m o s a i ci m a g e ,又称为马赛克图) 的人脸检测方法,人脸的五官区域被划分为4 x 4 个和8 x 8 个马赛克块,并根据每 块的灰度值来制定准则进行判定,这种由粗至细的检测思想对以后的研究工作产 生积极的影响。此外还有基于双眼检测的方法【5 】、基于概率框架的局部特征聚类 方法【6 】、以及结构模型、纹理模型和特征模型相结合的方法【7 】等局部特征检测方 法。一些简单的规则容易找到来描述人脸的特征与特征之间的关系,但这类方法 存在的问题是很难将先验知识转换为明确定义的规则,且人脸存在个体差异,容 易受姿态的影响,鲁棒性不强,所以基于知识的方法主要针对简单背景下的正面 人脸的检测。 3 基于特征的方法 相对于基于先验知识的自上而下的演绎方法,基于特征的方法【4 】是一种自下 而上的归纳的方法,首先检测人脸的部分不变特征,然后再综合这些部分特征确 定是否为人脸。如眉毛、眼睛、鼻子和嘴巴等脸部特征先被抽取出来,构造一个 统计模型来描述抽取特征之间的关系,进而验证是否为人脸。典型算法有g r a f 等【8 】首先利用带通滤波器选择出一段频率,然后根据形态学的知识设定一系列的 阈值找出眼睛、嘴巴等区域,最后依照以上位置检测出人脸。这种基于特征的方 法的主要问题是人脸的这些特征很有可能被遮挡物破坏,明暗光线影响。 4 基于模板匹配的方法 模板匹配的方法分为两类:固定模板和变形模板。固定模板方法首先设计得 到一个或几个标准模板,然算计算检测区域与标准模板之间的相关值,当相关值 符合所制定的准则就判断检测区域为人脸。文献t 9 q 丁采用“平均脸模板匹配”:利 用多个样本构造平均脸模板,利用似然度计算公式计算出似然度,根据相应阈值 进行判断。y u i l l e e l o 】等提出用可变形模板。变形模板首先制定出模板参数,然后 调整参数值以达到模板与测试图像以某种能量函数为度量的弹性匹配,直至检测 出人脸面部器官的位置。基于模版匹配的算法在针对正面单人脸的运用中取得了 较好的效果。对于复杂背景的人脸检测,建立一个能很好的区分背景干扰同时又 代表各种差异人脸的模板是问题的关键点。同时针对各种姿势、形状、大小不一 的人脸检测对于模板匹配又是一大挑战。 5 基于统计理论的方法 基于统计模型的检测方法依靠统计分析和机器学习技术,从大量的人脸与非 3 第一章绪论 人脸样本中找到相应的人脸和非人脸图像的统计特征,再使用各自的特征训练出 分类器,不再使用人脸的特征信息等先验知识。常用的基于统计模型的检测方法 有:基于特征空间的方法,将人脸区域图像变换到某一特征空间,根据其在特征 空间中的分布规律划分“人脸”与“非人脸”两类模式,由t u r k 和p e n t l a n d i l l 】提出的 使用主分量分析( p r i n c i p a l c o m p o n e n ta n a l y s i s ,p c a ) 为主要代表;基于神经网 络的检测方法,把统计特性隐含在人工神经网( a 1 州) 的结构和参数之中,其 中效果较好是由c m u 的r o w l e y 等人【1 2 】提出的人工神经网络系统;支持向量机 ( s u p p o r tv e c t o rm a c h i n e s s v m ) 是v a p n i k 等【1 3 】提出的基于结构风险最小化原理 ( s t r u c t u r a lr i s km i n i m i z a t i o np r i n c i p l e ,s r m ) 的统计学习理论,用于分类与回归 问题。基于统计理论的方法不对输入图像进行复杂的处理,而是用结构化的方法 对大量的人脸特征训练分类器,但由于需要对所有可能的检测窗口进行穷举搜 索,计算复杂度很高,另外非人脸样本的选取仍然是一个较为困难的问题。 1 2 2 人脸检测难点 由于人脸模式的可变性和复杂性,以及被检测的对象的随意性及周围环境的 动态性,人脸检测是一个具有挑战性的模式检测问题,其主要难点包括( 1 ) 人 脸特征可变性强,人脸结构复杂,变化性较大,胡须、发型、肤色变化以及穿衣 打扮都对人脸检测有较大影响;( 2 ) 脸部表情丰富,人脸作为一个非刚性物体, 表情的变化直接影响脸部特征变化,使得人脸模式存在可变性,无论对于人脸的 检测还是识别,这些都是难点;( 3 ) 遮挡物的情况,眼镜、衣帽或其他遮挡物的 部分遮掩,无法采集人脸全部信息,这对正确检测识别人脸是一挑战;( 4 ) 成像 角度的不同造成人脸多姿态,如平面旋转、深度旋转以及上下旋转,其中深度旋 转影响较大;( 5 ) 图像成像条件影响,光线因素( 光强、光源分布、亮度、对比 度以及阴影等) 和相机特质( 镜头、相机的焦距、成像距离等) 都会影响图片质量。 人脸实在不同的光照条件和相机特质下会得到不同的人脸图片( 6 ) 背景的干扰, 在待检测的背景图像中,不可避免存在有类人脸的图像,这些干扰图像往往被误 判为人脸图像。 针对以上问题,如果能够找到一些相关的算法并能在应用过程中达到实时, 将为成功构造出具有实际应用价值的人脸检测与跟踪系统提供保证。如果人脸检 测走向实用,那就必须实现可靠性和实时性的要求。 4 第一章绪论 1 2 3 人脸检测研究趋势 人脸检测是个发展很快的研究方向,新方法层出不穷,有人从频域提取特征, 有人将最新的分类决策理论应用在人脸检测领域,也有人将多种技术结合在一 起,取长补短,充分利用多种信息来提高人脸检测效果。研究者们从不同的角度 出发根据不同的信息来设计检测方法,很多的人脸检测方法一般都针对某一类问 题而提出。人脸检测的应用价值及应用前景决定了可靠性强实时人脸检测算法是 未来人脸检测研究的发展趋势。适应于各种复杂背景的人脸分割技术将成为研究 重点,实时动态人脸检测定位与识别和基于嵌入式硬件平台的人脸检测算法开发 将成为研究热点。 1 3论文的研究内容及章节安排 本文在总结人脸检测研究现状的基础上,归纳总结了现有人脸检测方法,针 对目前人脸检测研究普遍存在的鲁棒性不强实时性不好的技术难点,以家居安防 监控为应用背景,以人脸肤色在特定空间聚类分布为依据,分析现有人脸肤色模 型的基础上,提出基于k l 变换的高斯模型人脸检测算法,并在t m s 3 2 0 d m 6 4 3 7 平台上进行了相关开发和优化,对人脸检测算法的实用性开发提供一定的参考价 值。具体章节安排如下: 第一章概述人脸检测的研究背景及研究意义,以及国内外在该领域的研究现 状,对现有人脸检测方法进行了归纳,分析了当前技术难点,引出研究趋势,提 出本文研究内容。 第二章在分析人脸肤色在色彩空间聚类分布可测性基础上,对比肤色在 r g b 色彩空间、h i s 色彩空间、y c b c r 色彩空间聚类分布情况,选择在y c b c r 色彩空间对人脸肤色检测进行算法设计研究;从现有高斯模型检测算法研究出 发,剖析k l 正交变换算法应用在人脸肤色检测的优势,提出基于k l 变换的高 斯模型人脸检测算法设计思想,并给出算法框架设计。 第三章提出基于d s p 的k l 变换高斯模型人脸检测系统的设计,搭建了基 于t m s 3 2 0 d m 6 4 3 7 的d s p 开发平台,并依次设计实现光线补偿模块、基于k l 变换高斯模型算法模块、形态学开运算处理模块、人脸候选区域标记算法模块, 并给出每个模块的算法设计流程及实现效果。 5 第一章绪论 第四章结合t m s 3 2 0 d m 6 4 3 7 开发平台丰富的资源,为充分发挥平台优势, 本章给出人脸检测系统d s p 优化实现方案,主要包括浮点算法定点化,保证检 测结果前提下,定点实现k l 变换算法;编译器优化,通过分析编译器优化原理, 选择合适的编译优化选项,提高代码性能;算法级别优化,针对耗时算法模块, 对算法进行改进,包括高斯算法实现优化、腐蚀膨胀算法实现优化、快速人脸标 记算法改进;汇编级优化,对耗时核心代码部分采用线性汇编指令,提高代码并 行处理能力。对于每一优化方案实现,给出相应实现效果及分析。 第五章以设计实现的人脸检测系统为测试平台,自建人脸测试图库为测试对 象,按照人脸检测算法评价指标,对基于k l 变换的高斯模型人脸检测算法进行 测试,展示部分测试结果并分析。 第六章对全文进行总结,对未来工作进一步展望。 6 第二章人脸检测算法设计 第二章人脸检测算法设计 2 1 肤色色彩空间聚类性 2 1 1 色彩空间表示 根据光度学和色度学原理,所有颜色都可以用相互独立的三种基本颜色组合 得到,这三种颜色定义为三基色,从而构成一个色彩坐标系。在计算机色彩理论 中指出,一种颜色在计算机中有不同的表达方式,这样不同的色彩空间共存。著 名的格拉斯曼定律告诉我们,所有颜色都可以用互相独立的三基色混合得到,任 意两种颜色相混合产生的新颜色与分别采用各自三基色成分再混合起来得到的 结果相同。其中最直接的表示方法是我们所熟知的由红、绿、蓝三基色构成的 r g b 色彩空间,此外常用的色彩空间还有y u v 、h s i 和y c b c r 等。一般情况下, 我们都是以r g b 色彩空间为基础来描述其它类型的色彩空间,将其它色彩空间 的基色描述为三基色的线性或非线性函数。 2 1 2 人脸肤色可测性 根据皮肤生理结构理论,皮肤由表皮层( e p i d e r m i s ) 、真皮层( d e r m i s ) 、皮 下组织( s u b c u t a n e o u st i s s u e ) 三部分构成。在m s t o r r i n g 掣1 4 】建立的皮肤反射模 型中发现,我们所观察到的肤色颜色一部分来自表皮上直接反射的少量入射光, 另一部分则是被吸收的大量入射光在真皮层发生光反射通过表皮层射出。胆红 素、血色素和p 胡萝卜素决定真皮层的反射光颜色,它在不同人种中构成是相同 的,所以不同人种所表现出的不同肤色主要由表皮层上的那部分反射光决定,即 表皮层内的黑色素含量不同造成的。m j j o n e sa n dj m r e h g t l 5 】在大量数据样本上 研究发现在某些颜色空间上肤色与非肤色分布是明显具有可分性的。通过实验【1 6 】 观察发现,不同人种、不同光照下的人体肤色差异主要体现为亮度的不同,那么 在色度平面里肤色分布是能够比较好的聚类,不同人种和不同光照时也只是表现 为肤色区域的轻微位移n 们。上述研究表明通过计算机自动检测人脸肤色是可行 的。 7 第二章人脸检测算法设计 2 1 3 人脸肤色r g b 色彩空间聚类 r g b 色彩空间是最常见的色系坐标系,国际照明委员会( c i e ) 选用红色( 波长 7 0 0 o h m ) 绿色( 波长5 4 6 1 n m ) 蓝色( 波长4 3 5 8 n m ) - - 种单色光为r g b 色系坐标 系的三基色,如图2 1 所示,r g b 色彩空间的每个分量的范围是 o ,2 5 5 ,原点坐 标( o ,0 ,0 ) 表示在r 、g 、b 分量上的亮度都为零,表示黑色;当r 、g 、b 三个分量 亮度都达到最大( 2 5 5 ,2 5 5 ,2 5 5 ) 时为白色,正方体的其他顶点依次表示为蓝、紫、 红、绿、青、黄常用颜色,中间的虚线称为灰度直线,线上每点r g b 值都相等, 这时没有了色度,只有灰度值。虽然r g b 色彩空间表示简单,在文献【1 刀有提到 在r g b 彩色空间中,彩色通道间相关性很强,合成图像存在色调变化较小、饱 和度偏低、视觉效果较差等问题,造成了在对图像相关的色彩处理分析上,效果 不是很理想。 图2 一lr g b 色系空间 据相关数据统计,人脸的肤色信息较均匀地分布r g b 三个分量上,区间分 别为r 1 5 1 ,2 5 5 、g 9 7 ,2 3 9 、b 8 4 ,2 3 3 。之前提到每个分量的范围是 o ,2 5 5 ,那 么人脸在每个分量都占据着整个色彩范围的5 0 左右,由此看来肤色信息在 r g b 空间的过度分散,在此基础上,也有人提出归一化r g b 色彩空间,即r g b 亮度归一化来缩小肤色差异,让肤色信息空间分布更紧凑些,归一化可用如下公 式简单得到: 第二章人脸检测算法设计 ,: 墨 ( 2 1 ),= k 厶一l , 月+ g + 占 0 - :旦 ( 2 2 ) = 一 kz zj 。 r + g + 刀 。 6 : 垒 ( 2 3 ) r + “+ 口 其中( r ,g ,b ) 表示归一化后的三个色彩分量,从上述公式可以看出,r g b 色彩 空间到归一化r g b 空间的转化,根据什g + b = 1 ,由一个三维空间变换到了二维空 间,第三个分量成了冗余分量。尽管如此,无论r g b 色彩空间还是归一化r g b 空间,色度信息与亮度信息没有分离,故肤色信息容易受环境光照的影响,使得 肤色分割的结果不可靠,此外r 、g 、b 相关性强,三个色彩分量冗余信息多, 因而在r g b 色彩空间对人脸肤色进行建模并不是理想的选择。 2 1 4t l $ i 色彩空间 在h s i 色彩空间中,h ( h u e ) 表示色度,s ( s a t u r a t i o n ) 表示饱和度,i ( i n t e n s i t y ) 表示亮度。h s i 色彩空间呈圆柱体分布,如图2 2 所示,色度h 为与中轴线的夹 角度数,物理意义为最相近的频谱波长,当h 为0 0 时为红色,1 2 0 0 时为绿色, 2 4 0 0 时为蓝色。图中点与中轴线距离代表饱和度s ,中轴线的饱和度为0 ,所以 中轴线也叫灰度线,柱体侧面的点的饱和度参数是1 ,为最大值,此时颜色最鲜 亮。亮度i 可以理解为点到圆柱体下底面的距离高度,那么在中轴线也就是灰度 线上,下底面圆心亮度为0 为最小值就表示黑色,上底面圆心亮度为2 5 5 为最大 值表示白色。 图2 - 2l l s i 圆柱色彩空间 由此可见,h 和s 代表像素点的颜色,i 值仅代表像素点亮度,不包含颜色 9 第二章人脸检测算法设计 信息,这就是h s i 色彩空间的优点,它将亮度i 与反映色彩本质特性色厦h 、饱 和度s 分离开。当在色彩空间提取人脸肤色时,就可以排除了光照明暗的干扰, 直接分析反映肤色色彩本质特性的色度、饱和度的聚类情况。对r g b 空间的r g b 分量可以通过公式转换到h s i 色彩空间,h s i 色彩空间与r g b 色彩空间之间的 相互转换是非线性的,计算量比较大,其中0 为与中轴线的夹角,转换公式如下: 红叫意黯器 沿4 , 日:j 乡( g b ) ( 2 - 5 ) 肛12 :一口( 苫 s :1 一3 m i n ( r , g , b )( 2 6 ) r + g + 占 ,:r + g + b( 2 7 ) ,= 一 i 三一fj 2 1 5 人脸肤色y c b c r 色彩空间聚类 y c b c r 彩色模型是以演播室质量标准为目的的c c i r 6 0 1 编码方案中采用的 彩色表示模型。其中y 代表亮度,c b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论