




已阅读5页,还剩54页未读, 继续免费阅读
(计算机软件与理论专业论文)基于支持向量机的彩色人脸检测技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 人脸检测与识别技术是人工智能和机器视觉领域富有挑战性的研究课题之 一。让计算机像人类一样能够记忆、识别人脸一真是计算机科学工作者追求的 目标。人脸自动识别系统是目前计算机视觉领域的一个重要研究课题,而人脸 自动识别系统中作为定位人脸的人脸检测是整个人脸识别系统正常及高效工作 的基础。近年来,人脸检测在安全监视、基于内容的图像检索等领域方面显示 了潜在的应用价值。 本文收集和分析了大量近年来国内外关于人脸检测与识别的学术论文及文 献,对计算机人脸检测的若干问题进行了探讨,针对建立自动人脸识别系统的 第一个重要环节人脸检测方法进行了深入的研究,实验表明本文提出的人 脸检测方法是合理的,具有一定的理论价值与实用价值。本文的研究工作主要 包括以下几个方面: 1 、将传统的边缘检测算法引入到人脸的边缘检测中,并且比较了几种常用 的边缘检测算子的优劣。选取了比较理想的两种边缘检测算子:c a n n y 算子和 s o b e l 算子,并试验性地将两种算子结合在一起用于人脸检测,得到了比较理想 的人脸边缘线。 2 、针对彩色图像的色彩信息,实现了人脸肤色检测。在比较了几种常用的 色彩空间后,文中采取的是色度和亮度分离的y c r c b 空问,试验证明取得了一 定的效果,肤色信息在快速人脸检测中具有很高的实用价值。 3 、利用统计学习理论中s v m 来进行人脸检测。本文在深入研究s v m 的理论 和算法的基础上,在实践过程中,有效利用肤色信息,采用启发式搜索方法, 并且利用p c a 变换来降低人脸样本维数这些方法,其着眼点在于克服s v m 计算 速度较慢这个缺点,实现了快速多尺度多人脸检测。试验证明了s v m 方法具有 较好的理论价值和实用价值。 4 、通过大量的试验结果,分析了选取肤色信息、边缘信息等小计算量特征 用于人脸检测的局限和意义。同时以s v m 为代表指出了基于统计学理论这类方 法应用前景。 人脸检测,也包括识别,是一种实践性较强的应用,要检测或是识别人脸 这种复杂多变的高维模式,并须针对实际应用,采用多种方法综合的方式,最 终有效提高检测识别算法的准确度和速度。 关键字:人脸检测,边缘检测,肤色模型,支持向量机,主成分分析 a b s t r a c t t h ea u t o m a t i cr e c o g n i t i o na n dd e t e c t i o no fh u m a nf a c ei so n eo ft h em o s t i n t e r e s t i n g a n dc h a l l e n g i n gt o p i c si nt h ef i e l d so fa r t i f i c i a l i n t e l l i g e n c ea n d c o m p u t e rv i s i o n i ti st h ea i mo fm a n yr e s e a r c h e r sa n ds c i e n t i s t sw o r k i n gi nt h i s f i e l dt om a k ec o m p u t e ro w nh u m a n sn a t u r a la b i l i t yt or e m e m b e ra n dr e c o g n i z e p e r s o n s f a c e s t od e v e l o par o b u s ta u t o m a t i cf a c er e c o g n i t i o ns y s t e mi sat a r g e ti n t h ef i e l do fm a c h i n ev i s i o n a n dt h ef i r s ts t e po fr e c o g n i t i o ni st h ed e t e c t i o no ft h e f a c e ,w h i c hw o r k sa st h ef o u n d a t i o no ft h ea v a i l a b i l i t ya n de f f i c i e n c yo ft h ew h o l e s y s t e m r e c e n ty e a r s ,o w i n gt ot h eg r e a t l yp o t e n t i a lr e q u i r e m e n ti nt h ea p p l i c a t i o n s o fs e c u r i t ys u r v e i l l a n c e ,i m a g es e a r c hb a s e do nc o n t e n t sa n ds oo n ,f a c ed e t e c t i o ni s d e v e l o p i n ga sas y s t e m i ca n di n d e p e n d e n tr e s e a r c hb r a n c ha t t r a c t i n gm o r ea n dm o r e i n t e r e s t so fr e s e a r c h e r s a g r e a ta m o u n to fl i t e r a t u r e s ,s u r v e y sa n dr e s e a r c hp a p e r sc o n c e r n i n gu p t o d a t e t e c h n i q u e so ff a c ed e t e c t i o na n df a c er e c o g n i t i o na r er e a da n da n a l y z e d s o m eh o t i s s u e sa b o u tf a c ed e t e c t i o na r ed i s c u s s e d t h er e s e a r c ho ft h ef i r s ti m p o r t a n ts t e po f b u i l d i n ga na u t o m a t i cf a c er e c o g n i t i o ns y s t e m - - f a c ed e t e c t i o na r ea t t e m p t e d e x p e r i m e n t si n d i c a t et h a tt h em e t h o d so ff a c ed e t e c t i o np r o p o s e di n t h i sp a p e ra r e r e a s o n a b l e s h o w i n gac e r t a i nd e g r e eo ft h e o r e t i c a la n dp r a c t i c a lv a l u e n er e s e a r c h w o r ko ft h i sp a p e rm a i n l yi n c l u d e st h ef o l l o w i n gs e v e r a la s p e c t s : 1 t r a d i t i o n a le d g ed e t e c t i o na l g o r i t h m sa r ei n t r o d u c e di nh u m a nf a c ed e t e c t i o n a p p l i c a t l o n s t h ec o m p a r i n g o fs e v e r a lc o m m o na l g o r i t h m s a d v a n t a g e sa n d d i s a d v a n t a g e si sm a d et h r o u g ht h er e s u l t so ft h e m t w op o t e n t i a la l g o r i t h m s - - c a n n y a n ds o b e l - - a r es e l e c t e da n dah y b r i dm e t h o dc o m b i n i n gt h e s et w oa r ea t t e m i p t e dt o a d o p tt ot h ea p p l i c a t i o no ff a c ed e t e c t i o n c o m p a r a t i v ei d e a le d g el i n e so ff a c e sa r e d e t e c t e d ,w h i c hh a v em e a n i n g f u li n d i c a t i o nt on e x ts t e po fd e t e c t i o n 2 f a c ed e t e c t i o na l g o r i t h mb a s e do nt h em o d e lo ff a c e s s k i nc o l o ri sc a r r i e do u t b yu s i n gt h ec o l o ri n f o r m a t i o no fc o l o ri m a g e y c r c bc o l o rs p a c ei nw h i c hc h r o m a a n dl u m i n a n c ea r es e p a r a t e di sa d o p t e db e c a u s eo fi t sh i g hs u i t a b i l i t yt ot h ef a c e d e t e c t i o na p p l i c a t i o nc o m p a r i n gw i t ho t h e rc o l o rs p a c e s t h er e s u l t ss h o wt h a ts k i n c o l o ri n f o r m a t i o np l a y sap r a c t i c a lr o l ei nt h ef a s tf a c ed e t e c t i o n 3 t h es y s t e mo ff a c ed e t e c t i o nb a s e do ns v mi sd e v e l o p e d s v mt h e o r ya n d i l - a l g o r i t h ma r ed e e p l ys t u d i e d t h r o u g ht h ep r o c e s so ft h ea c h i e v i n go ff a s tm u l t i s c a l e f a c ed e t e c t i o n ,t h et h e s i sm a i n l yf o c u s e so nh o wt oo v e r c o m et h et i m e c o n s u m i n g f e a t u r eo fs v mb yu s i n gt h es k i nc o l o ri n f o r m a t i o no fi m a g e st or e d u c et h e a n t i c i p a t i v ea r e a s ,h e u r i s t i cs e a r c hm e t h o dt oi n c r e a s ed e a l i n gs p e e da n dp c a t r a n s l a t i o nt od e c r e a s et h ed i m e n s i o n so ff a c es a m p l e s e x p e r i m e n t a lr e s u l t ss h o w t h a tt h ea l g o r i t h mb a s e do nm a c h i n el e a r n i n g t h e o r yh a sb e t t e rt h e o r yv a l u ea n d p r a c t i c a lv a l u e 4 b a s e do nt h e s ee x p e r i m e n t a lr e s u l t s ,t h ed i s a d v a n t a g e sa n dm e r i t so fs m a l l c o m p u t i n gf e a t u r e s ,l i k es k i nc o l o r ,e d g ea n ds oo n ,a r ea n a l y z e d t h ep r a c t i c a l p e r s p e c t i v eo ft h e o r yb a s eo ns t a t i s t i c sl i k es v mi sp r e s e n t e d f a c e d e t e c t i o n ,i n c l u d i n gr e c o g n i t i o ni s ah i 曲l y p r a c t i c a la p p l i c a t i o n t h e p a r t i c u l a rd e m a n do fa p p l i c a t i o nm u s tb et a k e ne n o l l g ha t t e n t i o no nt h ep r o c e s so f d e t e c t i o na n d r e c o g n i t i o no fh u m a nf a c e ,w h i c hi ss u c ha c o m p l i c a t e d h i a h - d i m e n s i o np a t t e r n i n t e g r a t e dm e t h o d sa t ef r e q u e n t l ye m p l o y e dt oa c h i e v et h e a c c u r a c y ,e f f i c i e n c ya n dr e a l - t i m ea b i l i t yo ft h es y s t e m k e y w o r d s :f a c ed e t e c t i o n ,e d g ed e t e c t i o n ,s k i nc o l o rm o d e l ,s u p p o r tv e c t o rm a c h i n e s ( s v m ) ,p r i n c i p l ec o m p o n e n ta n a l y s i s ( p c a ) 1 1 1 此页若属实请申请人及导师签名。 独创性声明 y8 6 0 2 2 5 本人声明,所呈交的论文是我个人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得武汉理工大学或其它教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了谢意。 研究生签名: 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅; 学校可以公布论文的全部内容,可以采用影印、缩印或其他复制 手段保存论文。 ( 保密的论文在解密后应遵守此规定) 研究生签名:麦垃导师签名:遂 注:请将此声明装订在论文的目录前。 日期加占受8 武汉理工大学硕士学位论文 第1 章前言 1 1 应用背景及理论实践意义 生物特征识别( b i o m e t r i ci d e n t i f i c a t i o nt e c h n o l o g y ) ,就是利用人体所固有 的生物特征,分为生理特征或行为特征,来进行个人身份鉴定。生理特征是人 类与生俱来的,常用的包括,脸楣、虹膜、指纹、人体气味等:而常用的行为 特征包括:声音、笔迹、步态等。虽然人类的行为特征是多为后天习得的,但 是和生理特征一样,从理论上说,生物特征都具有以下的特点:( 1 ) 共性与个 性:就是说人拥有的共同特征,但是其形式各不相同,比如我们每个人都有手 掌,但是每个人的掌纹都不一样;( 2 ) 稳定性:即这种特征应该是不随时间变 化而发生变化,或者是变化很微小,不会影响到识别效果,就像我们的掌纹; 在实际的应用中,用于生物特征的身份识别系统的生物特征还需要一些特性以 满足识别要求,如可采集性:即所选择的特征应该便于提取和量度。正是这样 的一些特点,使得生物特征识别比起传统的身份识别方法显示出了其颠覆和优 越! 传统的身份识别方法主要基于身份标识物品和身份标识知识。身份标识物 品如钥匙、证件、自动取款机的银行卡等;身份标识知识包括用户名、密码等。 而生物特征识别技术认定的对象就是人本身,不需要复杂的密码,也不需要携 带钥匙智能卡一类的物品,确保其采集的直接和便捷,而且这种认人不认物的 方法更能确保其鉴别的可靠性,不易仿造和假冒。 虽然在古代,人们就懂得通过人体的生物特征的测量来鉴别身份。真正意 义上的生物特征识别技术兴起于2 0 世纪末,随着信息技术的飞速发展和人类活 动空间的不断扩大,现代社会对于人类自身身份识别的准确性、安全性与实用 性提出了更高要求,于是,生物识别悄然兴起,据预测,生物识别技术将在电 子商务领域应用前景广阔。生物识别技术有着广大的市场商机。据国际生物集 团( i n t e r n a t i o n a lb i o m e l r i cg r o u p ,i b g ) 的统计:到2 0 0 7 年将达到4 0 亿美元。 而震惊全世界的“9 1 1 ”事件更被视为世界生物识别技术发展的转折点,生物识 别的研究和应用得到了世界各国前所未有的重视。美国连续签署了3 个国家安 全法案( 爱国者法案、姣空安全法案、边境签证法案) ,要求必须采用生物认证 技术。美欧等国对个人护照、身份证等加入生物特性数据的强制要求,催生了 开发生物特征技术和产品的新产业。将先进的生物特征识别技术用来制作护照 等身份证件。即电子护照( ep a s s ) 。在生物特征识别领域,我国在虹膜研发单 武汉理t 大学硕士学位论文 项上与国际先进水平相当,其他方面仍存在相当差距n 人脸识别技术( f a c er e c o g n i t i o nt e c h n i q u e s ,f r t ) ,既利用人的面部要确 定人的身份,是生物特征识别技术的一个主要方向,与其他生物特征相比,人 脸特征在提取上具有主动性、非侵犯性和用户友好等优点,基于人脸面部特征 的识别技术是一种更为直接方便,并且容易被人们接受的识别方法。3 0 年的有 关研究以及在商业需求的扩大和法律保证的完善的条件下,人脸识别技术受到 各科学院研究机构以及商业组织越来越大的重视,并得到长足的发展,基于各 种方法的入脸识别系统也应运而生。然而,由于人脸本身的柔性性质,加上受 到光线、姿势、表情变化等等外部因素的影响,人脸的识别的准确度受到很大 的限制,到目前为止,众多的人脸识别系统还远远达不到人类识别能力,建立 一个鲁棒性很高的识别系统仍然是一个很有挑战的问题。 人脸识别,是一个涵盖了多学科领域的实际应用问题,近年来越来越受到 这些领域的研究学者的重视,包括图像处理,模式识别,神经网络,计算机视 觉,计算机图形学,甚至心理学等等。这方面的研究也取得了很大的进展,出 现了专门的国际学术会议,如a v b p a , a f g r 。并且,还伴随产生了一系列的人 脸识别的评估标准,包括f e r e t 1 ,2 ,3 1 ,f r v t 2 0 0 0 4 】,f r v t 2 0 0 2 5 】和 x m 2 v t s 6 协议,和一些商用产品,如v i s i o n i c s 公司的f a c e l t 等等。 1 2 人脸检测识别技术现状与发展动态 人们很早就对人类的面部带给我们的信息感兴趣,并且也作了一些早期的 研究【7 ,8 】。随着计算机技术的发展,最早的人脸识别的研究开始于二十世纪中 后期【9 ,1 0 】,但是人脸的自动机器识别系统的研究开发始于7 0 年代( k e l l y 1 1 】 和k a n a d e 1 2 1 ) 。从他们的工作起至今,大多数人脸识别研究工作的对象为正面 或接近正面的人脸图像。人脸识别实验所采用的人脸库通常不大,最常见的人 脸库一般包括几百幅左右的人脸图像,如m i t 库、y a l e 库、c m u 库、o r l 库, 这些均为小型库,由于不同人脸库之问的输入条件各异,不同的识别程序之间 很难进行比较。为促进人脸识别算法的深入研究和实用化,美国国防部发起了 入脸识别技术工程。 首先根据处理对象是静态图像格式还是视频格式,把人脸识别系统分为两 类。所以概括的讲,人脸识别就是在给定的人脸静态图像或者视频中鉴别或是 武汉理工大学硕士学位论文 验证当前对象。从研究的角度,人脸识别分为三个部分( 见图1 1 ) ,第一步, 在复杂的背景中检测出人脸,判断其中是否存在人脸。第二步,从检测到的人 脸上抽取特征,如脸部器官的位置和形状信息。第三步,把提取的特征与人脸 数据库中的人脸进行比较,判断该人脸的身份信息。 f a c ed e t e c t i o n 严 f a c er e c o g n i t i o n 目 静 图1 - 1 在具体的应用上,又分为人脸鉴别( i d e n t i 丘c a t i o n ) 和人脸验证( v e r i f i c a t i o n ) 。 当然,这三个步骤也不是完全相互独立的,比如,用于识别的人脸特征也常常 用来做人脸检测。下面将针对特征的抽取和对人脸检测代表性别技术做出综述。 1 2 1 人脸检测方法 最初人脸研究主要集中在人脸识别领域,而且早期的人脸识别算法也都是 在认为已经得到了一个正面人脸或者人脸很容易获得的前提下进行的。但是随 着人脸应用范围的不断扩大和开发实际系统需求的不断提高,人脸检测开始作 为独立的研究内容发展起来。 y a n g 等【1 3 】将人脸检测定义为:任意给定一个图像或者一组图像序列,人 脸检测的目的就在于判定该图像或图像序列中是否存在人脸。如果存在,则返 回其位置和空间分布。 根据人脸检测所处理图像的不同又可将其分为两类:基于肤色特征的人脸 检测和基于灰度特征的人脸检测。基于肤色特征的方法适用于构造快速的人脸 武汉理t 大学硕士学位论文 检测和人脸跟踪算法,基于灰度特征的方法利用了人脸区别于其它物体的更为 本质的特征,是人脸检测领域研究的重点。由于人脸检测问题的复杂性,无论 那一类方法都无法适应所有的情况,一般都针对人脸检测领域内某个或某些特 定的问题。 对于灰度图像,目前存在的方法主要可分为三类:基于表象 ( a p p e a r a n c e - b a s e d ) 的方法,基于特征( f e a t u r e - b a s e d ) 的方法和基于模 板( t e m p l a t e b a s e d ) 的方法。对于彩色图像,由于其能够提供更丰富的信息, 因此,可以采用有别于灰度图像的处理方法,利用彩色图像的自身特性进行入 脸检测。例如y a n g 和a h u j a 1 4 在1 9 9 8 年的工作中,利用人的皮肤颜色建立 了一个皮肤模型。首先根据图像的颜色进行分割,将其划分为不同的区域,然 后将符合皮肤颜色的区域进行合并,直到形成椭圆这种近似人脸轮廓的区域来 判定人脸是否存在。 人脸检测研究的趋势是利用多种线索,如头发、肤色、器官、轮廓、模板 等,综合多种分类方法( 混合高斯模型、概率模型、神经网与支持向量机等) 、 启发式信息与统计学习方法相结合。随着人脸检测研究的深入,必然产生对各 种方法进行客观评价的要求:这就需要一系列的为研究者所公认的测试图像集。 此类测试集的推出以及在此基础上的检测算法的征集与评测工作,必然对人脸 检测研究的深入开展起到很大的推动作用。人脸检测新方法还将不断涌现,必 将与人脸识别研究等一道逐步走向实际应用。 1 2 2 特征抽取 对人类而言,人脸是皮肤、肌肉和器官的组合。而对计算机来说,人脸图 像是像素的灰度值矩阵,计算机中用什么样的知识来表达人脸对象就成为一个 很关键的问题。一组好的特征不仅要充分反映不同人脸之间微妙的差别,同时 又必须保证同一对象的不同人脸图像特征有好的聚类性。而且决定了人脸识别 的方法。 1 2 2 1 直观几何特征 在早期的人脸的自动识别系统的研究中,就是基于直观的脸部几何特征的。 b l e d s o e 提出了基于人脸特征点的阃距、比率等特征【9 】。k e l l y 的t = 作在与b l e d s o e 的工作相似,但是不需要人工介入【1 2 】。k a n a d e 用几何量作为人脸的特征,这 武汉理t 大学硕士学位论文 些几何量包括眼角、嘴巴、鼻孔、下巴尖,这些点之怄j 的距离以及它们成的角i n 】。 b u l l r 用图表示法和描述树法给出了人脸的3 3 个主要特征与1 2 个次要特征,其 主要特征包括了2 4 个基于眼睛、人脸中,i l , 、嘴的测量 1 5 1 。y u i l t e 提出了包括头 发、鼻子、嘴并用弹簧连接边缘的全局人脸模板以抽取出眼睛与嘴1 1 6 1 。 其中,眼睛作为最重要的人脸脸部特征,因其距离不随脸部表情变化而变 化,被广泛的用来标准化所有的几何量测特征。n i x o n 用h o t i g l l 变换检测眼睛 的周边【1 7 】,l a m 提出用基于眼角信息估计的可变模板抽取眼睛边界 1 8 1 。 1 2 2 2 代数特征 k i r b y 和s i r o v i c h 在k l 展开的框架下讨论了人脸图像的最优表7 示 1 9 1 ,任 何图像都可以近似地用特征图的线性组合来表示,通过增加特征图的数量可以 提高所给图像的表示精度,他们讨论的重点是人脸的表示。t u r k 和p e n t l a n d 2 0 1 由实验人脸数据库中的人脸图像得到了一个人脸平均图像,然后计算每个人脸 图像与平均图像的差异,进而对所求出的样本散布矩阵作k l 变换以求出特征向 量,即得封特征脸( e i g e n f a c e ) ;在求出特征脸后,将人脸图像投影銎l 每个特征 脸上,人脸图像就可以用一个权值向量来表示。 此外,f i s h e r 脸( f i s h e r f a c e ) 、b a y e s 脸( b a y e s f a c e ) 和频谱脸( s p e c t r o f a c e ) 均是近年来发展起来的一些著名的代数特征方法。 人脸的直观几何特征比较稳定,受人脸的姿态变化与光照等因素的影响小, 但不易抽取,而且量测精度不高。人脸的代数特征容易得到,但稳定性较差, 对姿态变化较敏感。也有研究提出抽取由几何量测、眼睛区域、外部轮廓、侧 面图像这四组特征组成的特征向量用于识别 2 t l 。 1 2 2 3 形状特征 鉴于代数特征的缺陷,人们又把注意力转回到精确地提取特征目标的形状。 这里用得较多的方法之一是动态轮廓模型( a c t i v ec o n t o u rm o d e l 又称s n a k e ,最 早由k a s s 等人提出2 2 1 ,用来跟踪人嘴的轮廓) 的方法,其主要思想是寻找在初 始位置附近的局部能量最小点。如果能选择一个合适的初始位置,s n a k e 将会收 敛于较为精确的特征轮廓。但其缺点一是需要合适的初始位置,二是收敛速度 较慢。为了获得眼睛的精确轮廓且要保证较快的收敛速度,l a m 币1 h o n g 提出了 一个新的改进算法【1 8 】。 武汉理工大学硕士学位论文 1 3 本文内容安排 下面按章节介绍本文主要做的几个方面的工作: 在本文的第二章,将传统的边缘检测算法引入到人脸的边缘检测中,并且 比较了几种常用的边缘检测算子的优劣。选取了比较理想的两种边缘检测算子: c a n n y 算子和s o b e l 算子,并试验性地将两种算子结合在一起用于人脸检测,得 到了比较理想的人脸边缘线,为人脸检测的下步奠定了基础。 第三章专门针对彩色图像的色彩信息,实现了人脸肤色检测。在比较了几 种常用的色彩空间后,文中采取的是色度和亮度分离的y c r c b 色彩空间,试验 证明取得了一定的效果。另外,分析了肤色信息应用于人脸系统的局限性,同 时指出了选取肤色信息、边缘信息等这些小计算量特征的优点与缺点。 在第四章中,针对以前章节中小计算量特征的检测方法的缺陷,从机器学 习的角度研究人脸检测的问题。利用统计学习理论中s v m 来进行人脸检测,在 深入研究s v m 的理论和算法的基础上,着眼于如何克服s v m 计算速度较慢这个 缺点,有效利用肤色信息,采用启发式搜索方法,并且利用p c a 有效降低人脸 样本维数,实现了多尺度多人脸检测。试验证明了s v m 方法具有较好的理论价 值和实用价值。 最后,对本文所做的研究工作和系统的技术实现进行了全面性的总结。并 对人脸检测技术的将来做出了展望。 武汉理工大学硕士学位论文 第2 章基于边缘检测的人脸检测 边缘( e d g e ) 是指图像局部强度变化最显著的部分。边缘主要存在于目标 与目标、目标与背景、区域与区域( 包括不同色彩) 之间,是图像分割、纹理 特征和形状特征等图像分析的重要基础。图像分析和理解的第一步常常是边缘 检测( e d g ed e t e c t i o n ) 。由于边缘检测十分重要,因此成为机器视觉研究领域最 活跃的课题之- - 2 3 。利用图像的边缘特征检测人脸时,其计算量相对要小的多, 可以用来提高检测速度。大多数使用边缘特征的算法都是基于人脸的边缘轮廓 相似于椭圆的特性。 2 1 图像边缘检测 图像中的边缘通常与图像强度或图像强度的一阶导数的不连续性有关1 2 4 1 。 图像强度的不连续可分为:( 1 ) 阶跃不连续,即图像强度在不连续处的两边的 像索灰度值有着显著的差异;( 2 ) 线条不连续,即图像强度突然从一个值变化 到另一个值,保持一个较小的行程后又返回到原来的值。在实际中,阶跃和线 条边缘图像是很少见的,由于大多数传感元件具有低频特性,使得阶跃边缘变 成斜坡型边缘,线条边缘变成屋顶形边缘,其中的强度变化不是瞬间的,而是 跨越一定的距离。 对一个边缘来说,有可能同时具有阶跃和线条边缘特性。例如在一个表面 上,由一个平面变化到法线方向不同的另一个平面就会产生阶跃边缘;如果这 一表面具有镜面反射特性且两平面形成的棱角比较圆滑,则当棱角圆滑表面的 法线经过镜面反射角时,由于镜面反射分量,在棱角圆滑表面上会产生明亮光 条,这样的边缘看起来像在阶跃边缘上叠加了一个线条边缘由于边缘可能与场 景中物体的重要特征对应,所以它是很重要的图像特征。比如,一个物体的轮 廓通常产生阶跃边缘,因为物体的图像强度不同于背景的图像强度。 武汉理t 大学硕士学位论文 2 1 1 图像梯度 边缘检测是检测图像局部显著变化的最基本运算。在一维情况下,阶跃边缘 同图像的一阶导数局部峰值有关。梯度是函数变化的一种度量,而一幅图像可 以看作是图像强度连续函数的取样点阵列。因此,同一维情况类似,图像灰度 值的显著变化可用梯度的离散逼近函数来检测。梯度1 2 4 1 是- - 阶导数的二维等效 式,定义为向量: c ( x 引: 【j 矽 。- 。一 缸 可 。一 印 ( 2 1 ) 其中向量g ,y ) 的方向就是函数f ( x ,y ) 增大时的最大变化率方向,梯度的 幅值由下式给出: 1 6 ( x ,y ) l 一+ g ;( 2 2 ) 在实际应用中,通常用绝对值来近似梯度幅值: :g(x川,y)li:=igxi+删ic,ig(xm a 劬亿3 2 4 )i ,) ) l = x 幢i ,l g _ ,f ) 、7 由向量分析可知,梯度的方向定义为: a ( x ,y ) 一a r d 趾( q q ) ( 2 5 ) 注意梯度的幅值实际上与边缘的方向无关,这样的算子称为各向同性算子 ( i s o t r o p i co p e r a t o r s ) 。对于数字图像,式2 1 中的导数可用差分来近似。最简单 的梯度近似表达式为: 萋:篇# 嚣劣,g ,- ,【f ,卜,f f + l ,】、 请注意f 对应于石轴方向,而,对应于负y 轴方向。这些计算可用下面的简单卷 积模板来完成: q 一l l ,q ( 2 7 ) 在计算梯度时,计算空问同一位置x 和_ ) ,处的真实偏导数是至关重要的。然 武汉理工大学硕士学位论文 而采用上面公式计算的梯度近似值q 和g v 并不位于同一位置,q 实际上是内 插点f f ,j + v 2 】处的梯度近似值,g ,是内插点【f + 1 2 ,j 】处的梯度近似值。由于这 个缘故,人们常常使用2 x 2 一阶差分模板,而不用1 2 或2 x l 模板来求x 和y 的 偏导数: q = :;,q = - 1 1 二( 2 8 ) q 2 1 1 ,q一1 ( 2 8 ) 用上式计算石和y 方向梯度的位置是相同的,这一点位于内插点 【i + v 2 ,+ 1 2 】处,即在2 x 2 邻域的所有四个像素点之间。不过这种计算可能会 导致一些混淆,所以,通常用3 x 3 邻域计算梯度值。 2 1 2 边缘检测算法 2 1 2 1 基本步骤 边缘检测算法【2 4 】有如下四个步骤: 滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计 算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。 需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此, 增强边缘和降低噪声之间需要折衷。 增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以 将邻域( 或局部) 强度值有显著变化的点突显出来。边缘增强般是通过计算梯度 幅值来完成的。 检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域 中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点。最简单的边缘 检测判据是梯度幅值阈值判据。 定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分 辨率上来估计,边缘的方位也可以被估计出来。 在边缘检测算法中,前三个步骤用得十分普遍。这是因为大多数场合下, 仅仅需要边缘检测器指出边缘出现在图像某一像素点的附近,而没有必要指出 边缘的精确位置或方向。边缘检测误差通常是指边缘误分类误差,即把假边缘 武汉理工大学硕士学1 1 i ) :论文 判别成边缘而保留,而把真边缘判别成假边缘而去掉。边缘估计误差是用概率 统计模型来描述边缘的位置和方向误差的。我们将边缘检测误差和边缘估计误 差区分开,是因为它们的计算方法完全不同,其误差模型也完全不同【2 5 ,2 6 】。 以下将介绍常用的几种边缘检测器以及用这几种检测器的部分试验结果。 2 1 2 2 边缘检测梯度算子 r o b e r t s 算子 r o b e r t s 边缘检测算子是一种利用局部差分算子寻找边缘的算子,它为梯度 幅值计算提供了一种简单的近似方法: g i ,j - i f i ,j - f i + l ,j + 1 1 1 + y i + 1 ,卜f i ,+ 1 】| ( 2 9 ) 其中f ( x ,y ) 是具有整数像素坐标的输入图像,用卷积模版表示法,上式变 成: g i ,j j l g ,l + g y i ( 2 1 0 ) 其中e 和g v 由下面的模板计算: q 一:三,g y - :- 。1 亿 同前面的2 2 梯度算子一样,差分值将在内插点p + 1 2 ,+ 】2 】处计算。r o b e i t s 算子是该点连续梯度的近似值,而不是所预期的点【f ,】处的近似值。 r o b e r t s 边缘检测器的试验结果见下图: 武汉理工大学硕十学位论文 s o b e l 算子 图2 1r o b e , s 边缘检测试验结果 正如前面所讲,采用用3 x 3 邻域可以避免在像素之闽内插点上计算梯度, s o b e l 算子是边缘检测器中最常用的算子之一,考虑下图中所示的点o ,) 周围点 的排列。 0 口1口2 口7g ,) 码 口6 n 54 4 图2 2 s o b e l 算子用以下的方法来计算梯度幅值: m m a x ( s ,s 。) ( 2 1 2 ) 其中的偏导数用下式计算: 其中常数c t2 。 和s ,可用卷积核如下 g 、,、, 吼气 + + 鸭 + + 0 6 0 0 一 一 、,、j吒 + + + + 0 0 = = 一1 = - 2 - 1 武汉理工大学硕士学位论文 1 ,s y 一0 1 s o b e l 边缘检测器的试验结果见下图: 图2 3s o b e l 边缘检测试验结果 2 1 2 3l o g ( l a p l a c i a n - g a u s s ) 算子 前面讨论了计算一阶导数的边缘检测器,如果所求的一阶导数高于某一阈 值,则确定该点为边缘点。这样做会导致检测的边缘点太多。一种更好的方法 就是求梯度局部最大值对应的点,并认定它们是边缘点。通过去除一阶导数中 的非局部最大值,可以检测出更精确的边缘。一阶导数的局部最大值对应着= 阶导数的零交点,这意味着在边缘点处有一阶导数的峰值,同样地,有二阶导 数的零交叉点。这样,通过找图像强度的二阶导数的零交叉点就能找到边缘点。 拉普拉斯( l a p l a c i a n ) 算子就是常用的二阶导数算子。 图像函数, ,y ) 的拉普拉斯算子公式为: v zr 磐+ 善( 2 1 5 ) 孤 砂 先使用差分方程对x 和y 方向上的二阶偏导数近似,然后分别通过中心点的 变换到以点( f ,f ) 为中心的理想近似式为: f i ,+ 1 - 2 f i ,】+ f ,- 1 】 r 2 1 6 ) f i + 1 ,卜2 f i ,】+ f i l 门 把这两个式子合并为一个算子,用来表示近似拉普拉斯算予的模板: 、, m 0 1 o 2 0 也 1 2 1 o o 0 ; = 盟舻塑矿 武汉理工大学硕士学位论文 0l0 v 2 1 41 ( 2 1 7 ) 01o 当拉普拉斯算子输出出现过零点时就表明有边缘存在,但是要除去无意义 的过零点( 灰度值为0 的区域) ,不过由于噪声,结果可能不会很精确。 利用图像强度二阶导数的零交叉点来求边缘点的算法对噪声十分敏感,所 以,希望在边缘增强前滤除噪声。为此,m a r r 和h i l d r e t h 将高斯滤波和拉普拉 斯边缘检测结合在一起,形成l o g ( l a p l a c i a no f g a u s s i a n ,l o g ) 算法,也称之 为高斯拉普拉斯算法。 l o g 边缘检测器的实验结果见下图: 图2 4l o g 边缘检测试验结果 2 1 2 4 坎尼( c a n n y ) 算子 检测阶跃边缘的基本思想是在图像中找出具有局部最大梯度幅值的像素 点。检测阶跃边缘的大部分工作集中在寻找能够用于实际图像的梯度数字逼近。 图像梯度逼近必须满足两个要求:( 1 ) 逼近必须能够抑制噪声效应;( 2 ) 必须 尽量精确地确定边缘的位置。但是抑制噪声和边缘精确定位是无法同时得到满 足的。有一种线性算子可以在抗噪声干扰和精确定位之间提供最佳折衷方案, 它就是高斯函数的一阶导数,对应于图像的高斯函数平滑和梯度计算。 梯度的数值逼近可用3 1 中列出的x 和y 方向上的一阶偏导的有限差分来表 示。高斯平滑和梯度逼近相结合的算子不是旋转对称的。这种算子在边缘方向 上是对称的,在垂直边缘的方向上是反对称的( 沿梯度方向) 。这也意味着浚算 子对最急剧变化方向上的边缘特别敏感,但在沿边缘这一方向上是不敏感的, 其作用就像一个平滑算子。 武汉理工人学硕士学位论文 c a n n y 算子也是一阶算子,其方法的实质是用一个准高斯函数作平滑运算, 然后以带方向的一阶微分算予定位导数最大值,它可用高斯函数的梯度来近似, 在理论上它很接近四个指数函数的线性组合形成的最佳边缘算子。 c a n n y 边缘检测器的实验结果见下图: 图2 - - 5c a n n y 边缘检测试验结果 2 2 人脸外轮廓线的提取方法 在入脸外轮廓线的提取中,由上面的实验看出,这些边缘提取算法诸如 s o b c l 、l o g 、c a n n y 算子等很难获得满足要求而且可靠度商的连续边缘,某些 对比度低的地方甚至连边缘都检测不到,我们可以在这些算子基础上来探讨人 脸轮廓提取的新途径。就是利用人脸的外轮廓是一条类抛物线的平滑曲线,同 时具有对称性【2 7 】这一几何特性在边缘提取算法处理的基础上去除杂散边缘,同 时对人脸轮廓进行连接和修补,可以得到较为连续、单一和定位精度高的外轮 廓线。 2 2 1 图像去噪音预处理 跟任何图像一样,人脸图像是将标准像通过扫描仪输入计算机的,图像一 定会受到噪声干扰,产生失真。边缘检测常常把噪声当作边缘点检测出来,而 真证的边缘没被检测出来。因此,为了不损坏人脸图像中的轮廓边缘等重要信 息,同时较好地去除噪声,用非线性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年犬类行为学面试题
- 2025年放射医学面试模拟题及解析
- 2025年安全管理基础测试题及答案
- 2025年客运站安全员工作手册题解
- 2025年宠物芳香疗愈师初级面试模拟题及答案集锦
- 2025年烹饪大厨专业资格考试试题及答案解析
- 2025年旅游规划与管理实务应用考核试题及答案解析
- 2025年健身教练资格考试试题及答案解析
- 2025年建筑安全检测师资格考试试题及答案解析
- 2025年柜台理财师专业技能水平评定试题及答案解析
- 酒吧承包经营合同(标准版)
- 2025年有限空间作业操作证考试题库附答案
- 跨境监管合作模式-洞察及研究
- GB/T 2423.21-2025环境试验第2部分:试验方法试验M:低气压
- 新概念第二册单词表(完整版)
- WJ30059-2023军用爆炸品设计安全技术规程
- UASB厌氧塔设计计算书
- 2009-2022历年江苏省镇江市丹阳市事业单位考试《综合知识和能力素质(会计审计类岗位)》真题含答案2022-2023上岸必备带详解版3
- 项目工作计划进度表Excel模板(推荐)
- 筷子兄弟小苹果电声乐队总谱
- 脓毒症的诊断和治疗进展ppt课件
评论
0/150
提交评论