(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf_第1页
(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf_第2页
(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf_第3页
(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf_第4页
(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(电力电子与电力传动专业论文)图象中眼睛和嘴巴的检测与定位.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a bs t r a c t i nt h i sp a p e r , f i n dt h el o c a t i o no ft h ef a c er e g i o n s ,t h e nd e t e c ta n d l o c a t et h ee y e sa n dm o u t hi nt h ee x i s t e df a c er e g i o n sa n dt a r g e tt h e i m p o r t a n tc h a r a c t e r i s t i c so ft h er e l e v a n tp o i n t s ,s u c ha s :r e g i o n a lc e n t e r , e y e sc o m e r s ,a n dm o u t hc o m e r s m a i nr e s e a r c hm e t h o d sa r ea sf o l l o w s : ( 1 ) p r o p o s ean e wa p p r o a c ht os e g m e n tt h ef a c er e g i o n s c u r r e n t l y , t h ef a c er e g i o n a ls e g m e n t a t i o nm a i n l yr e l i e so ns k i n c o l o rs p a c ei nc e r t a i n s p e c i f i cc h a r a c t e r i s t i c so ft h ec l u s t e r b u tt h el i g h to ft h ef a c ei se a s i l y i m p a c t e db yt h el i g h to f t h ee n v i r o n m e n t ,w h i c hc a u s e su n e v e nb r i g h t n e s s o ft h ef a c e a n dw h e nt h e r ea r eb a c k g r o u n d sw i t hs i m i l a rc o l o rw i t ht h e s k i no re x i s t e n c e so fm u l t i p l es k i nr e g i o n s ,i ti sd i f f i c u l tt oa c c u r a t e l y p o s i t i o n i n gf a c er e g i o n t h i sp a p e rp r o p o s e su s i n gf a c ec o n t o u ra n df a c i a l f e a t u r e ss h o wt h ed i s t r i b u t i o no ft r i a n g u l a rp o s i t i o nt ol o c a t e t h ef a c e r e g i o n s ,w h i c hc a n w e l la v o i dt h ea b o v e m e n t i o n e di m p a c t ( 2 ) p r o p o s e an e wa p p r o a c ht ol o c a t et h e e y e s a n dt h e i r c h a r a c t e r i s t i c s i nt h eb i n a r yi m a g e s ,t od e t e c te y e si nt h ef i r s th a l fo ft h e f a c er e g i o n ,t h i sc a ns h o r tt h et e s t i n gt i m e u s i n gt h em i n i m u me n c l o s i n g r e c t a n g l e ( m e r ) t od e s c r i b et h ec o n t o u r so ft h er e g i o n s ,a n dl o c a t i n gt h e e y e sr e g i o n sb a s e do nt h el e n g t ha n dw i d t hr a t i oa n dt h el o c a t i o n , c o n s i s t e n c y a n do t h e rc o n s t r a i n t sd i s t i n c t i o nb e t w e e nt h e e y e sa n d e y e b r o w s ,h a i rr e g i o n a n df i n dt h ec e n t e ro ft h ee y e su s i n gt h ea r e a c e n t r o i d t h e n ,l o c a t et h ee x a c tp o s i t i o no ft h ep u p i l sc o m e r su s i n gh a r r i s c o m e rd e t e c t i o n a l g o r i t h m b a s e do nt h ef illi n g a l g o r i t h m a n d m o r p h o l o g i c a lc l o s eo p e r a t i o n ( 3 ) p r o p o s e an e w a p p r o a c h t ol o c a t et h em o u t ha n di t s c h a r a c t e r i s t i c s c h a n g i n gt h es e c o n dh a l fo ft h ef a c er e g i o n si n t ob i n a r y o n e s ,w h i c hc a nm u c hc o m p l e t e l ys a v et h em o u t hc o n t o u r s t h e nu s i n g t h em i n i m u me n c l o s i n gr e c t a n g l et od e s c r i b et h ec o n t o u r so ft h er e g i o n s , a n dl o c a t i n gt h em o u t hr e g i o n sb a s e do nt h el e n g t ha n dw i d t hr a t i oa n d t h el o c a t i o ni n f o r m a t i o n ,a n df i n dt h ec e n t e ro ft h ee y e su s i n gt h ea r e a c e n t r o i d f i n a l l y ,l o c a t et h em o u t hc o m e r su s i n gh a r r i sc o m e rd e t e c t i o n a l g o r i t h mb a s e d o nt h e f i l l i n ga l g o r i t h ma n dm o r p h o l o g i c a lc l o s e o p e r a t i o n a c c o r d i n gt om a n yt e s t s ,t h e d e t e c tt h et a r g e t s e s p e c i a l l y , t h e a l g o r i t h mc a ne a s i l ya n da c c u r a t e l y m e t h o do ff a c es e g m e n t a t i o nw e l l r e s o l v e st h ep r o b l e m so ft h a tr e l yo nt h ec l u s t e r so ft h es k i n u s i n gt h e f i l l i n ga l g o r i t h ma n dm o r p h o l o g i c a lc l o s eo p e r a t i o n t oh e l pt h eh a r r i s c o m e rd e t e c t i o na l g o r i t h md e t e c tt h ec o m e r so fm o u t ha n de y e si m p r o v e d t h ea c c u r a c y t od e t e c tt h ee y e sa n dm o u t hr e s p e c t i v e l yi nt h ef i r s t a n d s e c o n dh a l fo ft h ef a c er e g i o n sc a ns h o r tt h et e s t i n gt i m ea n di m p r o v e t h e a c c u r a c y k e yw o r d sc o m p u t e rv i s i o n ,f a c e l o c a t i o n ,e y e sd e t e c t i o n ,m o u t h d e t e c t i o n ,c o m e r 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:,澎 , 丝 日期:趟;l 年上当 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 作者签名:爿) i ,l , 导师签名日期:癣月正邈 、垒 硕l :学位论文第一章绪论 1 1 选题背景及研究意义 第一章绪论 生物特征识另i j ( b i m e t r i c s ) 是指通过计算机利用人体所固有的生理特征或行为 特征来进行个人身份认证的一种技术。它将在国家安全、公安、司法、金融等领 域有着广泛的应用。如重要部门的合法进入、计算机网络登录控制、信用卡持卡 人的身份验证、嫌疑犯的身份辨认等。 现代社会中,对人体身份鉴别需求可以说无处不在,并与同俱增。例如,某 人是否有权进入某安全系统,是否有权进行特定的交易,某人是否是某国的居民 等。银行每天都有人存钱取钱,解决储户的身份认证就显得极为重要,随着因特 网的广泛普及和应用的深入,电子商务已经是人们耳熟能详的,并且已经逐步走 入人们生活的一件新鲜事。但是在电子商务中关键的一个问题就是要解决人的身 份认证问题。改革丌放以来,深圳海关每天出入的人口可谓成千上力,对进出关 口的人员的身份确认显得极为重要,在我们的现实生活中,像这种要求对个人身 份进行确认的地方又岂止千处万处。目前。用于个人身份鉴别主要依靠i d 卡( 如 身份证、工作证、储蓄卡等) 、密码等手段,而这些手段存在携带不方便、安全 系数不高等诸多问题。 基于人体生物特征识别技术的个人身份鉴别系统,由于使用了人体本身固有 的生物特征,是与传统方法完全不同的崭新技术,具有更好的安全性、可靠性和 有效性,越来越受到人们的重视,开始进入我们社会的各个安全领域,迎接新时 代的挑战。 早在古埃及时代人们就开始通过人体的生物特征的测量( 如入脸、人手等) 来 鉴别人的身份,在刑侦领域人们也早已使用最有效的人体生物特征之一:指纹来 确定罪犯的身份。随着计算机技术的发展,人们开始凭借计算机的强大功能来研 究和实现自动的身份鉴别系统。进入2 0 世纪8 0 年代,计算机技术同新月异,于 是基于计算机技术的自动人体生物识别技术的研究和产品也逐渐增多起来。近年 来,在美国、欧洲、同本、香港等许多国家和地区的大学都成立了以人体生物识 别技术为主要研究方向的实验室或者研究中心,同时,许多公司也相继开发出产 品,并不断地推向市场,逐渐形成了一个新兴的、很有希望的产业。在我国,已 经涌现出很多专门的机构广泛的开展了人体生物特征识别技术方面的研究工作, 很多研究人员投入到这一新兴领域,并开展用于身份鉴别的人脸识别、语音识别、 联机签名识别、指纹识别等多项研究工作,并取得了一定的成果。 人体所固有的生物特征有许多,能够用来认证身份的生物特征应该具有以下 烦i j 学位论文第一章绪论 的特性: ( 1 ) 普遍性:每个f 常人都应该具有这种特征; ( 2 ) 唯一性:不同的人应该具有各不相同的特征; ( 3 ) f f j 采集性:所选择的特征可以定量测量; ( 4 ) 稳定性:所选择的特征至少在一段较长的时问内是不变的,并且特征不 随条件、环境的变化而变化。 在实际的生物特征识别系统中,还应考虑如下一些因素: ( 1 ) 性能:识别的准确性、速度、鲁棒性以及为达到所要求的准确性和速度所 需要的资源; ( 2 ) 可接受性:使用者在多大程度上愿意接受这种生物特征识别系统; ( 3 ) 安全性:用欺诈的方法骗过系统的难易程度; ( 4 ) 理论依据:是否具有相关的、可信的研究背景作为技术支持; ( 5 ) 提取的特征容量、特征模板是否占有较小的存储空问; ( 6 ) 造价:是否在用户可接受的价格范围之内; ( 7 ) 隐私保护:是否具有非侵犯性。 目前,用于身份认证的生物特征可以分为两类:生理特征和行为特征。生理 特征与生俱来,多为先天性的,包括指纹、掌纹、手形、脸型、虹膜、视网膜、 耳廓、d n a 等;行为特征则是习惯使然,多为后天性的,包括笔迹、话音、步态、 击键动作等。生物特征识别技术中,利用人脸特征进行身份鉴定是其中最自然 和最直接的手段。和其它方式比较起来,指纹、瞳孔等要求待识别对象与成像设 备白j 较近的空f n j 距_ 离,而人脸图象在一般可视距离内就可以被正常的捕捉,因此 具有更加广泛的应用范例。人脸特征定位是通过计算机在人脸图象中自动定位出 人脸各个器官包括眼睛、鼻子、嘴巴、下巴、耳朵以及人脸外轮廓等特征点的位 置。由于人脸的局部特征( 眼睛、鼻子、嘴巴、下巴、耳朵以及人脸外轮廓等) 是一个人区别于其他人的重要特征,因此人脸特征检测与定位为人脸信息处理与 分析提供了重要的几何信息,其准确性直接影响人脸识别、人脸动画重建、人脸 跟踪等应用系统的性能。 人脸特征定位的重要意义主要体现在以下几个方面: ( 1 ) 为人脸识别提供基础信息; ( 2 ) 利用人脸面部特征定位的结果进行人脸姿态表情分析; ( 3 ) 实现人脸图象的自动跟踪或为人脸自动跟踪提供初始位置; ( 4 ) 人脸图象编码; ( 5 ) 进行人脸合成及人脸动画研究。 虽然人类可以从一幅人脸图象中很轻松的分辨出人脸的局部特征的准确位 2 顾i j 学位论文 第一章绪论 置,但对于计算机来讲却并非一件易事。人脸特征的定位的困难主要体现在: ( 1 ) 人脸姿态的不确定性:主要体现在人脸纵向与横向上的旋转角度不同。 ( 2 ) 人脸光照条件的不确定性:主要体现在光照的方向、光照强度的不同。 ( 3 ) 人脸表情的多样性:主要体现在表情不同时影响到眼睛和嘴巴的丌闭状 态和幅度也不同。 ( 4 ) 人脸饰物的影响:如胡须、发型、眼镜、化妆等。 近年来,国内外学者们已经提出许多种脸部特征定位方法。根据定位所依据 的基本信息的类型,林维训等人在文献 2 中将现有方法分为:基于先验规则、 基于几何形状信息、基于色彩信息、基于外观信息和基于关联信息等五类: ( 1 ) 基于先验规则:根据脸部特征的一些经验规则,首先对输入图象作变换使 目标得到强化,而后根据上述规则从图中筛选出候选点区域。 ( 2 ) 基于几何形状信息:根据脸部特征的形状特点构造一个带可变参数的几 何模型,并设定一个评价函数量度被检测区域与模型的匹配度。搜索时 不断调整参数使评价函数最小化,从而使模型收敛于待定位的脸部特征。 ( 3 ) 基于色彩信息:使用统计方法建立起脸部特征的色彩模型,搜索时遍历 候选区域,根据被测点的色彩与模型的匹配度筛选出候选点。 ( 4 ) 基于外观信息:将脸部特征附近一定区域( 窗口) 内的子图象作为一个整 体,映射为高维空间中的一个点,这样同类脸部特征就可以用高维空间 中的点集来描述,并可以使用统计方法得到其分布模型。在搜索中,通 过计算待测区域与模型的匹配度即可判定其是否包含目标脸部特征。 ( 5 ) 基于关联信息:在局部信息的基础上,引入脸部特征之间的相对位置信 息,以缩小候选点范围。 脸部特征中,个体特征最为明显同时被研究者们利用的最多的两个区域即眼 睛区域和嘴巴区域。二者在脸部特征中,面积较大,个体特征较为明显,而且其 在色彩上和脸部肤色有一定的差异,这也就使得当日i 针对脸部特征的研究中,对 于眼睛和嘴巴区域的检测占据了重要的地位并取得了很大进展。 1 2 论文研究的主要内容 本文主要针对单人脸静态图象进行研究,目标图象中已经确定存在人脸,主 要任务首先在图象中找到人脸位置并分割出人脸区域,然后在分割出的人脸区域 内检测和定位眼睛以及嘴巴区域,比如应用于安检系统以及疲劳检测系统。具体 研究内容如下: ( 1 ) 人脸区域分n - 利用同态滤波增强图象对比度,改善光照影向,然后利 用迭代式阈值选择算法对图象进行处理,用最小外接矩形来描述图象中的人脸候 3 硕i :学位论义第一章绪论 选区域以及“空洞”,并分析空洞所呈现的位置关系。如果图象中存在呈现锐角 三角形分布的“空洞”,且底边在上,顶角在下,而且呈三角分布的“空洞”恰 好位于候选区域内,则此候选区域即为人脸区域。 ( 2 ) h a 睛区域检测与定位:在分割出的人脸区域内,首先对图象进行预处理改 善光照条件,然后利用迭代式阈值选择算法对图象进行二值化处理,因为正常的 人脸区域内,眼睛位于脸部的上半部分,因而针对眼睛的检测直接在脸部的上半 区域进行,以提高检测精度,简化检测步骤。由于人眼区域和脸部肤色区域有着 较大的色彩差异,在二值图象中必然能够呈现较为清晰的“空洞”,利用最小外 接矩形描述这些“空洞”并将其作为眼睛的候选区域。然后利用一系列的约束条 件去除眉毛、头发等干扰信息实现眼睛区域的最终定位,考虑到眼睛位置的客观 重要性,利用在人眼区域中寻找质心的方法标记出眼睛区域的中心位置,为进一 步围绕眼睛位置进行研究打下了良好的基础,然后对定位出的眼睛区域进行区域 填充,利用h a r r i s 角点检测算子定位眼角。区域填充采用闭合区域填充以及形 态学闭运算相结合的算法进行处理,保证区域得到完整填充,提高角点检测的准 确率。 ( 3 ) 嘴巴区域的检测与定位:在分割出的人脸区域内,首先对图象进行预处 理改善光照条件,考虑到很多个体嘴巴区域的色彩虽然较之肤色区域深些,但是 差异不明显,因而很多利用二值图象的研究中直接利用阈值选择算法对整幅图象 进行处理容易造成嘴巴区域连通性不好,轮廓不完整,这样不管采用什么样的方 法很难实施有效的嘴巴区域检测。在本研究中,考虑到嘴巴区域位于人脸的下半 区域,因而分别针对人脸的上下半区域利用迭代式阈值选择算法进行二值化处 理,试验表明这样操作大大改善了二值化图象质量,较为完整的保留了嘴巴区域 的轮廓。然后利用最小外接矩形标定出嘴巴的候选区域,然后同样利用一系列约 束机制最终定位嘴巴区域并利用寻找质心的方法标定出嘴巴区域的中心位置。考 虑到在人脸下半区域,嘴角是最为明显的角点区域,因而仍然利用经典的h a r r i s 角点检测算法,在区域填充的基础上在人脸的下半区域搜寻狄度变化最大的两个 点即为嘴角。 1 3 论文安排 根据研究完成的具体过程,论文安排如下: 第一章主要介绍研究的背景、研究的意义,应用领域以及本文将要完成的工 作内容及工作安排等。 第二章主要介绍本文所用到的相关图象处理技术以及人脸轮廓及主要特征。 第三章首先分析人脸区域分割研究的现状以及存在的问题,然后详细描述了 4 硕 :学位论文第一章绪论 本文所采用的人脸区域分割方法及其创新点。 第四章首先分析人眼检测与定位的研究现状以及存在的问题,然后详细阐述 了本文所采用的在分割出的人脸图象中实施眼睛区域检测与定位的算法及创新 点。 第五章首先分析嘴巴检测与定位的研究现状及存在问题,然后详细叙述了本 文所采用的人脸图象中实施嘴巴区域检测与定位的算法及其创新点。 第六章主要对论文进行总结,并对所做研究做出了展望。 5 硕。l :学位论文第二章相关人脸特征j 图象处理技术 第二章相关人脸特征与图象处理技术 本文主要针对人脸信息进行处理,在进行研究之前对于人脸的特征表达与特 征特性进行简要的分析和论述是很有必要的。另外,本文所做研究主要针对彩色 图象,采用的算法主要在二值化图象中进行,因而图像的噪声处理以及二值化算 法的选择对于检测的准确度也有着重要的影响,本章将分别针对人脸的生物特征 以及去噪、二值化等问题进行详细论述。 2 1 人脸的生物特征表达 2 1 1 三庭五眼规则 人体头部各部分的比例通常称为“三庭五眼。从发际到眉毛,从眉毛到鼻 尖,从鼻尖到下巴,这三部分是相等的,即所谓的“三庭。从正面看,脸部最 宽的地方为五只眼的宽度,即为“五眼”。如图2 1 所示,其中( a ) 为三庭;( b ) 为 五眼: 下 庭 ( a )( b ) 图2 - 1 :三庭五眼示意图 此外,眉弓的宽度为四个眼睛的宽度;眉弓至下颚底i 2 处为鼻尖,鼻底长度为 脸部块面长度的一半( 从鼻根到下颌处) ;鼻中隔与人中相连;耳底与鼻底齐平, 眉毛的最高点可以用来确定耳的高度:口部周围组织的长度为鼻底到下颌处的 2 3 ;口宽等于两瞳孔之间的距离,等于下颚的最大宽度;齿槽弓的宽度为两个 6 硕:i :学位论文第二章相关人脸特征与图象处理技术 瞳孔之间的距离;整个耳部位于眉上部和鼻底引出的两条水平线之间。 2 1 2 脸形 人脸部轮廓有很大差别,无法使用统一的数学模型量化其特征,虽然椭圆模 型可以识别一些人脸,但是也只占人脸总数的一小部分。为了简化标定方法,参 考传统方法的优点,我们认为有必要加入脸形信息,虽然这很有难度。 但是,人的脸型并不是没有规律可循的,我国古代画论中有“相之大概,不 外八格”之说。所谓“八格 就是田、国、。由、用、目、风、甲和申八种形格, 依次如图2 2 所示。 赞翁固霸 锶 2 1 3 人脸特征描述 图2 - 2 :八种脸形 图2 - 3 :人脸语义规则 如图2 3 所示,人脸主要由以下几个器官构成,而且每个器官都有其严格的 位置、距离、器官之间也存在着严格意义上的逻辑关系。 在人的脸部首先具有五官中的眉、眼、鼻、嘴。在脸部的中停位置左右各有 左眼、左眉和右眼、右眉,在中停的中间区域,两眼以下区域有鼻,在下停的中 7 硕士学位论文第二章相关人脸特征与图象处理技术 问位置,鼻子的下方有嘴,而且在下停位置我们可以检测到下巴的曲线。 这种语义结构严格的表示了人脸信息和其他信息的差别,可以帮助我们快速 的标定人脸的相关数据,使我们低耗费的达成目标。本文主要针对眼睛和嘴巴进 行研究,下面简要介绍二者的主要特征。 ( 1 ) 眼睛特征 图2 - 4 :眼睛的构造 图2 - 4 即为眼睛的构造图,眼睛是一个直径大约2 3 r a m 的球状体,是人观察客观 事物的视觉器官。平常接收到的外界信息中约有8 0 来自视觉。眼睛主要由屈光 调节系统和视觉感受系统组成。眼睛就如同一部全自动照相机,由角膜、瞳孔、 房水、晶状体、玻璃体和睫状肌等组成的屈光系统相当于照相机的镜头,起聚焦 成像的作用。眼内的视网膜和大脑的视觉皮质中枢等则相当于照相机的感光底片 和电脑控制系统。 在正面视图中,人眼所呈现的主要是角膜、巩膜、瞳孔、虹膜等特征。角膜 是接受信息的最前哨入口。角膜是眼球前部的透明部分,光线经此射入眼球。角 膜稍呈椭圆形,略向前突。横径为1 1 5 - 1 2 r a m ,垂直径约1 0 5 - 1l m m 。周边厚约 l m m ,中央为0 6 m m 。角膜前的一层泪液膜有防止角膜干燥、保持角膜平化和光 学特性的作用。巩膜为致密的胶原纤维结构,不透明,呈乳白色,质地坚韧,俗 称“眼白”。虹膜呈圆环形,位于晶体前,由辐射状褶皱,表面含不平的隐窝。 不同种族的人的虹膜颜色不同。中央有一个2 5 n n n - 4 m m 的圆孔,即瞳孔。 ( 2 ) 嘴巴特征 嘴巴隶属于口腔系统,口腔位于面颜的下部,是消化系统的起端。前壁以口 唇为界,两侧双颊包围,上届的前期2 3 为硬腭,后1 3 为软腭,下界由口腔底 部的肌肉组成,后界借咽峡与咽相通。在闭口时,口腔可分为前庭和固有口腔两 部分,口唇以内、牙齿以外叫口腔前庭,牙齿以内到咽部叫固有口腔。 本文重点研究嘴巴区域特征,其外面覆盖皮肤,里面衬衣粘膜,中间有肌肉、 硕l :学位论文第_ 二章相关人脸特征j 图象处理技术 血管、神经等组成。口唇分为上唇和下唇,唇两端为唇角。上唇正中有一纵行的 浅凹称为人中。唇皮肽与粘膜交界处叫做唇缘。唇红部的血管比较接近粘膜表面, j 下常呈樱红色。 2 2 相关图象处理技术 图象预处理是进行图象研究的重要一步,其主要目的是消除图象中的无关信 息恢复有用的真实信息,增强有关信息的可检测性和最大限度的简化数据,从而 改进特征抽取、图象分割、匹配和识别的可靠性。常规的预处理过程主要有数字 化、几何变换、归一化、平滑、复原和增强等操作。 ( 1 ) 数字化:一幅原始照片的狄度值是空问变量( 位置的连续值) 的连续函数。 在m n 点阵上对照片灰度采样并加以量化( 归为2 6 个灰度等级之一) ,可以得 到计算机能够处理的数字图象。为了使数字图象能够重建原来的图象,对于m 、 和b 值的大小有一定的要求。在接受装置的空间和灰度分辨能力范围内,m 、 和b 的数值越大,重建图象的质量就越好。当取样周期等于或者小于原始图象 中最小细节周期一半时,重建图象的频谱等于原始图象的频谱,因此重建图象和 原始图象可以完全相同。由于m 、和b 三者的乘积决定一幅图象在计算机中 的存储量,因此在存储量一定的条件下需要根据图象的不同性质选择合适的m 、 和b 值,以获取最好的处理效果。 ( 2 ) 几何变换:用于改正图象采集系统的系统误差和仪器位置的随机误差所 进行的变换。对于卫星图象的系统误差,如地球自转、扫描镜速度和地图投影等 因素所造成的畸变,可以用模型表示,并通过几何变换来消除。随机误差如飞行 器姿念和高度变化引起的误差,难以用模型表示出来,所以一般是在系统误差被 纠j 下后,通过把被观测的图和已知j 下确几何位置的图相比较,用图中一定数量的 地面控制点解双变量多项式函数组而达到变换的目的。 ( 3 ) 归一化:使图象的某些特征在给定变换下具有不变性质的一种图象标准 形式。图象的某些性质,例如物体的面积和周长,本来对于坐标旋转来说就具有 不变的性质。在一般的情况下,某些因素或变换对图象一些性质的影响可通过归 一化处理得到消除和减弱,从而可以被选作测量图象的依据。例如对于光照不可 控的遥控图片,狄度直方图的归一化对于图象分析是十分必要的。灰度归一化、 几何归一化和变换归一化是获取图象不变性质的三种归一化方法。 ( 4 ) 平滑:消除图象中随机噪声的技术。对于平滑技术的基本要求是在消去噪 声的同时不使图象轮廓或者线条变得模糊不清。常用的平滑方法有中值法、局部 求平均法和k 近邻平均法。局部区域大小可以是固定的,也可以是逐点随灰度值 大小变化的。此外,有时应用空间频率域带通滤波方法。 9 顾i j 学位论文 第一二章相关人脸特征j 幽蒙处理技术 ( 5 ) 复原:矫正各种原因所造成的图象退化,使重建或估计得到的图象尽可能 逼近于理想无退化的像场。在实际应用中常常发生图象退化现象。例如大气流的 扰动、光学系统的像差、相机和物体的相对运动都会使遥感图象发生退化。基本 的复原技术是把获取的退化图象g ( x ,y ) 看成是退化函数h ( x ,) ,) 和理想函数 f ( x ,y ) 的卷积。它们的傅立叶变换存在关系g ( u ,v ) = h ( u ,v ) xf ( u ,v ) 。根据退化 f ( x ,y ) 。通常把m ( u ,v ) = i _ 称为反向滤波器。实际应用时,由于1 4 ( u ,1 ,) 随 离开“v 平面原点的距离增加而迅速下降,为了避免高频范围内噪声的强化,当 u 2 + y 2 大于某一界限值w 时,使m ( u ,y ) = 1 。w 的选择应使h ( u ,v ) 在u 2 + ,2 w 范 围内不会出现零点。图象复原的代数方法是以最d z - 乘法最佳准则为基础。寻求 一估计值使得优度准则函数值最小。这种方法比较简单,可推导出最d - - 乘法维 纳滤波器。当不存在噪声时,维纳滤波器成为理想的反向滤波器。 ( 6 ) 增强:对图象中的信号有选择的加强和抑制,以改善图象的视觉效果,或 者将图象转变为更适合于机器处理的形式,以便于数据抽取或识别。例如一个图 象增强系统可以通过高通滤波器来突出图象的轮廓线,从而使机器能够测量轮廓 线的形状和周长。图象增强技术有多种方法,反差展宽、对数变换、密度分层和 直方图均衡等都可以用于改变图象狄度和突出细节。实际应用时往往需要用不同 的方法反复进行实验才能得到满意的效果。 2 2 1 去噪处理 针对本文所做研究的实际情况,首先介绍滤波去噪以及光线补偿等问题。数 字图象中往往存在各种类型的噪声。产生噪声的途径可以有几种,与生成图象的 方法相关。如: ( 1 ) o t j 果图象使用照片扫描得到的,则胶卷上的灰尘是噪声源。胶卷损坏、扫 描操作中都可以引起噪声。 ( 2 ) ! z u 果图象直接来源于数字设备,则获取数据的设备可以引起噪声。 ( 3 ) 图象数据的电子传输可以引起噪声。 采用不同的方法对于不同类型的噪声具有更好的效果。本文通过介绍几种线 性和非线性方法简单介绍一下噪声的清除【4 】。 1 线性噪声的清除 由于增加到图象中的噪声具有空间解相关性,通常比普通图象成分具有更高 的空间频率频谱。因此对于噪声清除,简单的低通滤波器是很有效的。现在考虑 噪声清除的卷积和傅立叶定义域的方法。 ( 1 ) 空j 、日j 域处理 一幅空间滤波后的输出图象g ( ,k ) 可以根据下面的关系,使用三三的脉冲 l o 硕i j 学位论文第一二章相关人脸特征j 图象处理技术 响应阵列h ( j ,k ) ,通过输入图象的离散卷积来形成: g ( j ,k ) = f ( ,卵,n ) h ( m + j + c ,n + 七十c ) ( 2 - 1 ) 其中c = ( l + 1 ) 2 。为了进行噪声清除,应该是低通形式的,具有所有的 正元素。下面列出了几个低通形式的普通3 3 个像素的脉冲响应阵列。 掩模l : 掩模2 : 掩模3 : 日:! r ; 9 1 1 1 厂1 h = 二l 。1 1 0 1 1 厂l h :! l1 1 6 【- l ( 2 2 ) ( 2 3 ) ( 2 4 ) 这些称为噪声清除掩模的阵列被标准化为单位加权,以使噪声清除过程不会在处 理后的图象中引入幅值偏差。 ( 2 ) 同态滤波 当一幅图象受到倍增的噪声或者干扰的影响时,同态滤波对于图象增强是一 个很有用的方法。同态滤波是一种在频域中同时将图象亮度范围进行压缩和将图 象对比度增强的方法。一幅图象f ( x ,y ) 可以用它的照明分量i ( x ,y ) 与反射分量 r ( x ,少) 的乘积来表示,即 f ( x ,y ) = i ( x ,y ) r ( x ,j ,) ( 2 - 5 ) 由于这两个函数的傅立叶变换是不可分的,即 f f ( x ,y ) ) f i ( x ,y ) ) f ,( x ,少) ) ( 2 - 6 ) 对式( 2 5 ) 两边取自然对数: l n f ( x ,少) = l n i ( x ,y ) + i n r ( x ,y ) ( 2 - 7 ) 再对上式取傅立叶变换,得: f ( u ,y ) = i ( u ,y ) + r ( u ,v ) ( 2 - 8 ) 假设用一个滤波器函数- ( u ,1 ,) 来处理f ( u ,1 ,) ,可以得到: h ( u ,v ) f ( u ,v ) = h ( u ,v ) i ( u ,v ) + h ( u ,v ) r ( u ,v ) ( 2 - 9 ) 逆变换到空域,得: 五r ( 工,y ) = 红( x ,y ) + ,( 工,y ) ( 2 1 0 ) ni川u门lu门,川u 1 1 1 l l l 1 1 l 硕l :学位论义第一二章相关人脸特征j 图象处理技术 可见增强后的图象是有对应的照明分量和反射分量两部分叠加而成。对式( 2 1 0 ) 两边取指数,可得: g ( x ,y ) = e x ph r ( x ,j ,) i = e x p l h e ( x ,y ) i e x p l h , ( x ,y ) i ( 2 1 1 ) 以上的图象增强过程如图2 5 所示。这种方法是以一类系统得特殊情况为基础的, 通常称它为同念图象增强法,而h ( u ,v ) 称为同念滤波函数,它可以分别作用于 照明分量和反射分量上。 眠y , 怔h 至h ! 日g 力 图2 - 5 :同态滤波示意图 一般照明分量可以用缓慢的空间变化表示。而反射分量在不同物体的交界处是急 剧变化的。这使图象对傅立叶变换中的低频部分对应照明分量,而高频部分对应 反射分量。根据以上分析,可设计一个对傅立叶变换的高频和低频分量影向不同 的滤波函数g ( u ,v ) 。图2 - 6 给出了这样一个函数剖面图,将它绕垂直轴转3 6 0 度就可以得到完整的二维h ( u ,v ) 。如果h , 1 0 则图所示的h ( u ,v ) 滤 波函数势必减弱低频分量而增强高频分量,最后结果是压缩了图象的动态范围的 同时又增强了图象的对比度。 图2 - 6 :同态滤波的径向横断面 2 非线性噪声的消除 对于具有连续噪声的图象,前面所描述的线性处理方法进行起来比较好,比 如加法均匀或者高斯分布的噪声。然而,它们对于脉冲类的噪声则提供了太多的 平滑。非线性方法通常可以在噪声平滑和图象细节保留之问取得更好的平衡,下 面将提供几种非线性的方法。 ( 1 ) 分离像素 1 2 硕 :学位论文第二章相关人脸特征o j 图象处理技术 将每一个像素与它的八个相邻像素的平均值进行比较,如果差别大于某些阈 值级别,这个像素将判定为噪声,并且以它邻近像素的平均值来代替它。可以使 用下面的脉冲响应阵列,通过观察图象的卷积对这八个相邻像素的平均值进行计 算: 厂1 1 1 日:! i1 o1i(2-12) 8 l 1 1 1 j l1 111 分离像素运算可以直接扩展到更大的窗口。 ( 2 ) 中间值滤波器 中间值滤波是一种非线性信号处理方法,对于抑制图象中的噪声非常有用。 在一维形式时,中间值滤波器包含一个包围有奇数数量像素的可调节窗口,这个 窗v i 的中心像素被窗1 5 1 像素的中间值所代替。n 为奇数的离散数列口。,口:a 。的中 间值元素是:有( 一1 ) 2 个元素的值小于或者等于这个元素的值,并且有 ( 一1 ) 2 个元素的值大于或者等于这个元素的值的那个元素。例如:如果一个窗 口内像素的值是0 1 、0 2 、0 9 、0 4 、0 5 ,那么中心像素应该被0 1 、0 2 、0 4 、 0 5 、0 9 这个排序后数列的中间值0 4 所取代。这个例子中,如果值0 9 是这 个单调增加数列的噪声毛刺,使用中间值滤波器将得到一个显著的改善。在另一 方面,值o 9 可能表示一个带宽较宽传感器的有效信号脉冲,所以所生成的图象 可能受到分辨率的损失。因此在某些情况下中间值滤波器可以提供噪声抑制,而 在另外一些情况下它可能导致信号抑制。 ( 3 ) 维纳滤波 维纳滤波可以实现图象噪声的白适应滤除。维纳函数根据图象的局部方差来 调整滤波器的输出,当局部方差大时,滤波器的平滑效果较小,滤波器平滑效果 强。 维纳函数采用的算法是首先估计出像素的局部矩阵和方差: 2 赤。篆。烈巩砣) ( 2 - 1 3 ) 盯2 = 土a 2 ( n l n 2 ) 一2 ( 2 - 1 4 ) m n 。l 篡玎 其中7 7 是图象中每个像素的m n 的邻域。然后对每一个像素利用维纳滤波 器估计出其灰度值: 6 ( 门1 ,z 2 ) :+ 竺( 口( 刀1 ,z 2 ) 一) ( 2 1 5 ) 1 3 硕l j 学位论文第_ 二章相关人脸特征。j 幽象处理技术 其中v 2 是图象噪声的方差。维纳函数提供的自适应滤波通常比线性滤波的效 果好,它比相应的线性滤波器具有更好的选择性,可以更好的保存图象的边缘和 高频细节信息。另外,使用起来非常方便,维纳函数同时计算出滤波器的参数, 并对图象进行滤波计算,而且维纳函数并不比线性滤波器需要更多的时间。 ( 4 ) 伪中间值滤波器 中间值滤波器的计算强度是比较大的,运算数量随着窗口的增大按照指数规 律增加。后有人提出了计算上比较简单的伪中间值滤波器,它具有中间值滤波器 的很多性质。 设 ) 表示元素为s is :,的数列,这个数列的中自j 值是: p m e d s l ) = ( 1 2 ) m a x i m i n s 。) + ( 1 2 ) m i n i m a x s l ) ( 2 - 1 6 ) 式中对于m = 化+ 1 ) 2 m a x i m i n s l = m a x m i n ( s i ,s 2 s 。) 】, m i n ( s 2 ,s m + 。) 】 m i n ( s 一】l ,+ i ,j ) ( 2 1 7 ) m i n i m a x s l = m i n m a x ( s l ,j :。) 】, m a x ( s 2 ,j 州) 】 m a x ( s l 一州,也) 】 ( 2 1 8 ) 在运算上,将l 个元素的数列分解为m 个元素的子数列,每一个子数列都相对 于它前面的子数列右移一个元素,并且进行适当的m a x 和m i n 运算。如要说明 的那样,m i n i m a x 和m a x i m i n 算子自身是比较有用的算子。应该注意到,对 于流水线式的计算,有可能将m a x 和m i n 函数递归的从长数列分解为具有2 和 3 的滑动函数。 维或者二维形式的m a x i m i n 算子对于清除明亮的脉冲噪声是有用的,但 是对于清除较暗的脉冲噪声效果较小或者没有效果。相反地,一维或者二维形式 的m i n i m a x 算子对于清除较暗的脉冲噪声是有用的,但是对于清除明亮的脉冲 噪声效果较差。 ( 5 ) 小波噪声清除 小波变换具有良好的时域局部化性质,为解决去噪中存在的保护信号局部性 和抑制噪声之间的矛盾提供了有力的工具。在数学上,小波去噪问题的本质是一 个函数逼近问题,即如何在由小波母函数伸缩和平移版本所展成的函数空间中, 根据提出的衡量准则,寻找对原信号的最佳逼近,以完成原信号和噪声信号的区 分。小波去噪可以描述为: ,= a r g 啤e i i p ( i ) 一刮 ( 2 1 9 ) 厶,= 忍肼( ) ( 2 2 0 ) 1 4 硕i :学位论义 第二章相关人脸特征j 图象处理技术 厂( f ) = i s ( f ) + z ( f ) ( 2 2 1 ) ,= fl 为实际信号 ,w = s p a n ( 0 2 ,) :圳以 t = l 为i jw 的函数空间映射 。 其中,o p t 代表最优解,z 为原信号,z 为噪声信号。由此可见,小波去噪方法 也就是寻找从实际信号空间到小波函数空l 日j 的最佳映射,以便得到原信号的最佳 恢复。 从信号学上分析,小波去噪是一个信号滤波的问题,而且尽管在很大程度上 小波去噪可以看成是低通滤波,但是由于去噪后还能成功保留图象特征,所以在 这一点上又由于传统的低通滤波器【5 1 。 综合以上分析,结合本研究的实际情况,由于同态滤波器不仅能够很好的完 成滤出噪声的任务,而且其具有补偿亮度,消除图象中亮暗不均的问题,增强暗 区的图象细节同时又不损失亮区的图象细节,这无疑对于后续研究有着极大的帮 助。因而本文在后面研究中多次用到同态滤波算法对图象进行预处理,实验效果 较为理想。 2 2 2 图象二值化 本文所做研究,大部分都是基于二值图象进行的,选择一个好的二值化算法 无疑对于检测的准确度有着巨大的影响,本小节重点介绍了几种常见的二值化选 择算法,并对其进行详细比较分析。 图象分割的经典方法是基于灰度闽值的分割方法,它通过设置阈值,把像素 点按灰度级分若干类,从而实现图象分割,把一幅灰度图象转换成二值图象是阈 值分割的最简单形式,设原始图象为f ( x ,y ) ,首先以一定准则在f ( x ,y ) 中找出一 个灰度值t 作为阈值,将图象分割成两部分,即把大于等于该阈值的像素点的值 置成1 ,小于该阈值的像素点的值置成0 。阈值运算后的图象为二值图象g ( x ,y ) 如 下式所示: g

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论