




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科生毕业设计论文题目:基于几何特征算法的人眼定位研究与实现姓名:学号:201120120231班级:1121202年级:2011级专业:测控技术与仪器学院:核工程与地球物理学院指导教师:完成时间:2015年06月作者声明本人以信誉郑重声明:所呈交的学位毕业设计(论文),是本人在指导教师指导下由本人独立撰写完成的,没有剽窃、抄袭、造假等违反道德、学术规范和其他侵权行为。文中引用他人的文献、数据、图件、资料均已明确标注出,不包含他人成果及为获得东华理工大学或其他教育机构的学位或证书而使用过的材料。对本设计(论文)的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本毕业设计(论文)引起的法律结果完全由本人承担。本毕业设计(论文)成果归东华理工大学所有。特此声明。毕业设计(论文)作者(签字):签字日期:年月日本人声明:该学位论文是本人指导学生完成的研究成果,已经审阅过论文的全部内容,并能够保证题目、关键词、摘要部分中英文内容的一致性和准确性。学位论文指导教师签名:年月日基于几何特征算法的人眼定位研究与实现柏植based on the research and implementation of eye locationgeometric feature algorithm baizhi2015年6月摘要人眼定位的算法研究一直是算法的热门研究。人眼是人面部最主要的生物特征之一,但是又由于人眼的多变性和成像过程中容易受多种因素的影响,又使得人眼定位于识别这个研究工作变得及具有挑战性与钻研性。所以本论文运用了人眼睛几何位置的特征算法来实现对人眼睛的定位,指出了以前若干种人眼定位算法的不足,也充分说明本算法的可行性,本文主要对人眼定位的几种算法进行深入的研究和比较。本文致力于解决以上问题,其主要贡献有以下几个方面:1.多种人眼的定位的研究是根据人眼周围梯度的相近性来确定人眼,然这种方法很容易受环境影响,且定位成功的概率不是很大,本文主要是根据人眼睛周围的灰度值是人面部最小的方法来确定可能的人眼存在区域,大大提高了定位成功的概率。2.人眼定位最基本的方法就是几何定位,传统的方法是全面扫描人脸,进而获取面部特征,这种方法需要大量的检测时间,且增加机器负担。本文主要利用了质心法的方法来定位人眼睛,大大节省定位时间,简单、快速,适于推广。3.最终定位的人眼区域用特定颜色标注,便于观察统计识别的情况。关键字:识别人脸;人眼定位;特征提取; 梯度;质心法abstractstudy on the algorithm of eye location has been a hot research of the algorithm.the human eye is one of the people face the main biological characteristics, but also due to the variability of human eyes and imaging process easily affected by many factors, and makes eye location in identifying the research work and challenging and delve into.so this paper use the eye position geometry characteristic of the algorithm to locate the eyes to the person, points out the shortages of several kinds of eye location algorithm before, and the feasibility of this algorithm, this paper mainly discusses the algorithm of eye location in-depth study and comparison.this paper is committed to solve the following problems, its main contribution has the following several aspects:1. the study of the human eye localization based on gradient around the eye close to determine the human eye, but this method can easily influenced by environment, and the probability of successful positioning is not very big, this article is mainly according to the people around the eyes of grey value type facial minimum method to determine the possible existence of human eyes area, greatly improving the positioning the probability of success.2. eye location is the most basic way is to geometric positioning, comprehensive scan the traditional way is to face, and then get facial features, this method requires a lot of testing time, and increase the burden of machine.in this paper, the method of using the qualitative method to locate the person eyes, greatly saves the positioning time, simple, rapid and suitable for promotion.3. the final positioning of the eye area with a specific color coded to facilitate the identification of observation statistics.recognize faces is the most basic human visual is also one of the most outstanding ability.key words:recognize faces;eye location;feature extraction;gradient;qualitative method目录第一章绪论11.1 引言11.2 人脸识别与定位研究背景与意义11.2.1 人脸识别的研究的背景11.2.2 人脸识别研究的意义21.3 典型的人脸识别系统21.4 国内外的研究现状31.4.1 国内研究现状31.4.2 国外研究现状31.5 论文的结构安排4第二章人眼检测定位的基本算法和理论52.1 引言52.2 基于可视特征的方法52.2.1 几何特征52.2.2 纹理特征52.2.3 颜色特征52.3 基于代数特征的方法62.3.1 主成分分析(pca)62.3.2 独立分量分析(ica)72.4 基于几何特征的算法82.5 几种算法特点和优缺点的比较102.5.1 几种算法的特点102.5.2 几种算法的优缺点102.6 图像的色彩空间112.6.1 rgb色彩空间112.6.2 ycbcr色彩空间112.7 二值化122.8 bmp格式图片12第三章眼睛轮廓的定位133.1 眼睛色度的匹配133.2 眼睛亮度的匹配143.3 人眼区域的综合匹配154.4 去掉非眼睛区域16第四章人眼定位的实现184.1 眼睛区域的膨胀184.2 眼睛中心184.3 本章小结20第五章总结与展望215.1 全文工作总结215.2 下一步工作展望21致谢22参考文献23附录24东华理工大学毕业设计(论文) 绪论第一章绪论1.1引言人面部特征识别是基于生物特征识别技术的身份认证中最主要的方法之一。基于人脸识别的自动身份认证具有重要的意义和应用价值。早在上个世纪60年代就吸引了有志之士的强烈兴趣,对面部自动机器识别方法的研究已经成为当今图像处理的模式识别和人工智能领域的一个研究热点。人脸自动识别涉及计算机图形学、计算机视觉、模式识别、机器学习、感知科学、人工智能、计算机智能等技术,经过无数专家学者的潜心研究,人脸识别技术在近年来获得巨大的研究成果,并且正在逐渐走向成熟。人脸识别相对于其他的识别模式具有直接、友好、方便等多方面的特点,易于被使用者所接受。人脸识别技术,作为图像分析和理解最成功的应用之一,近年来获得了越来越广泛的关注。1.2人脸识别与定位研究背景与意义1.2.1 人脸识别的研究的背景有很多种生物识别方法可以对人的身份进行识别和鉴定,最常见的有指纹识别、声音识别、手型、dna鉴定等。但是这些识别技术相对于人脸识别就有着多方面的先天不足,所以人脸识别有以下优点:(1)自然性,是指该识别方式同人类进行个体识别时所利用的生物特征相同。而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。(2) 隐蔽性较好,利用人脸是被来获取人物的资料信息,这样不会引起他人的注意,而且可以更直观快速的检测到人的资料,不但如此,而且他是利用可见光对人面部的反进而收集人物面部信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的收集人物的信息的方式,有时会使人们感到反感,使人们对此种方法产生怀疑。(3) 个体之间面部的差别虽然不是很大,甚至人脸结构外型都很相似,但是这样的特点对于利用人脸进行定位是有利的。(4) 人脸的不稳定的外型,人可以在不同时刻把自己的喜怒哀乐表现在脸上,导致观察的时候会产生不同程度的误差,另外,人脸识别还受光照条件、人脸的很多遮盖物、年龄等多方面因素的影响。可知人脸识别有众多优点,所以很有有志之士都在潜心研究。1.2.2人脸识别研究的意义人脸识别的应用领域相当广泛,主要有以下几个方面:(1) 公共安全:公安部门追寻逃犯、罪犯识别等;(2) 信息安全:计算机和网络的登陆、文件的加密和解答;(3) 政府职能:电子政务、户籍管理、社会福利等;(4) 证件鉴别:身份证、护照、学历证明的真伪鉴别等;(5) 家庭娱乐:智能玩具、体验真实游戏、模拟现实游戏等;(6) 商业企业:电子商务、电子货币和支付、考勤。所以人脸识别的研究对人类来说就很有研究的意义。1.3典型的人脸识别系统下图(图1-1)是一个典型的人脸识别系统的工作流程图:图1-1 典型人脸识别系统工作流程图系统的各个部分和作用如下:图像的获取部分主要负责获取图像,图像可以来自于任何图像采集设备,然后经过处理转化成可处理的数字信息。基本图像处理部分包含了对图像的一些简单的处理,对图像进行了增加亮度和对比度的处理,增加了识别的准确度和减小了错误率,同时也增加了程序对图像边缘的提取的精度,增加了二值化操作的简单性以及图像灰度处理等相关过程。检测定位部分主要是为了检测图像所示的部分是否有人脸存在,如果有则对人脸进行定位。输入的图像背景多复杂都不会影响图像的识别。正规化部分将提取到的图像作大小、灰度的归一化处理,使不同的人脸图像显现出相同的亮度和对比度。特征提取部分时本软件的重要部分,此部分主要是根据已经二值化的人脸图像根据某种规则来记录人脸的特征。有的时候人脸的数据量太大,会采取不同的记录方法,比如对人脸数据进行变换。分类器设计是在后台运行的部分,这部分可以看成是一个分类器,它把待识别的图片归到一类。这种归类对被识别的对象进行分类所造成的错误识别率最小或者损失最小。分类决策部分就是利用已经做好的识别,给出最后的识别结果,并作出相应的判断。1.4 国内外的研究现状1.4.1国内研究现状国内在模式识别等相关领域的研究不是很超前。但是近年来,国内很多高等院校和研究机构,如中国科学技术大学、东南大学、清华大学、武汉大学、浙江大学、合肥工业大学等高等院校投入大量的钱力和人力在人脸识别相关工作的研究中,并取得了不错的进展,理论水平已经逐步接近甚至超越国际先进水平。周志华等通过多视角特征分析获得人脸特征,提出将神经网络集成应用于多视角人脸识别,识别精度得到了大大的提升。彭进业等提出了贝叶斯人脸识别方法中匹配准则的多个近似表达式的形式,以及一种使用的快速的计算方法;在此基础上提出一种利用两幅人脸图像的小波变换系数差作为模式矢量的贝叶斯人脸识别方法,利用发对称的正交小波变换的微分算子,与单纯的基于图像灰度的方法对比,识别率也得到了不少的提高。王蕴红等人提出基于奇异值分解和数据融合的人脸鉴别方法,利用orl人脸数据库进行试验,用每个人的6幅图像作训练,其他4幅作为测试,识别率为90.48%。荆晓远等对人脸图像作正交小波变换,提出基于先惯性和有效互补分析的多类器组合方法,得到其在不同频带上的4个子图像,然后分类提取奇异值特征。山世光等提出了基于文理特征分布和变形模型的脸部特征提取方法,解决了可变形末班对参数初始值依赖性强和计算时间长的问题。2002年11月26日,由中国科学院计算技术研究所等单位承担的国家863计划之一的“面部检测与识别核心技术”通过专家鉴定。该系统只需0.1s或0.05s既可自动检测到人脸,在一般的pc上完成只需要1s。1.4.2国外研究现状不单是中国,国外好多国家也投入了大量的精力研究人脸识别的相关问题,主要有美国,欧洲等国家,著名的研究机构有美国mit的media lab,ailab,c的human-computer interface institute,microsoft research等。综合相关的资料不难发现,目前国际的人脸识别的研究方向:(1)基于几何特征的人脸识别方法,主要代表是mit的brunelli和poggio小组,他们采用改进的积分投影法提取出用欧氏距离表征的35维人脸特征矢量用于模式分类;(2)基于模板匹配的人脸识别方法,主要代表是harvard大学smith-kettlewell眼睛研究中心的yuille,他采用弹性模板来提取眼睛和嘴巴的轮廓,chen和huang则进一步提出用活动轮廓模板提取眉毛、下巴和鼻孔等不确定形状;(3)mit媒体实验室的pentland则提出了基于k-l变换的特征脸的方法;(4)cambridge大学的samaria小组和georgia技术研究所的nefian小组提出了基于隐马尔可夫模型的方法;(5)神经网络识别的方法,如poggio小组提出的hyperbf神经网络识别方法,英国sussex大学的buxton和howell小组提出的rbf网络识别方法等。1.5 论文的结构安排本文的组织结构如下:第二章:介绍了几种常见的人眼定位和面部特征提取的方法,并作了一定的对比,总结了各自的优缺点,还介绍了本论文算法会用到的一些基础知识,使得论文更加充实。第三章:详细介绍了本文实现人眼轮廓定位的算法和算法的原理,实现了人眼轮廓区域的定位。第四章:介绍了对人眼轮廓区域进行膨化,并用几何法最终定位了人眼位置。第五章:总结本文的主要工作和结论,并且提出了对人眼定位的展望。4东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论第二章 人眼检测定位的基本算法和理论2.1 引言第一章简单介绍了人脸的识别的主要需要研究的内容、人脸识别的优点和研究的难点、人脸识别系统的几个主要步骤以及人脸识别国内外的主要发展情况。人脸识别的研发的主要目的就是为了人们能够更好的生活,人脸的识别中人眼的定位就是最重要的环节之一,现在已经有很多关于人眼定位的算法被提出,下面就介绍人眼定位的基本算法和理论。2.2 基于可视特征的方法2.2.1 几何特征虽然人脸的特征看起来各不相同,但是其内在还是存在其普遍的特征的,主要是其五官的分配的相对比例是在一定的比例内的,如下图(图2-1)所示为人脸器官的相对位置。每张人脸从他的的发际到眉间、眉间到鼻尖、鼻尖到下巴的距离大致相等,称为三庭;从正面看,人脸在双水平连线处最宽。这表明虽然人的每张脸都不尽相同,但是五官的大体位置是一致的,说明我们可以通过检测图像中图2-1 标准人面部图是否有满足这种关系的子图像来检测图片中是否存在人脸。2.2.2 纹理特征人脸也有可作为区别其他事物的特殊的纹理性质。可以运用基于空间的灰度相关的矩阵的参数特征来表示人面部的纹理特征,进行低分辨率的人脸检测。输入图像首先对图像信息进行一定的处理,然后由sgld矩阵得到结构化的特征,根据人脸的结构化模型,就可以找到人脸。模型由一组不等式组成,而人面部就被定义在这些不等式所在的区域。2.2.3 颜色特征人的皮肤的颜色是外界对该面部的第一获取的信息,是人面部最重要的特征之一,也是人脸的一种显著的特征,所以利用颜色来检测人脸是很好的研究方向。目前已经有rgb、hsv、ycrcb、tes等颜色空间被用来描述人脸的肤色。而且肤色的算法有如下的优点:第一,允许被跟踪对象自由活动,减少环境对肤色的影响;第二,肤色分割的算法没有使用特殊的脸部特征,因此头部方向和姿态的变化不会影响对于肤色的确定;第三,可以在普通工作站上以帧速率来实现人脸区域分割;但是由于光源的颜色问题以及光源发射的角度对图片的影响不容忽视,因此,通常需要将肤色信息与形状、运动信息等相结合,以便能够在图像序列中定位和跟踪人脸。2.3基于代数特征的方法基于代数特征的方法,通常是将图像空间的像素点变换到一个投影空间。用一定数量的基本图像对人面部特征进行先行线性编码。把给定的m*n像素的训练样本称为空间域向量。这个基本的向量被映射到一个优化的子空间。把子空间向量叫做变化域向量。此方法的目的就是寻找一种从空间域到变换域之间的一种表示方法,并称这个向量为特征图像。2.3.1 主成分分析(pca)主成分分析是多元统计分析中用来分析数据的一种方法。它可以利用较少数量的特征量对样本图片进行描述以达到降低特征空间维度的方法。可以用kl展开式对人脸进行描述,这样既可以降低空间维数,又可以抽取人脸的特征,人脸特征投影到子空间,非人脸特征也会如此。由于人脸特征在投影空间没有本质的变化,而非人脸图像表现的不同,因而可以检测出图像只是否有人脸存在。在很多情况下,变量之间是有一定的相关联系的,当两个变量之间有相关关系时,可以反应这两个变量有某种程度的重叠。假设有p个不相同的变量,然后有q个不相关的新变量(qp),这时这q个不相关的变量就可以表示p,而且还会最大程度的不损失信息,这就是pca特征提取,此方法获得了最大数据降维。设有n个训练样本,每个样本根据其像素灰度组成一个向量xi的维数的样本图像m=width*height(行像素数*列像素数),由向量构成的样本集为x1,x2,xn,这样本的平均向量为1ni=1nxi(1)平均向量又叫做平均脸,则每个训练样本与平均脸的偏差为yi=xi-(2)则样本集的偏差矩阵为d,d的维数为m*n。d=y0,y1,yn-1 (3)用式(4)计算样本集的协方差矩阵c,c的维数为m*n。c=dtd(4)c=1ni=1nyiyit(5)求协方差矩阵c的特征向量ei和对应的特征值i。这些特征向量就是人脸空间的多组向量基,用这些向量基可以来表示任何获取到的人脸图像,且图像重要信息集中于特征值较大的特征向量中,也就是说,即使有些表示特征向量小的数据丢失,也不会很大程度的影响图像的质量。将特征值从大到小的排列:12mm;对于某一m,若其过小,则可以忽略其影响,这样主成分构成的变换矩阵为w=e1,e2,em, mm (6)也就是说任何的人脸图像都可以投影到上式上,w的维数为m*m,而这是一个基底,任何的人脸图像向其作投影时都会产生一组坐标系数,称之为kl分解系数。在现实的人脸的识别过程中,对于一个确定的样本人脸x,该确定的样本人脸图像与平均脸之间的偏差y=x-,则y在特征脸空间的投影,可以表示为系数向量z,并用下面的公式表示:z=wty (7)z就是kl变换的展开系数向量,为m*1维。所以这样的一个脸部图像就实现了可以用较低的系数向量来表示,从而实现了用低维向量表示原始的人脸部的特征。下图表述了上述的过程。2.3.2 独立分量分析(ica)独立分量分析是一种对多变量数据进行非正交线性坐标变换的方法,坐标轴的方向由可观察到的混合数据的二阶和高阶统计信息确定,变换的目的是使变换后的变量间相互独立。pca只考虑了模式的二阶统计量,他的特点就是变换后特征向量是相互无关的;ica不仅考虑了模式的二阶统计量,而且还分析了模式的高阶统计量,ica的特点是变换后的独立独立量是独立非正交的,ica可以更好的表示人脸视图的局部特征。独立分量分析是于1986年提出的一种统计信号处理技术,它与pca有一些相似之处,但也有不同之处。ica的基本思想是用一组统计独立或者尽量独立的分量对随机变量进行表征。简单的描述如下:已知的观测数据为x=(x1,x2,xm),si是未知分量,可以表示为s=(s1,s2,sn)t,x和s的关系为x=as其中,分量si均值为零且相互间统计独立;a是未知的特征矩阵。s的每一行si表示一个独立分量,矩阵a代表观测数据x在各个独立分量特征轴上的幅值。为了将ica应用到人脸识别的领域,可以使用矩阵x=(x1,x2,xt)t(t*m维)表示用于学习训练的人脸图像库,假设人脸的图像表示为,xi=(x1,x2,xm).首先可以应用不动点算法求解恢复矩阵w(m*n维),使得xw=ase=u。这样得到的输出矩阵u=xw就是虽未知的统计独立分量s的估计,然后我们得到u以后,用他的航向量为特征向量构造特征空间,所以每一张人脸图像投影到该空间后,都会得到一组对应的人脸空间向量。所以选择合适的特征向量,他不但可以减小计算量还能够增强对不同人脸图片的分类能力。所以在衡量各个特征的分类能力的时,额可以采用类内分散度和类间分散度的比值j,j=1,2,3m。定义如下:类内分散度cij为cij=1pq(q-1)i=1pu=1qv=1q(ai-1q+u,j-ai-1q+v,j)2(8)类间分散度bj为cbj=1p(p-1)i=1pu=1q(au,j-av,j) (9)其中ai,j=1qu=1qai-1q+u,j。特征的类内分散度与类间分散度的比率j为j=cijcbj (10)将值由小到大的排列12m,取与前k个i对应的ui用于人脸识别,达到降维目的。图2-2 ica抽取特征脸模型上图(图2-2)就是运用ica方法抽取人脸特征的模型。假设原始的样本数据x由未知的相互间统计独立的基图像s和线性的混合矩阵a组成。然后通过w的转化得到近似于基图像s的图像u。新的待识别的图像f与u进行下面所示(11)的公式运算,就可以得到用于表征人脸的系数。(a1,a2,ak)=ft*(u+) (11)其中,(u+)表示u矩阵的伪逆,(u+)=(uut)-1。2.4 基于几何特征的算法几乎所有的人眼定位的研究员都知道基于几何特征算法的人眼定位的方法是最常用的方法,相关文献认为:人眼睛周围的颜色的灰度值的梯度值是相近的。也就是说若可以找到图片中某点周围灰度值相近最多的像素点,那么该点就是眼睛所在的区域,然后用相应的算法把该点标注出来即可。要用此方法定位人眼区域需要先将真彩图片转换成相应的灰度图像,在matlab函数中可用rgb2gray实现,继而获取相应x、y坐标各自灰度的梯度,算出整体梯度,可用gradient函数实现,然后用imadjust函数来调节灰度图像的亮度,使之更加适合检测定位,继而用im2bw函数来使用阈值变化法把灰度图像转换成二值图像,这样就完成了对图像的预处理。然后就是此种几何算法的核心部分,根据人的眼睛的为近似圆形的方法,且圆形的半径大小约为913个像素点的规律,采用循环程序,以每个点为圆心,不同半径的圆扫描,在圆上最多的边缘点就是眼睛的中心位置,然后用imshow函数来用指定的灰度值显示图像,并用plot函数标注出所定位的区域,继而实现了人眼的定位,流程图(图2-3)如下:图2-3 此种几何特征算法的流程下面为此种几何方法的人眼定位的效果图(图2-4):原始图片 定位后原始照片 处理后图2-4 几何特征算法处理前后的效果图由上两次的试验可以发现,该算法实现的人眼定位有时候并不能定位人眼的准确位置,还需要进一步的修改。2.5 几种算法特点和优缺点的比较2.5.1 几种算法的特点pca和ica以及几何法来确定人面部的特征的方法都是很热门的方法,大致的特点如下:(1)pca方法只提取图像上像素间的二阶统计信息,而ica提取了高阶的统计信息。(2)pca方法抽取的特征之间统计不相关,而ica方法抽取的特征之间是统计独立。(3)几何法的抽取面部的特征还是要基于预处理之后,根据面部人眼的几何特征来定位人眼,此种方法多是基于人眼的某种结构来定位的2.5.2 几种算法的优缺点任何算法都有其优点和缺点,上面介绍的几种算法的优缺点如下:(1)pca方法对于最小化重构的错误来说是最理想的,但这些用于特征分类并不是很理想,ica分类方面就比较有效。(2)对图片作归一化处理后,pca的识别方法性能较好,但是若由于遮挡等因素给图片带来的影响时,基于ica的识别的方法性能会更好(3)pca的识别速率相对于ica的较快,ica运用了更多维数的处理方法,使得速度较低。(4)几何法识别定位人眼几乎很少会受到光照强度的影响,计算简单,定位的准确度较高,能够很好的定位人眼区域。2.6 图像的色彩空间2.6.1 rgb色彩空间rgb(red,green,blue)颜色空间最常用的色彩空间如下图(图2-5)所示,在rgb色彩空间中,每一个数字图像中的像素点的颜色都可以用rgb三维空间的一个坐标点来表示。如果rgb的值全为最大,则显示为白色。若全为最小则显示黑色,若相等则显示图片的灰度。图2-5 rgb色彩空间2.6.2ycbcr色彩空间ycbcr色彩空间是为了适应视频处理中数字化算法而诞生的色彩空间。ycbcr色彩空间从yuy色彩空间衍生而来,其中y是亮度信息,cb表示蓝色成分的多少,cr表示红色成分的多少,cb和cr一起用来表示图片信息的色度和饱和度。研究表明,不同人面部的色度信息相近,只有亮度信息相差较大。又因为人脸的色度只在一个较小的区域里面变化,所以就要选择一个能将颜色信息与亮度信息分开的色度空间来描述颜色,而ycbcr色度空间就满足这个要求。ycbcr的不同的分量可以由rgb经过线性变换得到,对应关系如下:ycbcr1=0.2990.5870.1440-0.169-0.3310.5001280.500-0.419-0.0811280001*rgb1 (14)rgb也可以通过ycbcr来转换,转换公式如下:r=y+1.371cr-128g=y-0.698cr-128-0.336cb-128b=y+1.732cb-128 (15)所以与其他的色彩空间比起来,ycbcr色彩空间有着与人类视觉感知过程相类似的原理。肤色在ycbcr空间的聚类性较好,且空间坐标表示比起其他的颜色空间要简单很多,所以本文就主要使用ycbcr色彩空间进行研究。2.7 二值化二值化是图像处理的基本处理方法,被采用到各种识别领域,根据阈值选取的不同,二值化的算法被分为固定阈值和自适应阈值,比较常用的二值化方法为:双峰法、p参数法、迭代法等。一幅图像包括目标物体、背景以及噪声,要想从多值的数字图像中直接提取目标物体,最常用的方法就是设定一个阈值t,用t将图像的数据分成两部分;大于t的像素群和小于t的像素群,当像素值小于设定的阈值时,置黑色,即0;当像素值大于设定的阈值时,置白色,即1。公式表达如下:fx,y=0, &f(x,y)t1, &f(x,y)t(16)t表示的是阈值,不同的场合阈值的取值不一样。2.8 bmp格式图片本系统只能识别和处理bmp格式的图片,bmp格式属于dib的一种,经常应用于windows操作系统。bmp是英文bitmap(位图)的简写,能够被多种windows应用程序所支持。这种格式的特点是包含的图像信息相对比较丰富,几乎不进行任何压缩,但是这个特点也给他带来了与生俱来的缺点。所以,目前bmp只在单机上比较流行,其他方面的应用不是很广泛。bmp格式分为两个部分,分成头部和数据部等,头部部分是描述这幅图片的具体参数,如宽、高、通道等参数,他会占用一定的字节,字节的大小和图片的信息有关,公式如下:i=i*w+j*3 (17)式中:i表示像素数据偏移量;i表示该像素点所在图像的纵坐标;j表示该像素点所在图像的横坐标;w表示每行像素所占字节数。从这些字节之后才开始才正式开始图像数据流。这里面的前面部分的字节就是所谓的bmp数据偏移量。13东华理工大学毕业设计(论文) 眼睛轮廓的定位第三章 眼睛轮廓的定位人眼睛的识别是一个极富有挑战性的课题,国内外很多学者都在积极研究,在完成人眼定位之前,必须要先定位可能存在人眼睛的区域,本章就此展开。3.1 眼睛色度的匹配为了提高人眼定位的准确性,结合色度匹配的方法,进一步验证人眼的位置。只有满足相应的条件才能确定是人眼可能存在的区域。依据“人眼区域cb分量普遍比cr分量值要高”的结论,将人眼区域范围进一步缩小,先要获取图像的rgb颜色空间对应的值,转化成ycbcr颜色空间的值,然后对区域每一个像素进行扫描,在一定区域内cb、cr满足相应的条件就是人眼可能存在的区域,根据标志满足不同条件像素设定黑色或者白色,并填充保存颜色。流程图(图3-1)如下:图3-1 眼睛色度匹配的流程图下图(图3-2)为经过眼睛色度的匹配处理前后形成的图:原始图片处理后图3-2 眼睛色度匹配处理前后的效果图上图可看出程序可以使可疑的眼睛部分变成白色标记出来,为后面的眼睛亮度处理做好了准备。3.2 眼睛亮度的匹配亮度顾名思义,是指发光物体表面反光强弱的物理量。人眼从一个方向观察光源,在这个方向的光强与人眼所“见到”的光源面积之比,被称之为该光源单位亮度,即单位投影面积上的发光强度。我们可以通过对眼睛亮度的检测,然后亮度可以转换成灰度,对眼睛部分的灰度进行处理和比较并确定眼睛所在的位置的范围。研究发现人眼的灰度是在一定范围内,且灰度值是大于其他部分的,所以我们可以先获取整体图片的r、g、b的值,并通过式(16)计算得到相应的灰度值,限定灰度值的范围,筛选出满足条件的区域,并填充相应的颜色。gray=10*r+30*g+60*b100 (18)具体的流程图(图3-3)如下:图3-3 眼睛亮度匹配流程图下图(图3-4)为经过眼睛亮度匹配处理前后的图片:原始图片 处理后图3-4 眼睛亮度匹配处理前后效果图上图可看出程序可以使可疑的眼睛部分变成白色标记出来,且更为明显,为后面的眼睛综合处理做好了准备。3.3 人眼区域的综合匹配人眼综合匹配这部分是综合了人眼亮度的匹配和人眼色度匹配两部分而得出的结果。首先对像素点矩阵emymapcij和emymaplij进行清零处理,然后指出只有当亮度和色度同时出现设置为白色的像素点在此时才可以设置为白色,否则设置为黑色,并且把8位图转换成24位图,这样做的目的提高了眼睛识别的精度和准确度。流程图(图3-5)如下:图3-5 眼睛区域综合匹配流程图下图(图3-6)为经过人眼区域综合匹配前后得到的图片:原始图片 处理后图3-6 人眼区域综合匹配处理前后效果图上图可看出人眼睛已经被逐渐定位出来 ,但是由于人嘴部的干扰,有时会出现定位错误,所以要进性下面的操作。 4.4 去掉非眼睛区域人的面部器官分布总是存在一些规律,例如:从发际到眉毛,从眉毛到鼻尖,从鼻尖到下巴这三个部分距离是相等的,人脸正面最宽的距离为人眼的5倍。另外面部还有平分规则:从头到眼睛的距离约等于眼睛到颌底,过鼻尖的中线平分人脸,两边大致是对称的等。如下图(图3-7)所示:图3-7 三庭五眼效果图利用人眼的这种位置结构特点,我们可以取人脸一半区域进行处理,就可以减少大量的数据处理量,提高了运算的速度,然后对于下半部分的非人眼部分,全部置以黑色的像素,这样就缩小了检测的范围。流程图(图3-8)如下:图3-8 去掉非眼睛区域流程图下图(图3-9)为经过去掉人眼部位操作前后得到的图片:处理前 处理后图3-9 去掉非眼睛区域处理前后效果图此方法很简单,也很通用,根据人眼睛的几何规律来进一步确定人眼区域,通过比较可以发现,可以很好的实现除去非眼睛部分。28东华理工大学毕业设计(论文) 人眼定位的实现第四章 人眼定位的实现虽然人眼睛的轮廓已经确定,但是完成人眼的精确定位还需要对这些区域进行区域膨胀和几何算法来实现定位。4.1 眼睛区域的膨胀此过程运用了递归统计像素并修改像素值的方法。是二值化的连通域标记处理操作,从白像素和黑像素组成一幅点阵图像中,把其中的相邻的具有“255”像素集合提取出来,然后在图像中不同的连通域填入不同的数字标记,用以区分,同时统计连通域的数目。该过程是一项很重要的基础操作。先对二值化的图像中每一个像素点进行扫描,并标记图片中所有的像素点,然后便可得到等价标记表,这个表中记录了扫描到的所有等价对,这时这两个标号标记的连通域就属于同一个连通区域。对二值化图像进行扫描首先要找到图像数据在内存中的存储地址,然后对存储地址后面的8位整型数据进行比较。本文的处理的图像就是8位bmp格式的图像,对图像的扫描采用从上到下,从左到右的方式,所以对于普通的一个像素点只需要扫描自己和已经确定的像素点就可以确定自己的连通性了,当然对于特殊的像素还是特殊的考虑。下图(图4-1)为经过眼睛区域膨胀操作前后得到的图片:处理前 处理后图4-1 眼睛区域膨胀处理前后效果图4.2 眼睛中心人眼睛中心位置的定位是本系统的中心环节,本环节主要应用的技术是质心法来定位人的眼睛。此方法就是将属于同一连通体的不同像素点的坐标值进行平均,然后将平均值作为质心的坐标位置,这种方法求得是连通体几何形心,其计算公式如下:xc=i,jjn, yc=i,jin(19)式中,(i,j)分别为图像像素的纵、横坐标;n为该连通体总的像素数;为属于同一连通体的像素的集合。那么重要的就是如何确定这个连通体的内部的各个像素点的坐标,可用以下步骤:步骤1 对已经二值化的图片进行全方位的扫描像素点的灰度值,当灰度值为0时就执行下面的操作。步骤2 将像素点的灰度值置为1,像素点的横坐标和横坐标相加,纵坐标与纵坐标相加,得到相应的横、纵坐标的和坐标。步骤3 根据返回的横、纵坐标的和计算出坐标的平均值,即为所谓的质心坐标。流程图(图4-2)如下:图4-2 眼睛定位流程图下图(图4-12)为经过眼睛区域定位前后得到的图片:原始图片 定位后图4-2 眼睛定位处理前后效果图质心坐标的计算是人眼检测和定位的一个重要环节,对人眼定位系统的研究和开发具有较高的实用价值和宽阔的应用前景。4.3本章小结为了实现人眼定位需要把rgb色彩空间转换成ycrcb色彩空间,通过传过来的已经处理的图片计算出h、cb、cr三个分量的值满足相应的不等式既可判断大概人脸存在的范围,对人脸部的色彩进行归一化处理后,继而计算出人脸部的灰度值,我们知道在人脸灰度图像中,人眼睛虹膜、瞳孔和上眼睛部分的灰度值明显比临近区域灰度值要低很多,因此在人脸区域中获取人眼睛区域可以根据其灰度值来判断,然后根据人眼睛区域满足的几何规律,以及质心法就可以定位出人眼。流程图(图4-3)如下所示:图4-3 眼睛定位整体流程东华理工大学毕业设计(论文) 总结与展望第五章 总结与展望5.1 全文工作总结本文解决了用vc平台来检测并定位人眼睛位置等一系列技术问题,并实现了综合测试系统,验证了多种人脸识别和眼睛定位的多种方法。由于人面部图像本身的复杂性,本文主要是在前人的工工作基础上实现的,本文重要贡献如下:(1) 开发了基于vc+平台的人脸识别综合算法测试系统,该系统综合了人面部的检测和识别、人眼检测与识别、人嘴部的检测与识别等部分。整个系统可以在vc+6.0开发环境下实现,软件可以完美运行。(2) 介绍了其他几种人眼定位的方法,试验都可以发现这些方法都很容易受外界环境的影响,导致人眼定位的不准确,对外界环境的要求比较严格,由于扫描的信息量较大,导致反应速度较慢,定位的准确度也不是很乐观,不适于推广和应用,但是本论文使用的基于几何特征算法的人眼定位与检测的方法可以更加完美的实现人眼睛的定位。(3) 关于人眼睛的定位是本文的主要研究对象,主要是根据人眼睛区域的灰度值相较于其他位置的较小,这样就可以提取出疑似人眼区域,通过对人面部几何特征的分析得到人眼睛部分在人面部上半个部分,进而可以缩小检测的范围,缩小了搜索范围,实现了快速定位,然后根据质心法,检测每一个像素点的坐标,最后定位人眼睛区域。5.2 下一步工作展望由于作者水平有限,论文中还有很多不足之处,需要进一步的研究和改进;(1) 对眼睛的色度和亮度的处理容易受外界的干扰,在外界噪声的干扰下,从而影响了处理的结果,影响了软件对人面部灰度值的正确处理。(2) 算法还有待改进,如果人的面部不是正对着的,就很难实现正确的判断和处理,要改进对多角度、旋转人脸的特征的提取的算法。(3) 如若照片中的任务有胡须或者带着眼睛等装饰品时,检测得到的人脸就会不准确或者不规则,造成人脸的漏检或者误检。(4) 由于本软件只能对静态的照片进行识别和检测,所以对动态的人脸很难检测,可以在软件中加入检测动态的人脸的算法。(5) 本文是利用质心法来实现对人眼睛的定位,但质心法的实现很受环境的影响,稳定性不是很好,所以要探寻更好的方法。本文提出的一系列的方法虽然具有一定的检测能力和精度,但是由于上述提到的各种潜在的问题,下一步将继续对这些问题进行深一步的研究,使之更完美。东华理工大学毕业设计(论文) 致谢致谢本论文是在方江雄博士的悉心和细心的指导下完成的,经过这两个月的忙碌和研究,本次毕业设计已经接近尾声,但是作为一名普通的本科生,经验的匮乏导致论文之中肯定会有纰漏,希望大家指正。 在这里首先要感谢我的导师方江雄博士。方老师平日里工作繁
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 空旷土地改造方案(3篇)
- 船厂法兰采购方案(3篇)
- 餐饮门店收银服务方案(3篇)
- 医院饭票管理方案(3篇)
- 足球视频拍摄方案(3篇)
- 酒店灯泡改造方案(3篇)
- 水泥隧道修补方案(3篇)
- 高校浴室管理方案(3篇)
- 隧道混凝土组装方案(3篇)
- 高尔夫场地预算方案(3篇)
- 《桥小脑角占位》
- 甘肃省苹果产业发展现状、问题及对策苹果产业的现状及对策
- 培训MSDS专业知识课件
- 夜空中最亮的星二部合唱简谱
- 广东省佛山市南海区2021-2022学年六年级下学期数学学科核心素养水平抽样调研试卷
- YC/T 246-2008烟草及烟草制品烟碱的测定气相色谱法
- 钢结构施工检查记录表格
- 桥梁施工质量控制要点(PPT)
- 一二年级看图说话写话:过河 教学课件
- 售后服务管理制度与工作流程
- 消防改造工程技术标书模板
评论
0/150
提交评论