基于K均值的图像分类设计与实现_第1页
基于K均值的图像分类设计与实现_第2页
基于K均值的图像分类设计与实现_第3页
基于K均值的图像分类设计与实现_第4页
基于K均值的图像分类设计与实现_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、南京邮电大学通达学院 毕 业 设 计(论 文)题 目:基于K均值的图像分类设计与实现 专 业 自 动 化 学生姓名 施昊琛 班级学号 指导教师 朱松豪 指导单位 自动化学院 日期:2012年3月14日至2012年6月17日摘 要 K均值算法在高光谱遥感影像的非监督分类中具有较强的实用性, 表现出了良好的优点。首先采用了最大最小选心法确定初始类别中心, 然后使用了K均值算法实现遥感影像的分类。在分类过程中采用了VC+2005作为开发平台, 极大地提高了遥感影像的分类速度, 同时还给出了实现K均值分类主要步骤的代码。最后在深入分析不同迭代次数下得到的不同分类图的基础上, 研究了迭代次数值对最后分类

2、结果的影响。关键词:非监督分类; K均值算法; VC+2005ABSTRACTHuman Identification System Based on Biometrics is a totally brand-new technique different from traditional methods because it adopts the inherent organisms characteristics of human body. More and more people pay great attention to it as it is safer, more relia

3、ble and effective. It begins entering every realm of our society and meeting the challenge of new era. This paper first introduces the research background of the computer face recognition technology and the main method, and then propose a discriminant analysis based on Fourier transform and Face Rec

4、ognition. Linear discriminant analysis (LDA) in the PCA combined with Fisher on the basis of the principle criteria used to extract feature vectors, the proposed removal of the feature vector retained the original image space in the major categories of information, and can the minimum mean square er

5、ror reconstruction of the sense of the original image. The proposed method first uses Fourier transform to extract the face image is relatively stable low-frequency sub-band, blurring the facial expression and posture influence, and also reached a dimension reduction of the effect of the image vecto

6、r, and then use the linear discriminant analysis and identification feature extraction components. The algorithm is compared with the traditional LDA methods, which greatly reduces the computational complexity, the extracted features further reflects the difference between the face and improve the r

7、ecognition rate and noise performance, experimental results show that the proposed algorithm is accurate effective.Keywords:Pattern Recognition; Human Face Recognition; Fourier Transform; Linear Discriminant Analysis目 录第一章 绪论11.1 模式识别11.1.1 基本概念11.1.2 模式识别系统11.1.3 模式识别的主要方法21.2 图像、图像处理与图像识别31.3 人脸识别

8、技术41.3.1 生物特征识别技术41.3.2 生物特征识别技术的应用和前景51.3.3 人脸识别的研究背景及意义61.3.4 人脸识别的发展历史81.3.5 人脸识别的国内外发展现状81.3.6 人脸识别系统9第二章 傅里叶变换及其应用112.1 傅里叶变换的定义112.2 连续傅里叶变换112.2.1 一维连续傅里叶变换112.2.2 二维连续傅里叶变换122.3 离散傅里叶变换132.4 傅里叶变换在图像处理中的应用15第三章 基于傅里叶变换的线性鉴别分析173.1 线性鉴别分析(LDA)方法173.1.1 基本思想173.1.2 基本原理173.2 基于LDA的人脸特征提取方法的优缺点

9、193.3 基于傅里叶变换的LDA方法193.4 本章小节21第四章 实验结果224.1 引言224.2 人脸库介绍224.3 仿真实验234.3.1 图象预处理:234.3.2 不同训练样本下的识别率244.4 实验结果分析25结束语26致 谢27参考文献28附录A30第一章 绪论1.1 模式识别1.1.1 基本概念模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现,50年代人工智能的兴起,人们当然也希望能用计算机来代替和扩展人类的部分脑力劳动。(计算机)模式识别在60年代迅速发展成一门学科,它所研究的理论和方法在很多科学和技术领域中得到

10、广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。几十年来,模式识别研究取得了大量的成果,在很多方面得到成功的应用。 什么是模式和模式识别呢?广义的说,存在于时间和空间中可观察的事物,如果我们可以区别他们是否相同或是否相似,都可以称之为模式5;狭义的说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息但模式所指的并不是事物本身,而是我们从事物中获得的信息;而把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。有时也把模式类称为模式,而把个别具体的模式称为样本。而“模式识别”则是在某些一定量度或观测基础上把待识模式划分到各自的模式类中去。1.1.2 模式

11、识别系统一般来说与不同的模式识别方法所对应的模式识别系统也是不同的,常用的基于统计方法的模式识别系统主要由四个部分组成6:数据获取、预处理、特征提取和选择、分类决策,如图1.1所示。信息获取预处理特征提取和选择分类器设计分类决策图1.1 模式识别系统下面对这几个部分作些简要说明。(1)数据获取为了使计算机能够对各种现象进行分类识别,要用计算机可以运算的符号来表示所研究的对象。通常输入对象的信息有下列3种类型,即:(a)二维图像如文字、指纹、人脸、地图,照片等。(b)一维波形如脑电图、心电图、机械震动波、声波等。(c)物理参量和逻辑值如大、小、是、否等。通过测量、采样和量化,可以用矩阵或向量来表

12、示二维图像和一维波形,这就是数据获取的过程。(2)预处理预处理的目的是去除噪声、增强有用信息,并对输入测量仪器或其他因素所造成的退化现象进行补偿和复原。(3)特征提取和选择由图像或波形所获得的数据量是相当大的。例如,一个文字图像可以有几千个数据,一个心电图波形也可能有几千个数据,一个卫星遥感图像的数据量就更大。为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征,这就是特征抽取和选择的过程。一般我们把原始数据组成的空间叫做测量空间,把分类识别赖以进行的空间叫做特征空间。通过变换,可把在维数较高的测量空间中表示的模式变换为在维数较低的特征空间中表示的模式。在特征空间中的一个

13、模式通常也叫做一个样本,它往往可以表示为一个特征向量,即特征空间中的一个点。(4)分类决策分类决策就是在特征空间中用统计方法把对象归为一类.基本做法是在样本训练集基础上确定某个判决准则,使按这种判决准则对被识别对象进行分类所造成的错误识别率最小。1.1.3 模式识别的主要方法在早期的模式识别研究中,模式的特征被表示为一个数组,它们是对原始数据进行各种测量所得的结果。这些数据可以解释为矢量空间中点的坐标,如果特征源自同一模式的物体,就几何距离而论,其对应点总是很接近的。于是模式识别问题就变成寻找空间中一些区域的问题,这些区域上的点来源于某个单一模式,这就是分类。由于解决这类问题的方法多数基于贝叶

14、斯决策统计理论,所以称这类方法为统计模式识别。应用统计决策理论进行模式识别,必须建立在能正确测量或抽取模式特征的基础上,然而统计模式识别方法不能提供对测量或抽取特征的指导。特别是在复杂模式的情况下,抽取特征是相当困难的。在60年代后期,这一困难把许多研究者引导到一个不同的方法上,即句法模式识别。这种方法的基本思想是把一个复杂模式用简单的子模式或基元递归地描述。例如,汉字可以由笔画描述,这种递归描述与课文中短语通过单词描述十分相似,由于这一原因,形式语言中的许多方法都可以应用,但句法方法本质上是一种串行的操作,这一性质给句法方法的应用带来了很大的局限性。句法模式识别是建立在二值逻辑基础上的,而在

15、人们的日常生活中,普遍存在着模糊概念,诸如“较冷”、“暖和”、“较重”、“较轻”、“长”、“短”等等都是一些既有区别又有联系的无确定分界的概念.模糊概念是客观事物本质属性在人们头脑中的映,是人类社会长期发展过程中约定俗成的东西,为了描述和分析自然界中各种模糊事物,近年来又出现了一种基于连续逻辑的模式识别方法一一模糊集识别法.这种方法既有其数学基础(模糊数学),又更接近于人的思维方法。利用模糊似然推理及模糊方法等技术来实现模式识别是当前智能机器发展的方向之一。上述三类模式识别方法存在一个共同的问题,即在一般情况下,要实现在识别结构的同时检测出物体,使特征提取和识别算法同时进行的算法在理论上还没有

16、什么基础。 模式识别作为一个学科领域已存在30多年了,虽然已经建立起了丰富的理论并且还在进一步发展,然而,要使现代机器具有类似人的进行复杂模式识别能力的目标还相差甚远,根本的问题在于搞清楚我们人本身是怎样进行模式归纳、学习与识别的。这一问题如不取得突破性进展,那么我们只能在特定领域的应用中使机 器完成相当有限的工作,更深一步的工作就必然会遇到巨大困难。近年来,许多学者正在从事于“神经元网络”的研究,目的是使机器具有模拟人处理信息的功能,解决当前人工智能与模式识别领域所遇到的若干问题。人工神经网络所表现出的类似人的学习、归纳与分类的能力,以及并行分布式处理结构,有可能同时完成特征提取和识别。传统

17、的模式识别方法所面临的一个突出问题是在模式识别过程中如何利用这种并行分布式处理方式来解决不确定性问题。神经网络理论的诞生和发展己促使计算机视觉与模式识别处于一个新的迅速发展阶段。在模式识别领域中,图像识别是一个非常重要的方面,下面介绍一下有关图像处理与识别的一些问题。1.2 图像、图像处理与图像识别通常人眼所看到的客观存在的世界称之为景象。当我们从某一点观察某一景象时,物体所发出的光线(可以是发光物体本身辐射的光,也可以是物体受光源照射后反射或透射的卿进入人眼,在人眼的视网膜上成像。视网膜成像是一种自然的物理现象,直到人类文明发展到一定时候人们才意识到它的存在,并设法用各种方法把它记录下来。这

18、种记录下来的各种形式的“像”就是通常所说的图像,它包括各类图片,照片、绘图、文稿、X光胶片等等。这些图像都是人们对客观景象、事物,以及人们的思维、想象的一种描述和记录,是人类用来表达和传递信息的一种重要的手段。由于图像与人类生活关系非常密切,小到家庭生活,大到生产、医疗、艺术、文教、军事、航天都离不开图像,因而对图像处理提出了越来越高的要求。正是由于这种迫切的实际需要,给图像处理技术的发展提供了巨大的动力,促进了这门年轻学科突飞猛进的发展。在研究图像时,首先要对获得的图像信息进行预处理消除干扰和噪音,做几何和彩色校正等,这样可提高信噪比。有时由于信息微弱无法辨识,需要进行增强。增强的作用,在于

19、提供一个满足一定要求的图像,或对图像进行变换,以便人机分析,并且为了从图像中找到需要识别的特征,必须对图像进行分割,也就是进行定位和分离,以分出不同的特征。为了给观察者以清晰的图像,还要对图像进行改善,即进行复原处理。它是把已经退化了的图像加以重建或恢复的过程,以便改进图像的保真度。在实际处理中,由于图像信息量非常大,存储和传送时还要对图像信息进行压缩。总之,图像处理包括图像描述、图像编码、图像增强、图像压缩、图像复原和图像分割等。对图像处理环节来说,输入是图像,输出也是图像,也就是处理后的图像。 图像识别是对处理后的图像进行分类,确定类别名称,它可在分割的基础上选择 需要提取的特征,并对某些

20、参数进行测量,再提取这些特征,最后根据测量结果作一分类。为了更好地识别图像,还要对整个图像进行描述和做结构上的分析,以便对图像的主要信息进行一个解释和理解,并通过许多对象相互间的结构关系 加深对图像理解,以更好地帮助识别。所以图像识别是在上述分割后的每个部分中,提取它的特征,便于图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像,输出是类别和图像的结构分析,而结构分析的结果则是对图像作描述,以得到对图像重要信息的一种理解和解释。上述的图像处理和图像识别可如图1.2表示。图像处理(编码、压缩、增强、分割、复原等)图像输入图像输出(a) 图像处理图像输入图像识别(预处理、

21、特征抽取、分类、分析等)图像输出(b) 图像识别 图1.2 图像处理和识别示意图1.3 人脸识别技术1.3.1 生物特征识别技术 当今社会,随着科学技术的突飞猛进,计算机及网络的高速发展,信息的安全性、隐蔽性越来越重要,如何有效、方便地进行身份验证和识别,已经成为人们日益关心的问题。传统的身份验证和识别方法如身份证、工作证、智能卡、密码、口令等存在携带不便、容易遗失、或者由于使用过多或不当而损坏、不可读和密码易被破解等诸多问题。因此,目前广泛使用的依靠证件、个人识别号码、口令等传统方法来确认个人身份的技术面临着严峻的挑战,并越来越不适应现代科技的发展和社会的进步1。基于生物特征识别技术的优点是

22、: (1)能识别出表征或知识的正确主人; (2)用户使用方便; (3)能消除一些不良分子的抵赖声明; (4)强化安全; (5)不能被丢失、遗忘或转让。从理论上说,任何人体的物理和行为特征只要满足以下条件都可以用来作为识别个人身份的途径。普遍性:即每一个人都应该具有这一特征;唯一性:即每一个人都应该在这一特征上有不同的表现;永久性:即这一特征不会伴随着年龄的增长、时间的改变而改变;采集性:即这一特征应该是容易测量的。但实际上,它还应该考虑以下几个方面的条件:性能:即识别能达到的精度,以及要达到这种精度所需的设备、工作或环境因素对识别精度的影响;可接受性:即通过这种特征进行识别应该是安全的,不会因

23、为技术上或其它的原因而被轻易欺骗。因此,基于对以上各个方面的综合考虑,现在人体生物识别技术的研究主要针对人体的人脸、指纹、人脸温谱、虹膜、视网膜、掌纹、3D手型、签名、声纹等物理或行为特征来进行1。1.3.2 生物特征识别技术的应用和前景随着科技日新月异,以及电脑(computer)、通讯(communications)、内容(content)这三C的结合,全新的互动多媒体(interactive multimedia)已经登场。数码智慧不仅是科技的连线,更是人类智慧的新形态。Bill Gates曾做过这样的断言,生物识别技术,利用人的生理特征,例如像指纹等来识别个人的身份,将成为今后几年IT

24、产业的重要革新,Gates的这段言论是因为有越来越多的个人、消费者、公司和政府机关都承认现有的基于智能卡、身份号和密码的身份识别系统是远远的不够的。生物识别技术为此提供了一个解决方案1。生物特征识别技术作为一种快速发展的技术己经被广泛应用于罪犯鉴别、监狱安全等法律实施领域。当前在公民身份证中存储生物待征的技术也正在被许多国家政府采纳。由于电子交易的蓬勃发展(在2002年全球通过入门网站达成的贸易额达到约五万亿美元),电子商务和电子银行业成为生物特征识别技术两个最重要的新兴应用领域。这些应用包括电子存款转账、自动柜员机(ATM)安全、支票兑现、信用卡安全、智能卡安全、在线交易等等。目前,在这些领

25、域中有几个大型的生物信息安全项目正处在发展之中,包括万事达信用卡(MasterCard)的信用卡安全和IBM与美国捷运公司(American Express)的智能卡安全。许多生物特征识别技术都竞相在这些应用领域显示它们的效能。虽然当前门禁控制系统的市场仍然主要被基于“信物”的技术所占领,但是可以预见随着生物特征识别技术的发展,它拥有的市场份额将不断上升。信息系统和计算机网络安全(比如用户授权和通过远程登录访问数据库)是生物特征识别技术的另一个重要的潜在市场。随着国际互联网和企业内部网(intranet)的迅速扩展,在2005年全球互联网用户将达到7.65亿,与此同时,网络黑客的破坏活动也会层

26、出不穷,因此将有越来越多的信息系统和计算机网络使用基于生物特征识别技术的安全系统。另外,使用生物特征识别技术,政府投票机构可以更有效地防止选举舞弊行为,公司员工考勤设备可以防止诸如“替代考勤”之类事件的发生1。 随着人类社会逐渐迈入数字时代,基于生物特征的身份识别技术愈加显示出它的价值。以美国为例,基于这项技术的产业规模已经达到数十亿美元。在美国,每年约有上亿美元的福利款被人以假冒的身份领取,每年约有价值四亿五千万美元的信用卡诈骗案发生。利用可靠的方法鉴别ATM持卡人的身份,可以使全美国每年ATM诈骗案造成的损失减少3亿美元。据美国移民局估计,如果在美国和墨西哥边境采用快速准确的身份识别系统,

27、每天可查出3000件非法入境案件。在国内,2002年10月25日,我国公民身份证法草案首次提交最高立法机关审议,草案规定第二代公民身份证中将包含公民的指纹信息;香港政府也明确提出,计划在2002年至2003年耗资29亿港币为香港市民更换智能指纹身份证,新身份证可以支持“自动通关”系统;深圳特区政府己经为全市3.5万名离退休人员设立了指纹档案,借助计算机指纹验证系统发放养老金。目前,国内外许多高技术公司正在试图用基于眼睛虹膜、指纹、面貌等生物特征的技术取代人们手中的各种卡片和密码,并且己经开始在机场、银行和各种电子器具上进行实际运用,结果备受青睐。据国际生物识别产业协会估计,生物识别技术的软件和

28、硬件市场有望在10年内达到每年20亿美元的规模1。总之,生物特征识别技术不但具有极大的学术研究价值,而且具有广泛的社会需求和市场领域。目前,在来自各方面的需求的积极推动下,生物特征识别技术正在不断的推陈出新、蓬勃发展。可以预计,在不远的将来,包括人脸识别技术在内的各种生物特征识别技术,作为安全级别更高的新兴技术,将革命性地在社会应用的各个层面逐步取代传统的基于“信物”或者口令的身份识别方法,在自动身份识别的安全领域中占据主导地位。生物特征识别技术将密切深入到人类的日常生活中,对人类社会产生巨大影响1。1.3.3 人脸识别的研究背景及意义人脸识别(Face Recognition)是一种重要的生

29、物特征识别技术。生物特征识别技术是指通过对人体固有的生理或行为特征进行自动身份鉴别技术。可依据的生理特征如:手形、指纹、人脸、虹膜、耳廓、NDA等;可依据的行为特征如:签字、步态、语音、键盘敲击等。目前基于这些特征,已有相应的生物识别技术,如指纹识别、人脸识别、语音识别、虹膜识别、签名识别、步态识别等2。在高速发展的社会中,基于传统的身份标示方法如:证件、钥匙、用户名、密码等,因其具有易丢失、易盗窃、易遗忘、易造假等缺点,已不能满足人类的需求,人类迫切需要一种快速、有效、安全的身份辨识方法。而基于生物特征识别的身份鉴定与传统的身份鉴定手段相比,具有唯一性、安全可靠、不易伪造等优点,因此已在信息

30、安全、金融、公共安全等领域得到广泛的应用,并且对其识别技术要求越来越高。而人脸识别相比其他生物特征识别具有其独特的优势,主要体现在以下几个方面:(1)隐蔽性操作强,特别适用于安全监控;(2)非接触式操作,符合一般用户的习惯,容易被大多数用户所接受;(3)图像采集系统成本低廉;(4)友好的用户界面,可交互性强;(5)通过人脸的表情、姿态分析、还能获得其他识别系统难以获得的信息。因此人脸识别技术已成为最有潜力的生物特征识别技术之一。尤其在美国“9.11”恐怖袭击事件之后,进一步加强了人们对于国家安全面临严峻挑战的认识,使得人脸识别技术受到各国政府和科学界的普遍关注,并已成为自动身份认证领域的主要研

31、究方向2。目前人脸识别技术已初步、或将要在以下领域得到广泛应用: (1)出入控制人脸识别技术已被某些公司、单位、政府及井下作业单位等用于考勤;被海关等用于门禁;被某些重要场所用于门卫系统检测。并在这些领域提出了对人脸识别的更多需要; (2)公共安全 目前人脸识别技术已初步用于协助公安机关破案,如帮助公安机关进行自动身份识别、在机场、车站、码头等地用于可疑分子跟踪、在公共场合(大型超市、游乐场等)用于恐怖分子检测等。在9.11事件、及近期国际及国内部分恐怖事件后,这方面需求更加迫切。 (3)信息安全人脸识别技术在信息安全领域也有着巨大的潜在应用价值。随着网络技术的发展,网络的安全控制成为一个日益

32、迫切的重要问题。例如,在计算机远程登录控制、数据库的安全访问、程序的安全使用中,利用人脸识别技术可以加强局域网和广域网的安全性,并且可以解除必须记录各复杂用户名、密码的烦恼。在电子商务飞速发展的现代,利用人脸识别技术可以加强其网上交易的安全性。 (4)人机交互利用人脸识别技术可以创建友好自然的人机交互方式,简化人与计算机的交互方式,是智能计算机领域研究的重要内容之一。除此之外,由于人脸识别的独特优势,人脸识别还可以应用于虚拟现实、视频会议等场合,并在各种需要身份认证的场合具有广泛的应用前景。除了广泛的应用领域,人脸识别技术的研究同样具有重要的理论研究价值。人脸识别技术的研究涉及模式识别、计算机

33、视觉、人工智能、图像处理、心理学、生理学和认知科学等多学科。 (1)人脸识别过程完全可以看成一种模式识别过程。这里将每个人作为一个模式,与模式识别一样需要经过数据获取、预处理、特征提取、分类决策等过程来完成人脸识; (2)并且人脸识别过程需要利用神经网络的思想,需要计算机有学习、记忆、模式分类功能; (3)由于人脸识别是对图像进行处理,而图像属于二维信号,因此与信号处理领域关系密切; (4)同时图像又可看成矩阵,对人脸图像处理就是对矩阵的处理,需要用到线性代数、矩阵论相关学科; (5)因计算机的自动人脸识别需要利用视觉数据,类似于人类利用眼睛,因此对其进行研究,有助于帮助人类认识人类本身的视觉

34、处理原理。 因此人脸识别技术与多学科有紧密的联系,是一较复杂研究课题。而且由于光线、表情、姿态、遮挡物、年龄变换等影响,同一人的人脸图像将发生很大变化,对人脸识别带来很大挑战。同时人脸识别的问题也是机器视觉、模式识别等领域的问题,因此对人脸识别技术的研究成果,同样可以促进计算机人机交互领域和基于其它生物特征的身份识别的发展。虽然目前国内外己经有许多实用系统问世,但是只有在非常苛刻的成像条件下,才能得到比较令人满意的识别效果。因此人脸识别技术的研究仍然远远没有达到完善的境地,还有非常大的发展空间2。由于人脸识别技术的研究不仅具有广泛的应用前景,而且具有很大的理论研究价值,能促进多学科发展,因此对

35、此课题的研究不仅意义深远,而且非常迫切。1.3.4 人脸识别的发展历史人脸识别的研究历史比较悠久,早在1888年,Calton就在Nature上发表了一篇关于利用人脸进行身份识别的文章,对人类自身的人脸识别能力进行了分析。总的来说,人脸识别的发展大致可分为3个阶段:第一阶段以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。1893年,Bertillon用一个简单的语句与数据库中某一张脸相联系,同时与指纹分析相结合,提供了一个较强的识别系统。为了提高脸部识别率,Allen为待识别人脸设计了一种有效和逼真的摹写,Parke则用计算机实现了这一想法,并产生了较高质

36、量的人脸灰度图模型。这一阶段的工作特点是识别过程完全依赖于操作人员。显然这不是一种可以完成自动识别的系统。第二阶段是人机交互式识别阶段。20世纪70年代,美、英等发达国家开始重视人脸识别的研究工作并取得一定进展。1972年,Goldstion,Harmon等用几何特征来表示人脸正面图像。他们采用21维的特征矢量表示人脸面部特征,并设计了基于这一特征表示法的识别系统。Kaya和Kobayashi则采用了统计识别方法,用欧氏距离来表征人脸的特征,如嘴唇与鼻子之间的距离,嘴唇的高度等。更进一步地,T.Kanad(M.Nagao)设计了一个高速目有一定知识导引的半自动回溯识别系统,创造性地运用积分投影

37、法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。Kanad的系统实现了快速、实时的处理,是一个很大的进步。相比之下,Baron所做的工作较少为人所知:他先将图像灰度归一化,再用4个掩模(眼、鼻、嘴及眉毛以下的整个脸部)表示人脸,然后分别计算这4个掩模与数据库中每幅标准图像的相应掩模之间的互相关系数,以此作为判别依据。总的来说,这类方法需要利用操作员的某些先验知识,仍然摆脱不了人的干预。第三阶段是真正的机器自动识别阶段。从1990年代起,由于计算机、数字图像处理、模式识别等技术的发展,加上人们对人脸图像自动识别的迫切需求,人脸模式识别方法有了较大的突破,提出了多种机器全

38、自动识别系统。1996年美国军方组织了人脸自动识别系统大赛,勒克菲勒大学的Face It系统获得冠军。随后,美国的LAU公司研制的人脸图像自动识别系统,是以人眼辨别人脸的原理,基于生物测量学、人像复原技术开发的装置。用人脸12-42个特征点,对人群中寻找的人进行定量定性识别,己经用在机场、火车站、公共场所、重点控制地区2。1.3.5 人脸识别的国内外发展现状现今,人脸识别越来越引起各科研机构的关注,并已有部分科研单位和公司将研究成果转化为了实用产品。如Visionics公司的“FaceIt”人脸识别系统,Microsoft公司的TrueFace系统,以及Zn Bochum Gmbh公司研制的Z

39、N-Face等。目前国际上有很多公司和研究机构正在对人脸识别做深入研究。如德国的Cognitec System GmbH、美国的Identix Inc、美国的Viisage以及Neven Vision,韩国三星公司、日本东芝公司;学术研究机构有麻省理工学院、卡耐基梅隆大学、耶鲁大学、密西根州立大学、新泽西理工学院和休斯顿大学。国内关于人脸自动识别的研究始于二十世纪80年代,主要的研究单位有清华大学,北京大学、哈尔滨工业大学、中科院计算所、中科院自动化所、复旦大学、北京科技大学等,虽然起步较晚,但是国内关于人脸自动识别的研究已经取得了可喜的成绩。清华大学智能图文信息处理研究室研制的TH-ID人脸

40、识别系统参加了国际上最权威的人脸识别供应商评测(FRVT2006),在参评的包括国际上最著名人脸识别公司的22个单位中,是11个完成标志着技术实用化的大规模数据库测试的单位之一,同时测试结果位于国际领先水平。在非控制光照条件下计算机人脸识别性能和人眼的人脸识别性能的比较中,是唯一优于人眼的人脸识别性能的系统。在2008北京奥运会期间,北京数字奥森科技有限公司技术人员和中国科学院自动化研究所生物识别与安全技术研究中心的科学家和研究人员,开创性地将自主知识产权、国际先进的人脸识别技术应用于北京2008奥运会。这也是奥运史上首次将人脸识别高科技技术,作为人员身份识别的智能化手段引入奥运安保。该人脸识

41、别信息比对系统,实现开闭幕式上对门票持有者进行实名制查验和人员身份识别,为奥运安保大系统提供决策支持依据,并提供重要的入场人员数据信息。2008年9月,汉王在世界上首创的嵌入式、脱离PC电脑、双摄像头“汉王人脸通”问世,并在北京国际安防博览会上获得“生物识别”产品领域的唯一“创新奖”。2009年3月,在德国汉诺威全球最具代表性且规模最大的信息电子展(CEBIT)上,受到与会业界人士尤其是国外同行的高度评价。为促进人脸识别算法的深入研究和使用化,美国国防部发起了人脸识别技术(Face Recognition Technology,FERET)工程,它包括一个通用的人脸库和一套通用测试标准,用于定

42、期对各种人脸识别算法进行性能测试,其分析测试结果对未来的工作起到了一定的指导作用。由美国NIST(National Institute ofStandards and Technology)组织的人脸识别供应商评测(Face Recognition Vendor,Test,FRVT),主要面向人脸识别技术的供应商,对各研究机构及公司的人脸识别系统进行性能评测。人脸识别作为模式识别中较复杂的问题之一,现在已经涌现了各种经典算法,并取得了较好的实用效果。但是,目前针对人脸识别的应用,均采用了较严格的约束,如光线、表情、姿态、遮挡物等。对于复杂背景、人数众多等复杂环境下,还不能达到实用效果,这说明人

43、脸识别走向实际应用还有待探索2。1.3.6 人脸识别系统人脸自动识别系统包括两个主要技术环节如图1.3所示:首先是人脸的检测和定位,即从输入图像中找出人脸和人脸存在的位置,并将人脸从背景中分割出来,然后对归一化的人脸图像进行特征提取与识别。图像或图像序列人脸的检测与定位人脸图像特征提取与识别识别结果图1.3 人脸自动识别系统的构成这两个环节的独立性很强。由于在很多特定情况下人脸检测与定位的工作比较简单,因此“特征提取与识别”环节得到了更为广泛深入的研究。而近几年来随着人们越来越关心各种复杂情形下的人脸自动识别系统,人脸检测与定位才得到了较多的重视。评价一个人脸自动识别系统的标准,一个是误识率,

44、即将某个人错误识别为他人,另一个是虚警率,即将他人识别为这个人。这两者之间是存在矛盾的,所以在实际问题中往往需要某种折衷。如在安全性要求较高的计算机登录系统中,必须要求虚替率尽可能低,而误识率可以高一些,这样只是增加合法用户的登录时间,并不会降低计算机系统的安全性。这一点同样适用于特征提取与识别环节,但是对人脸的检测与定位,我们一般要求误识率要尽可能低,因为这样才可以保证所要识别的人不会在这一步丢失。常用的人脸识别实验库以美国军方的FERET库最为权威,它包括多人种、多年龄段、各种表情变化、光照变化和姿态变化的图像,图像的数量和实验人数也非常多,可以充分地验证人脸识别算法。另外如MIT, OR

45、L等人脸库也可以用来验证算法在某些方面的能力。第二章 傅里叶变换及其应用2.1 傅里叶变换的定义 傅里叶变换就是将以时间(或空间)为自变量的信号转变为以频率为自变量的信号,是图像处理中最常用的一种变换。传统的傅里叶变换是一种纯频域分析,它可将一般函数表示为一组标准函数的加权求和,而权函数就是的傅里叶变换3。设f是R上的能量有限的模拟信号,其傅里叶变换定义为 (2.1)为傅里叶频率的函数。傅里叶变换作为一种正交变换可将空间域中复杂的卷积运算转化为频率域中简单的乘积运算。人们在频率域中可以有效地实现图像增强、特征提取、图像恢复、纹理分析与水印嵌入,因而在图像处理中得到了广泛的应用。2.2 连续傅里

46、叶变换2.2.1 一维连续傅里叶变换一维连续傅里叶变换的定义如下:对于连续时间变量的信号(函数),如果满足狄里赫莱条件:(1)具有有限个间断点;(2)具有有限个极值点;(3)绝对可积。则的傅里叶变换为 (2.2) 对应的逆变换为 (2.3)式中,为频域变量,为虚数单位。式(2.2)和(2.3)成为傅里叶变换对。信号的傅里叶变换一般为复数,从而可表示为复数形式 (2.4) 式中,与分别为的实部与虚部。也可以写成指数形式 (2.5)式中 (2.6) (2.7)为相角,为幅度,也称为信号的傅里叶谱,其平方称为的能量谱,即为 (2.8)在工程应用中狄里赫莱条件一般是可以满足的,即傅里叶变换是存在的。对

47、于离散信号,其离散傅里叶变换及其逆变换分别为 (2.9) (2.10) 式中,称为空间频率。 类似于连续情形,离散傅里叶变换可表示为复数形式与指数形式,可以定义相应的实部、虚部、相角、幅度(傅里叶谱)与能量谱。2.2.2 二维连续傅里叶变换 设有连续的二维可积函数,满足条件。则函数f(x,y)的二维连续傅里叶变换为: (2.11)对于函数平移变化,因为所以则: , (2.12)傅里叶变换满足平移不变性。对于函数尺度变化,因为所以则: (2.13)可以看出,对于尺度变化,傅里叶变换在幅值和尺度上作相应变化。对于函数旋转变化,因为f令,所以,令,则: , (2.14) 可以看出,对于旋转变化,傅里

48、叶变换在频域内作相应的旋转变化。对于平移变化,可以对傅里叶变换结果取模实现平移不变性。对于尺度变化和旋转变化有: (2.15)尺度因子可以通过标准化进行消除。令,有,令,则有: (2.16)对函数再进行一次傅里叶变换,即可实现尺度不变性和旋转不变性。2.3 离散傅里叶变换 离散傅里叶变换的输入和输出都是离散的,这使得计算机处理比较方便。而计算机在处理二维图像时,需要使用二维离散傅里叶变换。定义一个离散的函数,它在有限区域和内。二维的的离散傅里叶变换为 (2.17)式中,称为空间频率。其逆变换式为 (2.18)式中。 在图像处理中,一般选择为方阵,即取。此时,采用如下的定义式 (2.19) (2

49、.20)其中。傅里叶变换具有一些良好的性质,这使得其被广泛的使用。以式(2.19)和式(2.20)为例,二维傅里叶变换的性质如下:1可分离性 (2.21) (2.22)可知二维离散傅里叶变换(或反变换)具有可分离性,可通过连续两次一维傅里叶变换(或反变换)来求得,先做列变换,再做行变换。此外,根据可分离性,可利用一维快速傅里叶变换来实现二维离散傅里叶变换。2 平移性若为的傅里叶变换,则记,即用?表示函数与其傅里叶变换的对应性。傅里叶变换对的平移性是指 (2.23) (2.24)由可知,对进行平移不影响它的傅里叶变换的幅度。 3周期性 傅里叶变换是以为周期的,即 (2.25) 4分配性 如果可表

50、示两个信号的线性组合,即 (2.26)那么 (2.27)式中,与分别为与的傅里叶变换。5平均值 (2.28)式中,表示空间域的平均值。可知傅里叶变换在原点的频谱分量是空间域的平均值的倍。2.4 傅里叶变换在图像处理中的应用傅里叶变换在图像处理中有着重要的应用,傅里叶是数字图像处理技术的基础,其通过在时空域和频率域来回切换图像,对图像信息特征进行提取和分析、简化了计算工作量,被喻为描述图像信息的第二种语言,广泛应用于图像变换,图像编码与压缩,图像分割,图像重建等。傅里叶变换是大家所熟知的正交变换。在一维信号处理中得到了广泛应用。图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯

51、度,如:大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对于地表属性变换剧烈的边缘区域在图像中是一片灰度变化剧烈的区域,对应的频率值较高。傅里叶变换在实际中有非常明显的物理意义,设f是一个能量有限的模拟信号,则其傅里叶变换就表示f的谱。从纯粹的数学意义上看,傅里叶变换是将一个函数转换为一系列周期函数来处理的。从物理效果来看,傅里叶变换是将图像从空间域转换到频率域,起逆变换是将图像从频率域转换到空间域。换句话说,傅里叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,傅里叶逆变换是将图像的频率分布函数变换为灰度分布函数。傅里叶变换以前,图像(未压缩的位图)是由对在连

52、续空间(现实空间)上的采样得到一系列点的集合,我们习惯用一个二维矩阵表示空间上各点,则图像可由z=f(x,y)来表示。由于空间是三维的,图像是二维的,因此空间中物体在另一个维度上的关系就由梯度来表示,这样我们就可以通过观察图像得知物体在三维空间中的对应关系。为什么要提梯度?因为实际上对图像进行二维傅里叶变换得到频谱图,就是图像梯度的分布图,当然频谱图上的各点与图像上各点并不存在一一对应的关系,即使在不移频的情况下也是没有。傅里叶频谱图上我们看到的明暗不一的亮点。实际上图像上某一点与领域点差异的强弱,即梯度的大小,也即该点的频率的大小(可以这么理解,图像中的低频部分指低梯度的点,高频部分相反)。

53、一般来讲,梯度大则该点的亮度强,否则该点亮度弱。通过观察傅里叶变换后的频谱图,也叫功率图,我们首先就可以看出,图像的能量分布,如果频谱图中暗的点数更多,那么实际图像是比较柔和的(因为各点与领域差异都不大,梯度相对较小),反之,如果频谱途中亮的点数多,那么实际图像一定是尖锐的,边界分明且边界两边像素差异较大的,对频谱移频到原点以后,可以看出图像的频率分布是以原点为圆心,对称分布的。将频谱移频到圆心除了可以清晰地看出图像频率分布以外,还有一个好处,它可以分离出有周期性规律的干扰信号,比如正弦干扰,一副带有正弦干扰,移频到原点的频谱图上可以看出除了中心以外还存在以某一点为中心,对称分布的亮点集合,这

54、个集合就是干扰噪声产生的,这是可以很直观的通过在该位置放置带阻滤波器消除干扰。第三章 基于傅里叶变换的线性鉴别分析在上一章中我们详述了傅里叶变换及其应用,在这一章我们将讨论的算法是基于线性鉴别分析(LDA)的,在傅里叶变换里我利用了它能够通过在时空域和频率域来回切换图像的方法来降维,目的就是减少计算量,LDA是想如何最优的表示出类别间的差异,理论上来说,基于LDA的算法应该有着更好的别识率。3.1 线性鉴别分析(LDA)方法3.1.1 基本思想 线性鉴别分析(LinearDiscriminantAnalysis,LDA)是统计模式识别的基本方法之一。应用统计方法解决人脸识别问题时,经常碰到的问题之一就是被称之为“维数灾难”的问题。在低维空间里解析上或计算上可行的办法,在高维空间里可能变得毫无实际意义。因此,降低维数就成为处理实际问题的关键并发展了许多压缩特征空间维数的方法。我们希望通过寻求一种线性变换,可以使人脸图像从高维的图像空间映射到低维的特征空间,而不降低人脸的识别能力。特征脸方法是基于线性映射,使人脸图像从图像空间投影到特征空间的方法。但是这种方法采用PCA来降维,不考虑类内和类间分布的差异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论