版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
毕业设计(论文)--文献翻译原文题目FaceRecognitionusingSIFTFeatures译文题目基于SIFT特征的人脸识别专业信息与计算科学姓名学号指导教师基于sift特征的人脸识别MohamedAly<malaa@caltech>CNS186TermProjectWinter2006摘要人脸识别具有许多重要的实际应用,如监控和访问控制。它涉及正确识别人脸图像和将其分配给数据库中的人的问题。本文提出了利用sift特征[4]进行识别过程。新技术与已建立的人脸识别算法,即eigenfaces[7]和fisherfaces[6,2]进行了比较。结果表明了这两种方法的优越性,特别是使用较小的训练集。1简介在许多应用中,人脸识别至关重要,包括照片匹配、监控、访问控制和个人识别以及法医和执法应用[8]。在这个问题中,我们有一个面向一群人的人脸图像数据库。然后,给定一个未知的人脸图像,我们想回答问题:“我们的数据库中的哪个人是这个图像的人?”提出了许多求解这类问题的算法和技术[8]。提出了一种基于尺度不变特征变换(sift)[4]的新方法。将新方法与eigenfaces[7]和fisherfaces[6,2]的已有的算法进行了比较。结果表明,这两种方法提高了识别精度。2背景资料2.1特征脸Eigenfaces是基于主成分分析(PCA)[7]的降维方法。基本思想是将每个图像作为一个向量在高维空间中处理。然后,将PCA应用于图像集,产生一个新的降维子空间,捕获输入图像之间的大部分变化。普林奇pal分量向量(样本协方差矩阵的特征向量)称为eigenfaces。每个输入图像可以表示为这些eigenfaces的线性组合,通过将图像投影到新的eigenfaces空间。然后,我们可以在减少的空间中匹配识别过程。将输入图像转换为特征空间,使用最近邻方法识别最近的人脸。可以使用最近邻分类器的两个版本。第一个将输入图像与数据库中的所有图像进行比较。第二个,称为最近的集群中心,计算每个集群的方法(同一个人的脸),并使用这些聚类方法进行比较。2.2Fisherfacesfisherfaces[6,2]方法是基于fisher著名的线性判别分析(LDA)[3]。LDA是一种有监督的降维方法,它旨在寻找最大化类变化性的数据的线性组合,同时最小化类可变性,即它试图找到一个新的降维子空间,它提供输入数据中不同类之间的最佳分离。这一基本思想被应用于人脸识别,其方式类似于应用PCA。每个人脸图像都是高维空间中的一个点。然后,将LDA应用于数据,得到新的基向量,称为fisherfaces。然后将人脸图像投影到这个基础上,进行匹配。我们可以再次使用上面描述的两种最近邻的味道进行匹配过程。2.3SIFT尺度不变特征变换(sift)特征是从图像中提取的特征,有助于同一对象的不同视角之间的可靠匹配[4]。提取的特征具有尺度和方向不变性,是图像的高度特征。他们是从四个步骤中提取的。第一步通过检测在不同尺度上应用的高斯(DoG)滤波器的一组差分的最大值和最小值来计算图像中潜在兴趣点的位置。然后,通过丢弃低对比度点对这些位置进行细化。然后根据本地图像特征将方向分配给每个关键点。最后,在每个关键点计算局部特征描述符。该描述符基于局部图像梯度,根据关键点的方向变换,提供方向不变性。每个特征都是一个维度128的向量,在关键点周围有一个特殊的标识。3Approach提出了一种基于sift特征的人脸识别方法。从数据库中的所有人脸中提取sift特征。然后,给出一个新的人脸图像,从该人脸中提取的特征与数据库中每个人脸的特征进行比较。具有最大匹配点的数据库中的人脸被认为是最近的人脸,用于新人脸的分类。当与该特征的距离小于与下一个最近特征的距离的特定分数时,考虑一个特征与另一特征匹配。这保证了我们减少了假匹配的数量。这是因为在假匹配的情况下,由于特征的高维数,将有许多其他接近距离的近特征。另一方面,如果有正确的匹配,由于sift特征的高度特征,它不可能找到另一个过于接近的特征。图1:AT&T人脸数据库(a)5幅样本图像(b)具有SIFT特征的图像4结果4.1数据库为了比较,使用了两个基准数据库。第一个是AT&T的数据库[5],包含400个图像,40个人有10个图像/人。每个学科有不同的方向和面部表情。图像大小为像素。从每幅图像中提取的平均70个sift特征。图1显示了一个主题的图像示例。第二个数据库是耶鲁人脸数据库[1]。它包含了15个主题的165个图像,有11个图像/人。图像包含每个主题的不同面部表情和光照条件。图像尺寸为像素,每幅图像平均提取230个sift特征。图2显示了这个数据库的图像示例。原始人脸无需任何预处理(裁剪、归一化、直方图均衡化等),以评估算法在比较中的稳健性。4.2算法利用MATLAB实现了eigenfaces、fisherfaces和sift匹配算法。从大卫的网站中获得了提取sift特征的代码。图2:耶鲁人脸数据库(a)5个主题的样本图像(b)具有sift特征的脸4.3实验4.3.1基线比较新方法与eigenfaces和fisherfaces的比较。进行了10次独立运行,将数据集随机分为两部分,一个用于培训,一个用于测试。介绍的结果是这些运行的平均值。eigenfaces和fisherfaces采用了三种距离测度:欧式距离,城市距离和余弦距离,其中x和y是两个特征向量,表示欧氏范数。两种算法都采用最近邻和最近的聚类中心。sift特征匹配采用两种距离测度:余弦距离和夹角距离定义为。表1的结果清楚地表明了sift技术对其他两种方法的优越性。对于奥地利,sift达到了96.3的准确度,而eigenfaces为92.9,fisherfaces为93.8。同样适用于耶鲁数据库,sift得到91.7%,eigenfaces为72.1,fisherfaces为86.9。结果表明,eigenfaces和fisherfaces的城市街区距离一般较好,而角度距离有利于sift匹配。4.3.2培训集大小还进行了两个实验,以验证不同训练集大小的性能。第一个是使用培训集的大小20%和测试集80%,第二个使用80%的培训和20%的测试。在所有实验中,10个独立试验是随机选择的培训和测试集进行的。表2显示了结果。正如所料,性能降低,较小的培训集规模和增加的更大的培训集。同样清楚的是,sift方法比其他方法更好。使用较小的训练集,耶鲁数据库的性能显著提高(sift为90.1,eigenfaces为83.5,fisherfaces为83.5)。表1:基线精度结果。最佳结果为粗体表2:培训集大小结果图3:大量的sift特征(a)AT&T数据库(b)耶鲁数据库4.3.3sift特征数为了评价人脸图像可靠匹配所需的sift特征不具备的sift特征数目,在匹配过程中只使用提取的sift特征子集进行多个实验。根据sift特征的尺度对sift特征进行分类,仅使用平均特征数的第一个p。我们尝试了5到100%的p,以5为增量。图3显示了AT&T和耶鲁数据库的结果。这些是10个独立运行的平均结果,使用50%的培训和50%的测试。显然,随着使用的sift特征数量的增加,精度迅速增加,然后开始饱和。仅使用30%的特征产量精度优于eigenfaces和fisherfaces。这可以大大减少sift匹配过程的运行时间,因为匹配操作的数目是,其中n是要匹配的特征数。因此,仅使用30%的功能只占用9%的时间来匹配所有点。4.3.4人脸图像的分辨率为了检查下采样的人脸图像对所报道的sift特征匹配精度的影响,对不同的人脸图像尺寸进行了实验。原始大小被缩小到75%、50%和25%的原始大小。使用随机将数据分成两部分执行10次独立运行。表3显示了结果。显然,提取的sift特征的平均数目随着图像分辨率的减小而减小。然而,这些决议50%的人给予完全相同的结果,而25%的准确率则降低价格。事实上,高达50%的分辨率仍然优于eigenfaces和fisherfaces。表3:决议结果5摘要本文提出了一种基于匹配sift特征的人脸识别方法。新方法与eigenfaces和fisherfaces相比,在所有实验中均优于它们,特别是较小的训练集大小。通过对可靠匹配所需要的sift特征的有效数量的研究,实验表明,我们只需要30%的特征,可以节省匹配所有提取特征所需时间的91%。此外,sift特征方法继续提供卓越的性能,最高可减少50%的分辨率。参考文献[1]Yalefacedatabase..[2]PeterN.Belhumeur,JoaoP.Hespanha,andDavidJ.Kriegman.Eigenfacesvs.fisherfaces:Recognitionusingclassspecificlinearprojection.IEEETransactionsOnPatternAnalysisAndMachineIntelligence,19(7):711–720,July1996.
[3]R.A.Fisher.Theuseofmultiplemeasuresintaxonomicproblems.Ann.Eugenics,7:179–188,1936.[4]DavidG.Lowe.Distinctiveimagefeaturesfromscale-invariantkeypoints.Internationaljournalofcomputervision,60,2004.[5]F.SamariaandA.Harter.Parameterisationofastochasticmodelforhumanfaceidentification.In2ndIEEEWorkshoponApplicationsofComputerVision,1994.[6]DanielL.SwetsandJohnWeng.Usingdiscriminanteigenfeaturesforimageretrieval.IEEETransactionsOnPatternAnalysisAndMachineIntelligence,18(8):831–836,August1996.[7]MatthewA.TurkandAlexP.Pentland.Facerecognitionusingeigenfaces.InProceedingsCVPR
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业人事管理系统框架
- 会议议程编排与执行模板
- 信息安全事故报告函(7篇)
- 产品质量检测流程标准化工具产品质量追溯系统
- IT技术支持服务台工作记录模板客户满意度跟进版
- 软件外包项目团队管理规范指南
- 安全生产与预防承诺书范文3篇
- 爱心助学活动加入承诺书(3篇)
- IT服务行业云服务平台建设与运营策略
- 农业科技人员精通作物栽培技术指导书
- 2026年河北衡水市城市投资控股集团有限公司公开招聘人员7名笔试模拟试题及答案解析
- 2026西藏自治区救灾物资储备中心招聘4人(编外)笔试参考题库及答案解析
- (25格)舒尔特方格练习题 儿童专注力训练(共19份每日一练)
- 2026年“强村公司”组建运营:公司化运作的治理结构与盈利模式
- 泰国本土教师初级汉语课堂纠错反馈研究-以罗勇府格灵中学为例
- 2026年北京市延庆区高三下学期一模政治试卷和答案
- 2026年3月广东广州市白云区人民政府鹤龙街道办事处招聘就业见习岗位人员10人考试参考试题及答案解析
- XX中学2026年春季学期教研组校级公开课(示范课)安排及听课要求
- 2026人教版数学三年级下册全册教学课件
- 2025宣城广德市国有资产投资经营有限公司第二批招聘笔试参考题库附带答案详解
- 新版北师版三年级下册数学全册教案(完整版)教学设计含教学反思
评论
0/150
提交评论