




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Comment on 100% accuracy in automatic face recognition(摘要) 詹金斯和伯顿报道说,图像平均技术把人脸自动识别提高到100%并且同时被应用到图片身份识别,我们怀疑在身份识别问题上,图像平均技术的可行性不充分,没有足够的证据支持。在自动面部识别里,画廊里的面部图像是为后续搜索中第一个被注册和编码的。然后就把探测图像和画廊里的任意一张编码图像进行比较,当能够匹配并且被识别的时候,就标记一下。在目前的研究当中,詹金斯和伯顿使用名人的照片作为探测图像来测试宗谱网站使用的FaceVACS系统的匹配命中率。把每个名人的探测图像合并起来变成一个新的探测图像把探测数据库的整体命中率从54%提高到100%。作者因此得出结论,把图像平均的过程可以显著提高自动脸部识别并且推断把平均脸应用到身份证明文件里会大大减少面部识别时发生的错误。仅仅因为图像平均合并了一些可辨认的图片,詹金斯和伯顿就认为100%精确度是可以达到的。为了减轻这种担忧,作者只是用了在研究1里不能被辨别的图片进行试验,使命中率从0%提高到80%。因此他们把提高的精确度归因为平均过程。然而,这个提高在一定程度上可以归因为在平均过程之前的手动面部注册,它准确的纠正了面部外形以至于使所有的脸部探测图像都是正面的,都在向一个标准靠拢。通过很大程度上减少图片的可变性,图像配准过程可以把以前不能辨别出来的照片改变成可以变得的照片。此外,标准的注册脸可能促进了自动脸的发现和检测算法的正常处理,这也可能提高了命中率。因此,注册技术辅助图像平均来提高命中率也是可能的。詹金斯和伯顿认为,图像平均提高了人脸的稳定性能。然而对此的解释是被夸张了的。平均图像被应用在身份证明文件里就能减少识别上的错误这个论断缺乏足够的证据,尤其是因为这不是一个通过已经做过的实验可以得到的等效的任务。特别的,这个实验使用在线数据库作为画廊,使用平均图像作为探针,并且在线识别系统仅仅只返回数据库里最接近的匹配照片。回的照片和平均照片相匹配,则记为命中。使用这种方法,即使100%的命中率能够保证,对于每一个身份检测,系统只是匹配了画廊里的一张图片。然而,在数据库里,每个人都有如果返许多(7到28)张照片。这个实验不能证明平均图像可以匹配一张照片的情况。对比而言,如果这个平均图像是从身份证明的,身份验证的任务比詹金斯和伯顿的实验的要求更苛刻。文件里合并出来的,那么身份变化系统则被要求能够稳定的匹配同一个人的任意一张照片。否则,照片上的任何一个错误都能被转变成识别时的错误。因此,即使是识别的算法是可以交换,身份认证的任务比詹金斯和伯顿的实验的要求更苛刻。对身份证明的证据是通过对个人的外表和身份证明文件的对比获得的,外表是从在不同的时间、地点捕捉到的单一的图像获得的。证据的可靠性在于单一的照片与身份证明文件匹配的稳定性。因此,为了评估平均图像在身份证明文件里的可行性,应该设计一个可以检测单独照片的命中率的实验,用来检测单一照片与相应平均照片的匹配百分比。此外,证据的可靠性也取决于在平均图像里冒名顶替的照片,这也是需要被考虑的。对于科学的方法论,可以参照美国政府支持的评估,例如面部识别供应商测试,这是标准的面部识别技术。我们承认,图像平均促进了面部识别技术。然而,自动面部识别是一个包含早期处理、知觉编码、提示融合机制的模式识别问题。尽管已经做了无数的努力,自动人脸识别仍然是一个有野心的目标。Response to comment on 100% accuracy in automatic face recognition(摘要)与邓等人的意见相反,当脱离平均过程的时候,图像注配准降低了面部识别的精确度。包括超出特定范围的照片、平均画廊照片、平均探测照片的平均照片映射集能够提高这个匹配。作者所建议的另一种协议是不合适的,因为它评估的是脸部匹配算法而不是依赖标准图像集的面部表示。我们认为形象的平均过程能显著提高面部识别。而邓等人认为图像配准仅仅可能改善面部识别的性能,然后我们就测试了他们的观点。由于我的遗产数据库在持续的扩张,我们一开始提交的照片和平均图像作为一个当前基线。其中,500张探测图片里的48张是和画廊里的一样的,而实验一中只有41张是一样的。这增加了画廊照片的一致性扩张。剩下的452张照片里,52%的照片被正确的匹配出来,相较于实验一的54%。和实验一一样,平均照片的匹配率仍然是100%。平均照片里的每5张就能匹配正确的人,证明了平均照片映射包括了超出特定范围的快照。为了解决邓等人的担忧,我们下一步提交了手工注册版本的代码原照片,按照邓等人的描述,这些照片被放到了一个标准的、直立的、封闭的同一背景下,测得注册图像的命中率是30%。显然,注册提供了两个世界里最糟糕的:它破坏了画廊和注册照片里的相应信息,但是它稳定了图像的可变性。当画廊图片也被注册的时候,探测图片注册可能会有较小的破坏性。在先前的研究中,我们做了一个基于图像匹配的主成分分析,我们完成了这个转换,通过平均处理,使得效果虽然不大但确实提高了。邓等人也关注这个问题:我们的平均图像表现在探测图像而非画廊图像。这只是有我们选择方法的问题造成的。为确保我们平均技术的严格性,我们放弃了去控制平均图像的几个关键方面。我们使用了其他的画廊图片及别的匹配算法。我们从网络上收集探测图像。这种方法意味着,即使我们不能增加画廊图片,我们可以提交照片作为探测照片。因为面部识别可以被减少来匹配许多照片,我们的主要精力不是放在匹配每一张照片上,并且我们认为A去匹配B和B去匹配A是等效的。在先前的研究当中,当应用在画廊照片的时候,平均图像也是有作用的。在身份证明文件里,平均照片是否能更好的服务于身份检查以及平均探针来自现场脸是一个有趣的经验问题。然而,值得指出的是,平均探针图像被发现适合应用在法医人脸识别。邓等人指出,平均探测图像需要获得命中率通过一张画廊图像。这同样适应于摄影探针,而这些表现相对比较弱。在实际当中,一个平均探测图像可以匹配目标的许多不同照片,正如我们新的数据显示的一样。这凸显了平均即使的主要好处。匹配许多照片是相当困难的,因为包含的信息不是诊断出来的身份。和一个平均照片匹配是有用的,因为它消除了一个人没有被诊断的信息。毫无疑问,在这种状况下困难依然存在,但在一定程度上这是因为只包含了一张照片。因此,我们的回应不能撤退关于匹配许多照片而不是去调查方法来删除匹配的照片。对平均图像的匹配是一个明显的探索路径,我们正在测试这种可能性。邓等人把脸部识别供应商测试作为一种方法的模板。这是不合适的,以下几点说明原因。首先,FRVT的比较性能的评价不同于标准图像匹配算法,我们的提议关注在脸部的表现以及独立的算法。第二,标准的数据库由有姿势的照片构成,严重不能表示脸部图像的可变性。第三,依赖于任何标准数据库在解决没有脸部识别的识别数据库问题上都有一定的风险。现实世界的人群在每一天都是不同的,渴望真实世界的系统不能忽视这个不便。最后,我们认可邓等人提出的早期处理和自动特征提取是有趣的问题,但是他们显然是与面部识别问题分离的。为了证明这一点,注意,在你脸上找到你不能察觉到的坐标并且不触发识别是很容易的。Strand B:prototype face representations :human studies在这个链接里,我们显示人类感知者版本不同的原型。我们旨在引进脸部平均的形状,尽管我们在开始这个项目的时候不知道我们能够做到多好。事实上,一旦软件引入已经被写好的形状,结果立即而清晰。如果平均自由脸演变回脸部的平均形状,就会形成一个非常好的表示。我们并不指望这个。图6显示了提取特定人脸形状和纹理的过程。图像结合起来形成了平均自由形状。我们预测,如果演变回特定的图像(像图的底层),这些图片将会形成整体平均非常好的图片。相较而言,以平均位置的每个网格点提取的姿势在很宽的范围的图像,将不会存在个性化的信息。这一点被证明是错误的,并且最好的表现是平均照片演变成平均形状的一致性,我们对此称之为平均身份。图7显示了一些例子,图8显示了平均脸,用这种方式准备的对于我们数据库里德50位名人。(图6:对于脸部形状和纹理的分解)(图7:四位名人的平均脸。上层是自由脸的平均形状。下层是演变后个性化特点的平均形状。)(图8:50位名人脸部结构包括他们形状的平均(每人20张图片)在剩余的部分里,我们将总结实验里不同类型图片的表现。研究5-8都有相同的形式。在验证的过程中,受试者看见一个名字,紧跟着看到一张脸。这个任务是表明(通过按钮)是否脸和名字是一致的。在这些试验里,我们操纵了脸的形式:它可能是一张照片、一个自由脸的形状、一个平均身份等,根据这个特定的实验。进一步的细节过程被报道在伯顿et al (2005)在研究5我们比较了名字变化的准确性和速度对于(i)自由形状平均脸(ii)自由脸演变成那个人的特定范例的形状(iii)平均脸演变成那个人的平均形状(身份平均),而精确度相应的分别为65%、84%、86%,反应时间显示了一个类似的模式(821ms、746ms、741ms)。这些数据清楚的表明形状的引进提高了自由脸的版本,尽管通过比较一个形状演变成一个自由的例子时身份平均的优势是很小的。在研究6中,考虑到一个因素的设计,我们操纵实例/平均尺寸独立的脸部纹理和形状。精确地数据显示,身份平均被识别的最好(16%的错误)而照片(脸部的例子、形状的例子)识别的第二好(21%的错误)而对于纹理和平均形状有类似的精确度(21%)平均纹理形状的实例有(23%)的错误。这是身份平均被识别比真实的图像好的第一个例子。我们在接下来的实验中重复了这个例子。在研究7中,我们复制了研究6中两个关键的条件并加入了一个更大的刺激集(为了满足伯顿的观点)。将平均脸和平均身份演变成一个平均例子,我们发现了身份平均的整体优势在精确度(89% vs 80%)和时间(700ms vs 720ms)方面。在研究8中,我们发现在身份平均方面相同的优势,甚至于在所有的图像被拉伸至两倍高的时候,结果与Hole提出的数据是一致的。进一步的测试身份的平均值,我们在研究9中使用了一个不同的程序。我们展示了受试者的打印图片,我们问他们脸的信息,或者通过名字或者通过个性信息。在没有时间压力的情况下,受试者表明平均身份比真实照片在识别方面更具有优势(81% vs 77%)。效果不大但是确实存在,因为对熟悉脸的识别是正常的并且是如此的好以至于很难发现刺激,这给予了一个更高水平的表现。这里,我们有一个例子,类似于一个超级刺激,并且影响不能归咎为图像的特点,因为在整个试验中刺激都旋转了(例如克林顿的照片经常作为一个平均或者一张照片)。我们目前的假设是,它反映了一个“平滑”的平均效应。例如,可能有一个不是和克林顿很相似的照片,而平均图像不可能有这个特点。这可能导致在观测类型方面一个小影响。按照提议,我们也探讨了使用平均在探讨时的研究,实验结果没有像上面的实验一样令人兴奋,所以在这里我们总结他们可能只是短暂的。在研究10中,受试者看到了一系列的脸,其中一半是照片一半是平均身份。一个意想不到的测试阶段之后,测试者看到新的照片上同样的名人混杂着不一样的脸。他们对这些脸做出了快速熟悉的决定。结果身份平均在时间上显示了一个微弱的优势(792ms vs 806ms)即便没有达到意义重大的效果(40个受试者,每个受试者在每个状况下测试24个项目)。在研究11中,我们复制了这个不同研究子集的刺激,但是在这些状况下没有发现可靠地不同。在研究12中,我们采用了一个短期的自吸方法。与报告相一致,我们发现了一个大而可靠的效果(60ms)但是这些脸部照片或者平均身份都没有被调整就显示出来了。在研究13中,我们复制了先前的实验,但是这次使用了一个短暂的SOA(50ms与250ms),一个操纵证明它在增加启动情况。我们发现可靠的启动,但是没有主要类型的调制。最后,在研究14和15中,我们复制了研究12和研究13,使用了一个不同照片环境的例子集合。,再一次的,没有观察到启动类型的效果。一方面,结果是鼓舞人心的,因为在这五个实验里面,比起真实照片来,身份平均总是产生相同的效果,有一个好的表现。然而,在使用启动的平均的优势里,我们不能证明出令人激动的结果。Strand C :face learning就想提出的一样,我们使用各种技术来研究脸部的学习(见链接A)。在一个方法中,我们会问,当包含错误的实例的时候,平均技术会多么强有力。图9显示了一个混合平均的例子,在任何一种状况下都是对20个人进行平均的。在左上方,所有的照片都是玛丽莲梦露,在每一个步骤中,玛丽莲梦露的图像在下降同时猫王的照片在增加。尽管两个人的照片高度不同,这个转变是平滑的,并且我们已经显示出不同的系统(在研究4中)使性能的下降是平滑的。在(研究16)人类的混合刺激(从连续图像的中点),并且鼓励受试者看出一个人来。在一个随后的测试阶段,我们观察到启动来自“可以看见”和“看不见”身份的图像,即使观察到的很小。在将来,我们将继续这个实验。(图9:每张脸都是20张图像的平均。左上方是玛丽莲梦露,右下方是猫王,中间的平均值是混合物。)进一步的调查已经引发了一个由大卫展开的调查。当编译数据库时,他发现很难记住是否已经聚集一个名人的特定形象,并且对于不熟悉的脸这似乎是不可能的。这与我们的假设是一致的:即作为图像处理陌生的面孔(保存表面特征),而熟悉的面孔要加工一下(不保存表面特征)。为了测试这种可能性,我们用相同的设计进行了一系列的实验。受试者会看到同一个人的7张脸,然后让们会看到第八张,并且会被问是否是他们看到的那个特定的形象。图10展示了研究17使用这个设计方法的结果。总之,只有陌生的脸才会显
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年2月山东领取济宁市份普通话水平测试等级证书模拟试卷完整参考答案详解
- 2025辽宁抚顺新抚钢有限责任公司招聘拟聘用人员考前自测高频考点模拟试题有完整答案详解
- 2025广西崇左市江州区住房和城乡建设局招聘编外工作人员2人模拟试卷及参考答案详解
- 2025年鹤壁黎阳中学招聘教师若干名考前自测高频考点模拟试题参考答案详解
- 2025年宣城市中心医院第一批次招聘22人模拟试卷及答案详解(考点梳理)
- 2025黑龙江哈尔滨工程大学发展计划处、学科专业建设办公室管理岗位招聘2人考前自测高频考点模拟试题含答案详解
- 2025年广西南宁市考试招聘中小学教师笔试有关事项模拟试卷完整参考答案详解
- 关于协会成立申请书范文
- 2025年4月15日广西梧州市龙投人力资源有限公司招聘2人模拟试卷及答案详解(夺冠系列)
- 2025河南郑州轨道工程职业学院招聘辅导员、教师共75名考前自测高频考点模拟试题完整参考答案详解
- 河南天一大联考2025-2026学年(上)高一上学期9月检测语文试卷
- 养好小金鱼教学课件
- 2025年度社区工作者真题题库及答案
- 病历信息安全培训课件
- 2025年9月 基孔肯雅热疫情防控工作的经验总结报告
- 2025年中国硅灰石超细粉市场调查研究报告
- 福建省雷电防护装置检测资质认定实施细则(修订)
- 2025年幼儿园班级管理考试题及答案
- 鞘内药物输注技术
- 2025年物联网领域射频识别(RFID)技术创新与产业融合发展报告
- 23G409先张法预应力混凝土管桩
评论
0/150
提交评论