模式识别读书报告_第1页
模式识别读书报告_第2页
模式识别读书报告_第3页
模式识别读书报告_第4页
模式识别读书报告_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、模式识别研读报告学院:*姓名:*学号:*论文出处:Hongjun Jia and Aleix M. Martinez . Support Vector Machines in Face Recognition with Occlusions. Proc. of CVPR, 2009. 基于SVM的闭塞人脸识别的研读报告1、问题提出:作者提出支撑向量机(SVM)在人脸识别中是非常有用技术,但是作为定义样本的特征向量丢失时,SVM不起作用。这篇文章提到,当人脸部分发生遮挡时,特征向量的数据就会丢失。支撑向量机的目标就是找到两类之间的最大空白区域。由于不知道采取哪个子空间的测试矢量,这与最小化类超平

2、面和子空间之间的重叠区域是对等的。然而得到的解与获得的使空白区域最大化的可视数据存在矛盾,为了解决这个问题,作者定义一个标准,最大化地减少重叠概率,并且有效解决优化问题。作者还用丰富的实验,证该方法在温和条件下,能够保证全局最小误差。2、传统人脸识别技术的缺陷:作者提出,基于外观为基础的人脸识别技术在计算机算法里已经相当成功。支撑向量机(SVM)已经作为一种将图像的像素值重新形成向量,然后应用于分类中。外观为基础的算法的缺点是,当脸部外观被遮挡时,它不能直接使用。因为在这种情况下,被遮挡的尺寸是未知的。作者提出了目前为止解决面部遮挡问题的方法并对他人的方法进行评价。即用没有遮挡的脸部来学习脸部

3、的外观表示,当需要识别有遮挡的脸部时,仅识别可见的共同部分。这种方法可以通过子空间技术和稀疏表达来实现。但是这种方法不能从闭塞的图像中处理模型重建。为了说明情况,作者展示了3个场景中人脸识别应允的真实图像。组1:研究最多的,即非闭塞面孔做训练,闭塞图像做测试。组2:闭塞和非闭塞面孔作为训练。组3:仅仅是闭塞面孔作为训练。作者的方法基于组3,即用闭塞面孔作为训练。3、作者算法的提出:这篇文章,作者推导出能适用以上3种情况的SVM判别准则。作者的方法与经典SVM不同之处在于经典的标准SVM在以上3中情况都不能被适用。因为经典SVM假设所有特征可见。作者推导准则对缺失成分的样本和测试特征向量适用,为

4、了区分经典SVM,作者命名为偏支撑向量机(PSVM)。 与经典SVM类似,PSVM的目标也是尽可能区分超平面中两类样本。与传统SVM不同的是PSVM会受到不完整数据的限制。在作者提出的PSVM中,作者将全部缺失训练样本的所有可能值作为特征空间中的一个映射空间,以此来设计使得仿射空间和分离平面重叠概率最小的判别准则。为了实现模型,作者将仿射空间和超平面之间的角度公式化。在温和条件下,目标函数具有全局最优解,前提是判别准则所定义的凸区域靠近原点。3.1作者算法的详细过程:为了突出自己的算法,作者先简单引述经典SVM算法,并说明经典SVM的不足,经典SVM的约束条件为: 公式1作者指出,当一些特征丢

5、失时,有些距离无法计算,一种解决的办法就是在使用SVM之前填补这些空白数据。然而由于这些数据无知,如果填补错误将导致更坏的结果。作者的思想就是将这些缺失的数据的所有可能情况作为一个单元,并能在映射空间中正确分类。这意味着超平面与所有的不完整数据组成的映射空间平行。为了说明以上观点,作者用图2进行说明,加入的P3向量有一个数值丢失,丢失的数值可能是p31,p32,p33,对于经典SVM,每个值都会给一个超平面。然而我们发现,任何一个给出的超平面都无法正确分类。为解决以上问题,作者侧重于在概率条件下对正确部分数据进行分类。超平面和映射空间之间的夹角:特征向量所缺失的元素定义在映射空间中,在映射空间

6、中能给正确分类的超平面概率依赖于:1、映射空间与超平面的关系;2、缺失元素分类结果。作者用图3说明,如果超平面和映射空间不平行,映射空间将被分为S1,S2,缺失的可能值在S1中会被正确归类,而在S2中则错误归类。因此可以计算在映射空间S中正确分类的超平面概率为: 公式2q S. p(q) 概率密度函数;基于上述模型,目标就是最小化类中样本最有可能值间的重叠概率,阻止超平面割裂丢失项的值。为了计算概率,作者假设样本数据服从高斯分布,P(q)N(X,)。最大化PCC等同于最大化D(X,Q0)。注意到,固定的样本空间,超平面和映射子空间S的夹角(S,L)与D(X,Q0)成反比关系,因此(S,L)与X

7、向量丢失元素的可能值相关。目标函数:为了解决数据不完整问题,作者先为每一个样本向量xi定义闭塞遮掩,如果xi中的特征被遮掩,则mi为0,否则为1。映射空间Si由所有不完整的样本xi组成,超平面L区分两类由约束: 公式3映射空间Si和超平面L之间的夹角(Si,L)由下式给出: 公式4将所有的夹角取权重和:,Ki为权重值,当xi不完整时取正,否则为0。为了获取最大可能的PCC,应该最大化。类似经典SVM 算法,作者给出解模型: 公式5其中K0是调整参数。在超平面的性能与不完整数据的正确分类间起到折中作用。以下的问题就是解公式5的问题了,由于公式5非线性,非二次,因此文章中对公式5进行变换: 公式6

8、得到以上解模型后,就是最优化过程。作者分别讨论了线性可分情况可非线性可分情况。1、 线性可分情况: 公式7通过公式7,可以解决线性情况问题。b值对凸状区域无影响,因此分析中作者专注于W。虽然W对目标函数是非凸的,但是利用W仍可以进一步优化,假设W1, W2,有W1=rW2, r1则:上公式表明,目标函数是经过原点且单调递增的。为了最大化目标函数的边界下限,作者加入一个条件约束:这样就演变成问题:这样得到的目标函数和约束就成了凸规划问题,保证了有全局最优解,即:max 是方程9的解。非线性可分问题求解:在分类问题中,大多数问题是非线性问题。在这种情况下,将松弛变量和调整参数C0加入到公式6中,由

9、于不完整的数据目前没被正确分类,因此要根据松弛变量的值来调整角度权值,具体如下: 公式11由于sgn函数并不连续,作者通过一个价值函数进行优化: 公式12这样就得到了作者的PSVM算法,模型描述如下:利用经典SVM的解作为初始值,再进行迭代运算,就可以得到模型中有关W和的解。若固定,可以像线性可分情况一样得到最大化的解。若W固定,就是一个简单的凸规划问题。至此作者已经得到线性与非线性情况的模型解,可以用于对测试特征向量分类。对于不完整的图像,还需要去知道值的概率,为此作者要对数据进行重建。对于一幅测试图像,用去描述图像所缺失的部分,Mj表示M矩阵的第j行,Mj有n个值,因此重建的特征模板L就有

10、2n种情况。假设Li可以对特征进行重建,那么Li可以分成2部分l和l,l为测试图像的观察特征, l为掩埋特征。这样权值可以通过公式15求得。将求得的权值去估计模板中丢失的部分。4、实验部分:为了展示PSVM算法,作者选取了既有人工合成遮掩和实际遮掩的人脸图像作为测试,测试图像来源AR人脸数据库和FRGC数据库。在实验中,控制参数K均为1。遮挡部分,从独立的人脸图像中通过肤色检测重建。对于人工合成遮掩,直接在脸部打上一块黑方块,并且设置黑方块的不同尺寸,测试在各种表情下的分类准确度,作者给出的结果如图5显示。作者的实验还将PSVM算法与他人的算法比较,结果显示PSVM算法比他人的算法无论是在无遮

11、掩还是有遮掩情况下都具有优势。当有这遮掩时,优势更大。文章作者最后总结了自己的算法,认为改进的SVM算法对有遮掩的训练样本和测试样本都是有效的,并且与参考文献中其他人的算法相比,PSVM的识别准确率都要高。 5研读总结:这篇文章,作者的算法主要是针对丢失了部分数据的特征向量的分类问题。文章开头,作者提出传统SVM算法在缺失数据的特征向量中不起作用。为了解决这个不足,作者提出将全部缺失训练样本的所有可能值作为特征空间中的一个映射空间,以此来设计使得仿射空间和分离平面重叠概率最小的判别函数。然后作者给出一个概率模型,并结合SVM算法对模型进行优化求解,最后得到了线性和非线性情况下的模型解空间。最后,作者将自己的算法用于有遮挡的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论