第四章支持向量机与图像分类(1)_第1页
第四章支持向量机与图像分类(1)_第2页
第四章支持向量机与图像分类(1)_第3页
第四章支持向量机与图像分类(1)_第4页
第四章支持向量机与图像分类(1)_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、支持向量机与图像分类蔡超授课内容1.简介简介2.logistic回归回归3.函数间隔(函数间隔(functional margin)和几何间隔()和几何间隔(geometric margin)4.最优间隔分类器(最优间隔分类器(optimal margin classifier)5.拉格朗日对偶拉格朗日对偶(Lagrange duality)6.最最优间隔分类器(优间隔分类器(optimal margin classifier)7.核函数核函数(Kernels)1.核函数核函数有效性判定有效性判定8.规则化规则化和不可分情况处理(和不可分情况处理(Regularization and the

2、non-separable case)9.坐标坐标上升法(上升法(Coordinate ascent)10. SMO优化算法(优化算法(Sequential minimal optimization)11. SMO中拉格朗日乘子的启发式选择方法中拉格朗日乘子的启发式选择方法4:57:041 引言引言一一. SVM (Support Vector Machine)的历的历史史 神经网络分类器,Bayes分类器等是基于大样本大样本学习的分类器。 Vapnik 等从19601960年开始关于统计学习理论统计学习理论的研究。统计学习理论统计学习理论是关于小样本小样本的机器学习理论。 19921992年

3、支持向量机支持向量机首次被引入。19951995年Vapnik发展了支持向量机支持向量机理论。支持向量机支持向量机是基于统计学统计学习理论习理论的一种实用的机器学习机器学习方法。4:57:04二二. SVM 的发展的发展 SVM理论的发展理论的发展: 最小二乘支持向量机(LS SVM) 多分类支持向量机(M-SVM) 支持向量回归(SVR) 支持向量聚类(SVC) SVM与计算智能的融合与计算智能的融合: 神经网络+支持向量机 模糊逻辑+支持向量机 遗传算法+支持向量机 小波分析+支持向量机 主分量分析+支持向量机 粗糙集理论+支持向量机4:57:05三三. SVM的应用的应用 数据与文本分类

4、 系统建模及预测 模式识别(图像及语音识别,生物特征识别) 异常检测(入侵检测,故障诊断) 时间序列预测4:57:052 logistic回归回归 Logistic回归目的是从特征学习出一个0/1分类模型,而这个模型是将特性的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷。因此,使用logistic函数(或称作sigmoid函数)将自变量映射到(0,1)上,映射后的值被认为是属于y=1的概率。假设函数其中x是n维特征向量,函数g就是logistic函数。Sigmoid 函数在有个很漂亮的“S”形,可以看到,将无穷映射到了(0,1)。 4:57:054:57:054:57:06中间这条

5、线是 logistic回顾强调所有点尽可能地远离中间线。学习出的结果也就中间这条线。考虑3个点A、B和C。从图中我们可以确定A是类别的,然而C我们是不太确定的,B还算能够确定。这样我们可以得出结论,我们更应该关心靠近中间分割线的点,让他们尽可能地远离中间线,而不是在所有点上达到最优。因为那样的话,要使得一部分点靠近中间线来换取另外一部分点更加远离中间线。这就是支持向量机的思路和logistic回归的不同点,一个考虑局部(不关心已经确定远离的点),一个考虑全局(已经远离的点可能通过调整中间线使其能够更加远离)。4:57:06Notation4:57:064:57:073 函数函数间隔(间隔(fu

6、nctional margin) 几何几何间隔(间隔(geometric margin)4:57:074:57:07几何间隔4:57:07进一步得到通常,对于训练集 我们定义几何间隔(w,b)为:4:57:08 回想前面我们提到我们的目标是寻找一个超平面,使得离超平面比较近的点能有更大的间距。也就是我们不考虑所有的点都必须远离超平面,我们关心求得的超平面能够让所有点中离它最近的点具有最大间距。形式化表示为:4最最优间隔分类器(优间隔分类器(optimal margin classifier)4:57:084:57:08然而这个时候目标函数仍然不是凸函数,没法直接代入优化软件里计算。4:57:0

7、9这下好了,只有线性约束了,而且是个典型的二次规划问题(目标函数是自变量的二次函数)。代入优化软件可解。4:57:09 先抛开上面的二次规划问题,先来看看存在等式约束的极值问题求法,比如下面的最优化问题: 引入拉格朗日算子,得到拉格朗日公式 这里的称为拉格朗日乘子。5拉格朗日对偶(拉格朗日对偶(Lagrange duality)参考最优化与KKT条件4:57:09 然后分别对w和 求偏导,使得偏导数等于0,然后解出w和 。 不等式约束的极值问题 定义一般化的拉格朗日公式4:57:09 这里的 i和 i都是拉格朗日乘子。如果按这个公式求解,会出现问题,因为我们求解的是最小值,而这里的 gi(w)

8、 0或者hi(w) 0 ,那么我们总是可以调整 i和 i来使得 P(w)有最大值为正无穷。而只有g和h满足约束时。4:57:10 因此我们可以写作这样我们原来要求的min f(w)可以转换成求如果直接求解,首先面对的是两个参数和 ,然后再在w上求最小值。这个过程不容易做,那么怎么办呢?我们先考虑另外一个问题D的意思是对偶( dual )。 该式将问题转化为先求拉格朗日关于w的最小值,将 和 看作是固定值。4:57:10于是我们的对偶优化问题为:这个问题是原问题的对偶问题,相对于原问题只是更换了min和max的顺序,而一般更换顺序的结果是Max Min(X) = MinMax(X)。用 d*来表

9、示对偶问题如下:然而在一些限定条件下两者相等。4:57:10 成立的条件假设f和g都是凸函数,h是仿射的( affine ):并且存在w使得gi(w) 0 。在这种假设下,一定存在 使得 是原问题的解, 是对偶问题的解。还有 并且 满足库恩-塔克条件(Karush-Kuhn-Tucker, KKT condition): (*)4:57:10 所以如果 满足了库恩-塔克条件,那么他们就是原问题和对偶问题的解。公式(*)称作是KKT对偶互补条件(KKT dual complementarity)。这个条件隐含了如果 ,那么 =0 。也就是说, =0 时,w处于可行域的边界上,这时才是起作用的约束

10、。而其他位于可行域内部( 的)点都是不起作用的约束 。 (1)4:57:106最最优间隔分类器(优间隔分类器(optimal margin classifier) 重新回到SVM的优化问题:我们将约束条件改写为:4:57:10从KKT条件得知只有函数间隔是1(离超平面最近的点)的线性约束式前面的系数 ,也就是说这些约束式 =0 ,对于其他的不在线上的点( 0 ),极值不会在他们所在的范围内取得,因此前面的系数 =0。注意每一个约束式实际就是一个训练样本。实线是最大间隔超平面,假设号的是正例,圆圈的是负例。在虚线上的点就是函数间隔是1的点,那么他们前面的系数其他点都是这三个点称作支持向量。4:5

11、7:11构造拉格朗日函数如下:注意到这里只有 i,没有i 是因为原问题中没有等式约束,只有不等式约束。下面我们按照对偶问题的求解步骤来一步步进行,4:57:11首先求解 的最小值,对于固定的i , 的最小值只与w和b有关。对w和b分别求偏导数。将上式带回到拉格朗日函数,此时得到的是该函数的最小值(目标函数是凸函数)代入后,化简过程如下:于是(2)(3)4:57:114:57:11由于公式(3)最后一项是0我们将向量内积表示为: 此时的拉格朗日函数只包含了变量 。我们求出了i 才能得到w和b。接着是极大化的过程4:57:11前面提到过对偶问题和原问题满足的几个条件,首先由于目标函数和线性约束都是凸函数,而且这里不存在等式约束h。存在w使得对于所有的i, 。因此,一定存在 使得 是原问题的解, 是对偶问题的解。在这里,求 就是求 了。即可求出b。即离超平面最近的正的函数间隔要等于离超平面最近的负的函数间隔。关于上面的对偶问题如何求解,将留给下一篇中的SMO算法来阐明4:57:11如果求出了 ,根据 即可求出w(也是 ,原问题的解)。然后考虑另外一个问题,由于前面求解中得到我们通篇考虑问题的出发点是 ,根据求解得到的 ,代入前式得到也就是说,以前新

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论