版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、支持向量机2014-2-21本讲主要内容u一. 支持向量机u二. 最大间隔分类器u三. 核函数u四.软间隔优化u五.支持向量机总结一. SVM warming up u 1.1 SVM概念简介u 1.2 超平面 u 1.3 logistic回归u 1.4 形式化表示u 1.5 函数间隔与几何间隔 1.1 SVM概念简介n支持向量机(SVM)是 90 年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。n通俗来讲,它是一种二类分类模型,其基本模型定义为特征空
2、间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。1.2 超平面 n 超平面H是从n维空间到n-1维空间的一个映射子空间。n设d是n维欧式空间R中的一个非零向量, a是实数,则R中满足条件dX=a的点X所组成的集合称为R中的一张超平面。1.3 logistic回归nLogistic 回归目的是从特征学习出一个 0/1 分类模型,而这个模型是将特性的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷。因此,使用logistic 函数(或称作 sigmoid 函数)将自变量映射到(0,1)上,映射后的值被认为是属于 y=1 的概率。 1.
3、3 logistic回归n形式化表示:n 假设函数为: x 是 n 维特征向量,函数 g 就是 logistic 函数。 其中 图像如图所示: 可以看到,将无穷映 射到了(0,1)xTTexgxh11)()(zezg11)(1.4 形式化表示n结果标签是y=-1,y=1,替换logistic回归中的y=0和y=1。n同时将替换成w和b。以前的 ,其中认为 。现在我们替换 为b,后面 替换为 ( 即 )。n n我们只需考虑 的正负问题,而不用关心g(z),因此我们这里将g(z)做一个简化,将其简单映射到y=-1和y=1上。映射关系如下: 1.5 函数间隔与几何间隔n定义函数间隔为: x是特征,y
4、是结果标签。i表示第i个样本。(这是单个样本) 全局函数间隔: 在训练样本上分类正例和负例确信度最小那个函数间隔1.5 函数间隔与几何间隔n几何间隔:n全局几何间隔: 二. 最大间隔分类器u 2.1 二次规划原问题建立u 2.2 拉格朗日对偶 2.2.1 等式约束 2.2.1 不等式约束u 2.3 最大间隔分类器2.1 二次规划原问题建立n形式1:n 形式2:n形式3:2.2拉格朗日对偶之等式约束n问题:n目标函数是f(w),通常解法是引入拉格朗日算子,这里使用来表示算子,得到拉格朗日公式为 :nL是等式约束的个数。然后分别对w和求偏导,使得偏导数等于0,然后解出w和。2.2拉格朗日对偶之不等
5、式约束n问题:n利用拉格朗日公式变换:n 令n知2.2拉格朗日对偶之不等式约束n原来要求的min f(w)可以转换成 求了。 n利用对偶求解:n D的意思是对偶, 将问题转化为先求拉格朗日关于w的最小值,将和看作是固定值。之后在 求最大值的话: 2.2拉格朗日对偶之不等式约束n下面解释在什么条件下两者会等价。假设f和g都是凸函数,h是仿射的。并且存在w使得对于所有的i, 。在这种假设下,一定存在 使得是 原问题的解, 是对偶问题的解。还有另外, 满足库恩-塔克条件(Karush-Kuhn-Tucker, KKT condition),该条件如下:n 2.3 最大间隔分类器n重新回到SVM的优化
6、问题:n我们将约束条件改写为:2.3 最大间隔分类器n 从KKT条件得知只有函数间隔是1(离超平面最近的点)的线性约束式前面的系数 ,也就是说这些约束式 ,对于其他的不在线上的点( ),极值不会在他们所在的范围内取得,因此前面的系数 .注意每一个约束式实际就是一个训练样本。2.3 最大间隔分类器n实线是最大间隔超平面,假设号的是正例,圆圈的是负例。在虚线上的点就是函数间隔是1的点,那么他们前面的系数 ,其他点都是 。这三个点称作支持向量。构造拉格朗日函数如下:2.3 最大间隔分类器n下面我们按照对偶问题的求解步骤来一步步进行,n首先求解 的最小值,对于固定的 , 的最小值只与w和b有关。对w和
7、b分别求偏导数。2.3 最大间隔分类器n得到:n代入后,结果如下:n由于最后一项是0,因此简化为2.3 最大间隔分类器n此时的拉格朗日函数只包含了变量。然而我们求出了才能得到w和b。n接着是极大化的过程2.3 最大间隔分类器n 前面提到过对偶问题和原问题满足的几个条件,首先由于目标函数和线性约束都是凸函数,而且这里不存在等式约束h。存在w使得对于所有的i, 因此,一定存在 使得 是原问题的解,是对偶问题的解。在这里,求 就是 求了。n 如果求出了 , 根据即可求出w(也是 ,原问题的解)。然后n n 即可求出b。即离超平面最近的正的函数间隔要等于离超平面最近的负的函数间隔。三. 核函数 u 3
8、.1 核函数简介u 3.2 核函数有效性判定3.1 核函数简介 建立一个R2R3的非线性映射n计算R3中2个矢量的内积:n定义核函数: ,则:22121122:,2,ttx xxx x x 2222211221122,2,2,tttxx x xyy yyxyx y2,tKx yx y ,tKxyx y输入空间输入空间特征空间特征空间3.1 核函数简介n上个例子说明:特征空间中两个矢量之间的内积可以通过定义输入空间中的核函数直接计算得到。n这就启示我们可以不必定义非线性映射而直接在输入空间中定义核函数K来完成非线性映射。n这样做的条件是:1.定义的核函数K能够对应于特征空间中的内积;2.识别方法
9、中不需要计算特征空间中的矢量本身,而只须计算特征空间中两个矢量的内积。3.1 核函数简介nSVM的求解,最后归结为如下目标函数的优化:n可以引入非线性映射,则目标函数变为:n而权矢量为:n判别函数: 1,112nntiijijijii jLz zy y 1,11,111,22nnnntiijijijiijijijii jii jLz zz z Kyyy y1niiiizwy 00011,nnttiiiiiiiigwzwzKwxwxyxy x3.2 核函数有效性判定(Mercer定理)n作为核函数应满足如下条件:作为核函数应满足如下条件: 是是 下的对称函数,对任下的对称函数,对任意意 ,且,且
10、有:有:成立,则成立,则 可以作为核函数。可以作为核函数。n或者或者 如果函数如果函数K K是上的映射(也就是从两个是上的映射(也就是从两个n n维向量映维向量映射到实数域)。那么如果射到实数域)。那么如果K K是一个有效核函数(也称为是一个有效核函数(也称为MercerMercer核函数),那么当且仅当对于训练样例,其相核函数),那么当且仅当对于训练样例,其相应的核函数矩阵是对称半正定的。应的核函数矩阵是对称半正定的。,K x y2L 0gx 2gd xx ,0Kggd d x yxyx y,K x y四.软间隔优化n 4.1 规则化和不可分情况处理n 4.2 坐标上升法n 4.3 SMO优
11、化算法 4.1 规则化和不可分情况处理问题:拉格朗日变换:4.1 规则化和不可分情况处理n看看KKT条件的变化:4.2 坐标上升法n问题:4.3 SMO优化算法五.支持向量机总结 SVM重点是拉格朗日对偶的重要作用是将w的计算提前并消除w,使得优化函数变为拉格朗日乘子的单一参数优化问题。 对比这么复杂的推导过程,SVM的思想确实那么简单。它不再像logistic回归一样企图去拟合样本点(中间加了一层sigmoid函数变换),而是就在样本中去找分隔线,为了评判哪条分界线更好,引入了几何间隔最大化的目标。 五.支持向量机总结 之后所有的推导都是去解决目标函数的最优化上了。在解决最优化的过程中,发现了w可以由特征向量内积来表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实习实践报告
- Unit 11 Sad movies make me cry综合素质评价卷(含答案)
- 急性房颤急诊管理指南考核试题
- 2025年焦化能源考试题库及答案
- 中国电力科学研究院 陈川:柔性传感器在电网中的应用及发展趋势
- 2025年药店病例分析试题及答案
- 几何底盘测试题目及答案
- 2025年湖北高二英语题库及答案
- 自备应急电源预案(3篇)
- 2025年文学常识教师试题及答案
- 咯血病人护理课件
- 叙事医学课件
- 2024年陕西省公务员考试行测真题参考答案详解
- 2025至2030中国大豆蛋白行业产业运行态势及投资规划深度研究报告
- DG-TJ08-16-2025 扣件式钢管模板垂直支撑系统安全技术标准
- 2025至2030中国碳纳米管行业市场发展现状及调研报告
- 2023-2024年山东省济南市历下区六年级上册期中数学试卷及答案(人教版)
- 抗凝剂皮下注射护理规范专家共识解读课件
- 2025年电气自动化考试试题及答案
- 电解质紊乱课件
- 《富宁县国土空间总体规划(2021-2035)》
评论
0/150
提交评论