版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SVM算法学习 uSVM原理 uSMO分析 uSMO实现 SVM基本原理基本原理 原理:SVM使用一种非线性映射,把原训练 数据映射到较高的维。在新的维上, 搜索最佳分离超平面,两个类的数 据总可以被超平面分开 问题提出:问题提出: 线性可分的分类问题:(令黑色的点 = -1, 白色的点 = +1) 所以当有一个新的点x需要预测属于哪个分类的时候,我们用 sgn(f(x),就可以预测了,sgn表示符号函数,当f(x) 0的时候, sgn(f(x) = +1, 当f(x) 0的时候sgn(f(x) = 1。 bxwxf r )( +1 -1 如何选取最优的划分直线f(x)呢? 其中:W=w1,w
2、2,wn是权重向量 H : WX+b=0 H1:WX+b=1 H2:WX+b=-1 几何间隔: =y(wx+b)=|g(x)| 目标函数 等价于 约束条件 最大边缘超平面最大边缘超平面Maximum Marginal Hyperplane 数据集合: 目标函数: 约束条件: x,y已知 求解:凸二次规划求解:凸二次规划 ln ll yRyxyxT)(),(),.,( 11 liYyRx i n i ,.,1,1, 1, 2 2 1 min w 1, 1 1, 1 . . ii ii ybxw ybxw t s 求解:求解: 用数学语言描述向量w: w=1y1x1+2y2x2+nynxn i是一
3、个一个的数(在严格的证明过程中, 这些被称为拉格朗日乘子),而xi是样本 点,因而是向量,n就是总样本点的个数。 yi就是第i个样本的标签,它等于1或者-1。 求解:求解: 建立拉格朗日函数: 求偏导数: 问题提出:问题提出: 线性不可分问题: 核函数和松弛变量 核函数核函数 横轴上端点a和b之间红色部分里的所有点 定为正类,两边的黑色部分里的点定为负 类. 核函数核函数 g(x)转化为f(y)= g(x)=f(y)=ay 在任意维度的空间中, 这种形式的函数都是一 个线性函数(只不过其 中的a和y都是多维向量 罢了),因为自变量y 的次数不大于1。 核函数核函数 右侧w,x都是1000维,w
4、和 x分别是由w,x变换得到的 2000维向量 g(x)=K(w,x)+b K(w,x)被称作核函数核函数 基本作用:接受两个低维空 间里的向量,能够计算出经 过某个变换后在高维空间里 的向量内积值 松弛变量松弛变量 软间隔软间隔C-SVM: C是一个由用户指定的系数,表示对分错的点加入 多少的惩罚,当C很大的时候,分错的点就会更少, 但是过拟合的情况可能会比较严重,当C很小的时 候,分错的点可能会很多,不过可能由此得到的模 型也会不太正确 SVM算法缺点:算法缺点: (1)非线性映射是SVM方法的理论基础,SVM 利用内积核函数代替向高维空间的非线性 映射; (2)对特征空间划分的最优超平面
5、是SVM的 目标,最大化分类边际的思想是SVM方法的 核心; (3)支持向量是SVM的训练结果,在SVM分类 决策中起决定性作用。因此,模型需要存 储空间小,算法鲁棒性( Robust )强。 SVM算法优点:算法优点: (1) SVM算法对大规模训练样本难以实施 由于SVM是借助二次规划来求解支持向量,而求解二次 规划将涉及m阶矩阵的计算(m为样本的个数),当m数 目很大时该矩阵的存储和计算将耗费大量的机器内存 和运算时间。 (2) 用SVM解决多分类问题存在困难 经典的支持向量机算法只给出了二类分类的算法,而 在数据挖掘的实际应用中,一般要解决多类的分类问 题。 SVM的简化版的简化版SM
6、O算法算法 SMO算法的目的无非是找出一个函数f(x), 这个函数能让我们把输入的数据x进行分类 将一个凸二次规划问题转换成下列形式 (KKT条件) SVM的简化版的简化版SMO算法算法 这里的ai是拉格朗日乘子(问题通过拉格朗日乘 法数来求解) 对于(a)的情况,表明ai是正常分类,在 边界内部(我们知道正确分类的点yi*f(xi)=0) 对于(b)的情况,表明了ai是支持向量, 在边界上 对于(c)的情况,表明了ai是在两条边界 之间 而最优解需要满足KKT条件,即满足(a)(b) (c)条件都满足 SVM的简化版的简化版SMO算法算法 以下几种情况出现将会出现不满足: yiui=1但是ai=1但是ai0则是不满足的而原本ai=0 yiui=1但是ai=0或者ai=C则表明不满足的, 而原本应该是0aiC 所以要找出不满足KKT的这些ai,并更新这 些ai,但这些ai又受到另外一个约束,即 SVM的简化版的简化版SMO算法算法 通过另一个方法,即同时更新ai和aj,满足 以下等式 就能保证和为0的约束。 SVM的简化版的简化版SMO算法算法 利用上面的式子消去ai 得到一个关于单变量aj的一个凸二次规划问 题,不考虑其约束0=aj=C,可以得其解为: 其中: SVM的简化版的简化版SMO算法算法 aj表示旧值,然后考虑约束
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美容招商加盟合同范本
- 网络交易合同范本模板
- 2025年高中二年级数学下册期中核心考点试卷(含答案)
- 租房产土地合同协议书
- 演艺经纪合同合作协议
- 连锁物流转让合同范本
- 邀请乐队演出合同范本
- 炉渣炉灰采购合同范本
- 物业干股分红合同范本
- 购买肉牛购销合同范本
- 河西学院工作人员招聘考试真题2022
- 江苏长青农化股份有限公司500ta烯草酮、2400ta氟磺胺草醚等项目环境影响报告书
- 东北大学高等数学上期末考试试卷
- 外科学-颈部疾病课件
- 防火重点部位每日巡查表
- 新昌人民医院固定资产及设备全资源管理系统项目采购要素
- SB/T 11095-2014中药材仓库技术规范
- GB/T 3836.3-2021爆炸性环境第3部分:由增安型“e”保护的设备
- GB/T 1220-1992不锈钢棒
- 《中国近现代史纲要》第八章-中华人民共和国的成立与中国社会主义建设道路的探索
- 高中英语长难句语法解析与翻译
评论
0/150
提交评论