线性分类器

上传人：自*** IP属地：江西上传时间：2020-03-22 格式：PPT 页数：30 大小：588KB 积分：12 举报 版权申诉

已阅读5页，还剩25页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

支持向量机线性分类器 LinearClassifier 线性可分vs 非线性可分线性分类器训练中确定所有的wi和参数决策规则对于线性可分必然存在线性分类面 N维空间下的二类线性分类器 N维超平面一维二维三维阈值逻辑单元 ThresholdLogicUnit TLU w1 w2 wn a i 1nwixi 1ifa qy 0ifa q y 输入权重激励函数输出 q 激励函数 a y a y a y a y 阈值型线性分段线性 sigmoid 阈值也可以作为权重一并考虑 1ifa 0y 0ifa 0 w1 w2 wn wn 1 xn 1 1 a i 1n 1wixi y q wn 1 支持向量机 SupportVectorMachines 超平面的选择所谓的超平面的的便把这两种不同类别的数据点分隔开来线性可分的情况下分类面有无穷多个如上图的训练样本在线性可分的情况下存在多个超平面 Hyperplane 如 H1 H2 使得这两类被无误差的完全分开超平面可以定义为其中W 都是向量 W 是内积 b是标量超平面定义函数间隔Functionalmargin与几何间隔Geometricalmargin 一般而言一个点距离超平面的远近可以表示为分类预测的确信或准确程度在超平面w x b 0确定的情况下 w x b 能够相对的表示点x到距离超平面的远近而w x b的符号与类标记y的符号是否一致表示分类是否正确所以可以用量y w x b 的正负性来判定或表示分类的正确性和确信度函数间隔Functionalmargin 我们定义函数的间隔为接着我们我们定义超平面 w b 关于训练数据集T的函数间隔为超平面 w b 关于T中所有样本点 xi yi 的函数间隔最小值其中 x是特征 y是结果标签 i表示第i个样本然与此同时问题就出来了上述定义的函数间隔虽然可以表示分类预测的正确性和确信度但在选择分类超平面时只有函数间隔还远远不够因为如果成比例的改变w和b 如将他们改变为2w和2b 虽然此时超平面没有改变但函数间隔的值f x 却变成了原来的2倍几何间隔Geometricalmargin 几何间隔的基本定义其中 w 为w的二阶范数范数是一个类似于模的表示长度的概念从上述函数间隔和几何间隔的定义可以看出几何间隔就是函数间隔除以 w 而且函数间隔y wx b y f x 实际上就是 f x 只是人为定义的一个间隔度量而几何间隔 f x w 才是直观上的点到超平面的距离支持向量机 SupportVector OptimalSeparatingHyperplane 线性可分情况下不仅要区分开而且要使得间隔 Margin 最大 Margin H1 H2 小间隔vs 大间隔支持向量积的原理对一个数据点进行分类当超平面离数据点的间隔越大分类的确信度 confidence 也越大所以为了使得分类的确信度尽量高需要让所选择的超平面能够最大化这个间隔值这个间隔就是下图中的Gap的一半求解最优超平面就相当于在下列约束条件下求目标函数的最小值目标函数约束条件最优超平面可以通过求解上述问题的对偶问题来得到最终的解在对偶问题中将原来需要求解的一系列wi转换成求解另一组变量 i 求解原始问题为求解原始问题根据最优化理论我们转化为对偶问题来求解为原始问题中与每个约束条件对应的Lagrange乘子这是一个不等式约束条件下的二次函数寻优问题存在唯一解线性可分问题计算选择的一个正分量并据此计算事实上的每一个分量都与一个训练点相对应而分划超平面仅仅依赖于不为零的训练点而与对应于为零的那些训练点无关称不为零的这些训练点的输入为支持向量 SV 构造分划超平面决策函数根据最优解求解结果上述二次优化问题采用Lagrange方法求解可得相当于每个类别中选出若干支持向量组成投票委员会根据这些委员的加权投票内积结果得到最终的类别归属支持向量 SupportVector 非线性可分情况下的处理方法一广义最优分类面方法在线性不可分的情况下就是某些训练样本不能满足上面的约束条件因此可以在条件中增加一个松弛项这种做法也称引入SoftMargin 软边界于是约束条件变成此时的目标函数是求下式的最小值这个二次优化问题同样可以应用Lagrange方法求解正则项经验风险最优超平面求解变换到高维空间的支持向量机采用如下的内积函数核函数核函数本质上是高维空间下的内积函数但是输入为原始空间的向量多项式核径向基核核分类函数一个SVM的例子几何法求解最大间隔权重向量将和两类中距离最短的那条线段直线平行即与连接点 1 1 和 2 3 的直线平行这可以得到权重向量 1 2 最优的分类直线与上述线段垂直并相交与其中点中垂线因此它经过点 1 5 2 于是可以求得SVM的决策直线方程为 y x1 2x2 5 5 一个SVM的例子代数法求解在约束条件下寻找最小的我们知道解的形式为于是有 a 2a b 1 2a 6a b 1解得 a 2 5及b 11 5因此最优超平面的参数为 b 11 5 此时间隔为 SVM的多分类问题将SVM推广解决多分类问题有两类方法第一种方法是将多分类看作二分类的组合最终将多分类问题转化为二分类问题第二种方法是通过修改目标函数从根本上解决SVM处理多分类问题由于后者代价过高只适用于小规模问题目前多采用第一类方法对于多类问题给定样本集一对多的分类方法一对多的分类方法原理很简单多于k分类问题把1作为第一类其余的k 1类看成一类很自然的把k分类问题转化成二分类问题这种分类方法在训练过程中每个分类函数都需要所有的样本参与分类函数为上标表示第j个SVM分类器的决策函数和分别为第j个支持向量的参数和类别编号为偏移量对于待测样本若则输入的样本属于l类这种方法的训练时间与类别的数量成正比并且未考虑多个分类器对测试错误率的影响当训练样本较大时训练较为困难一对一SVM分类一对一的解决方法是在K类问题中进行两两组合构造个分类器这种方法的确定是对于类别K过大时产生的子分类器过多相对于一对多分类子分类器明显增加训练时间更长由于测试时要任意两类进行比较训练速度随着类别的增加成指数倍降低有向无环图SVM分类有向无环图SVM分类在训练阶段也是采用一对一SVM的任意两两组合的方式也需要个子分类器但在分类过程中 DAG将徐偶有子分类器构造成一个有向的无环图包括个节点和k个叶子节点其中每一个节点是一个子分类器当对未知样本训练时从根节点开始分类只需k

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

线性分类器

文档简介

温馨提示

最新文档

评论

线性分类器

文档简介

温馨提示

最新文档

评论

相关文档