支持向量机PPT课件_第1页
支持向量机PPT课件_第2页
支持向量机PPT课件_第3页
支持向量机PPT课件_第4页
支持向量机PPT课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.1、支持向量机。2,执行摘要,1引言2统计学习理论3线性支持向量机4非线性支持向量机5支持向量回归6支持向量聚类。3,1引言,1。SVM(支持向量机)历史神经网络分类器、贝叶斯分类器等。是基于大样本学习的分类器。瓦普尼克和其他人在1960年开始研究统计学习理论。统计学习理论是关于小样本的机器学习理论。支持向量机最早是在1992年引入的。Vapnik在1995年发展了支持向量机理论。支持向量机是一种基于统计学习理论的实用的机器学习方法。嘿。4,2。SVM的发展1。SVM理论发展:最小二乘支持向量机(LS-SVM)多分类支持向量机(M-SVM)支持向量回归(SVR)支持向量聚类(SVC) 2。融合SVM和计算智能:神经网络支持向量机模糊逻辑支持向量机遗传算法支持向量机小波分析支持向量机主成分分析支持向量机粗糙集理论支持向量机。5,3。SVM应用数据和文本分类系统建模和预测模式识别(图像和语音识别,生物识别)异常检测(入侵检测,故障诊断)时间序列预测,6,2统计学习理论,1.2分类问题给定L个观察值:I=1,2,LRN每个观察值都与一个标记:相连,I=1,2,L Tu1对于(2类)分类,建立函数:3360来表示该函数的参数,以便F可以正确地对尚未学习的样本进行分类、2类,1类,预期风险和实验风险预期风险最小化,其中x,y的联合概率p (x,y)是未知的实验风险最小化实验风险由在训练集上测量的平均误差来确定。如果训练样本的数量有限,最小化实验风险的方法不能保证高的泛化能力。三。维分类函数集合F的定义。当且仅当存在一组点xipi=1,使得这些点可以被所有2p个可能的分类方法分开,并且不存在满足该性质的集合xiqi=1(qp)时,函数集合F的虚函数维数为P。在n维空间中,超平面集的VC维等于n 1。可变因素维度描述的是“可能大致正确”意义上的学习能力。结构风险最小化风险理论引入了预期风险的边界,这取决于实验风险和f的能力。这些边界的最小化导致结构风险最小化原则:实验风险和风险资本可信度之和是最小的,其中H与风险资本维度相关。这是一种能力概念的度量。支持向量机是一种基于结构风险最小化原则构建的学习机器。12,3线性支持向量机一、两个分类问题:线性分割案例、1类、2类。许多决策边界可以将这些数据点分成两类,我们选择哪一类?坏的决策边界的例子,类1,类2,类1,类2,类1,类2,类14,好的决策边界:是间隔很宽的,决策边界应该尽可能远离两种类型的数据以最大化间隔m,类1,类2,类m,类15,类2,优化问题,集合x1,类标签与数据集.xn和类标号为yi1,-1的xi要求决策边界对所有的点进行正确分类,从而得到一个约束优化问题。16,将其转化为对偶问题:并采用拉格朗日函数 (w,b;)=1/2w 2-Ni=1I(yi(w,Xi)b1)那么对偶问题由max w ()=max (minw,b (w,b;)被给出。由minw,b (w,b;)得到/b=0Ni=1iji=0/w=0w=Ni=1iyixi,17,从而得到双重问题。这是一个二次规划(QP)问题ai。AI的全局最大值总是可以得到w的计算,18,解*=arg min1/2Ni=1Ni=1Ijyi yjNK=1kw *=Ni=1iyi Xi,B *=-1/2其中xr和xs满足Xr,xs0,yr=-1,ys=1 f(x)=sgn(b)。19,3。解的性质是,许多ai是零w只的几个数据的线性组合,xi与非零ai被称为支持向量(SV)决策边界是由SV只和tj(j=1,s)被设置为支撑v的指数,20,a6=1.4,4。几何解释、1级、2级、A1=0.8,A2=0,A3=0,A4=0,A5=0,A7=0,A8=0.6,A9=0,A10=0,21,4非线性支持向量机1。非线性划分问题。为了解决非线性划分问题,将xi变换到高维空间。在输入空间:xi所在的空间特征空间:变换之后,f(xi)的空间是如何变换的?使用适当的变换f,分类变得更容易。特征空间中的线性算子等价于输入空间中的非线性算子。23,变换中可能出现的问题很难得到好的分类并且计算成本高SVM可以同时解决这两个问题|w|2可以得到好的分类并且可以通过使用核函数技术、f(),特征空间、输入空间、24,变换定义核函数K(x,Y)如下考虑,下列变换的内积可以由K计算,而不需要由映射f()计算,25,2。核函数技巧核函数k和映射f之间的关系。)被称为内核函数技能。在应用中,我们指定k,从而间接确定f(),而不是选择f()。直觉上,K(x,y)代表数据x和y之间相似性的描述,并且来自我们的先验知识。为了使f()存在,K(x,y)需要满足美世条件。D阶多项式核宽度为S的径向基函数核与参数为kandq的径向基函数神经网络的Sigmoid检验非常接近,不满足Mercer条件。27,3。非线性SVM算法将所有内积转化为核函数训练算法:线性,非线性,28,检测算法:线性,非线性,对于新数据Z,如果f0,则将其分类为1类;如果为f0,则被分配到类别2。该示例具有五个一维数据点:x1=1,x2=2,x3=4,x4=5,x5=6,其中1,2,6是类别1,4,5是类别2 y1=1,y2=1,y3=-1,y4=-1,y5=1。二阶多项式核K(x,y)=(xy 1)2C取为100,AI (I=1,5) :首先计算30。用QP求解后,a1=0,a2=2.5,a3=0,a4=7.333,a5=4.833。注意,满足约束条件的支持向量是x2=2,x4=5,x5=6,并且描述函数是当x2、x4、x5在顶部时确定b。F(2)=1,f(5)=-1,f(6)=1,其中解B=9、31、描述了函数值,1、2、4、5、6、2类、1类、1类、32、5支持向量回归1。最小二乘法,求解: 33、2。线性支持向量回归(SVR),约束: 34,线性支持向量回归(SVR),35,拉格朗日优化,36,回归公式,回归公式:属性:冗余全局和唯一非线性扩展,37,3。非线性支持向量回归,输入空间,特征空间。38,回归公式,线性:非线性:一般:39,多项式类型:核函数类型,线性类型:径向基函数类型:指数径向基函数类型:40岁。几个解释表明,SVM基本上是一个双分类器和QP公式进行了修改,以允许多类分类。常用方法:以不同的方式智能地将数据集分成两部分。SVM被用来训练每一种分割方法。通过组合所有SVM分类器(大多数规则)的输出来获得多类别分类的结果。“一对一”策略将N类训练数据成对组合,构造C2N=N(N-1)/2支持向量机。在最终分类中,分类结果由“投票”决定。“一对一”策略这种方法为N个分类问题构造N个支持向量机,每个支持向量机负责区分这类数据和非这类数据。最终结果由支持向量机确定,支持向量机从接口输出最大距离wx b。,41岁,软件,SVM的实现可以在以下网站找到:/软件。htmlSVMLight是最早的SVM软件之一。还提供SVM的各种工具箱。LIBSVM可用于多类别分类。可用于SVM分类。rSVM可用于SVM回归。mySVM可用于SVM分类和回归。M-SVM可以用于SVM多类别分类。42,6支持向量聚类。一、开发简介瓦普尼克(1995):支持向量机分类器(1999):使用支持向量机来表示高维分布的一个特征。(2001) :使用支持向量机计算闭合数据点的一组等高线。(2001) :使用支持向量机系统地搜索聚类解决方案。2.该方法的基本思想是利用高斯核函数将数据点映射到高维特征空间,在特征空间中寻找封闭数据点的图像点的最小球面,将球面映射回数据空间,用相同的聚类减小高斯核函数的宽度,增加轮廓线的数量,处理软间隙值大的重叠聚类, 以将构成闭合数据点的轮廓线集合的点映射到高维特征空间45、3。 主要步骤1。球分析2。聚类分析3。通过非线性变换将具有n个点的数据集映射到高维特征空间,以找到具有受限中心a和半径r的最小闭合球。47.引入拉格朗日函数:引入松弛变量 j 0,得到: j 0和j 0为拉格朗日乘子,c为常数。cj是惩罚项。48岁。49和:50球。51是由KKT(卡鲁什-库恩-塔克)给出的完备性条件。当R=D(xj)时,xj是数据空间中支持向量的闭点的轮廓线,是集x|D(x)=R,52,则支持向量和满足i=0的点xi的图像点位于特征空间或边界邻接矩阵(AIJ)上0iR的点y之外,对于所有点AIJ=1,如果弧段上所有y,D(y)RAij=0,如果至少一个y,D(y)R,57关于弧段,聚类分析:邻接矩阵,58,计算主要部分的伪代码,getadjcentmatrix(A)初始化矩阵A,如果每个元素被清除为for I2 tonforj1 toi-1 fjr,则循环ifd rthena (I,j)=a (j,I)1 endendend。参数59,聚类级别由两个参数:1)q-高斯核宽度参数控制。q增加,不相连的轮廓增加,簇的数量增加。2)C软间隙常数。它允许特征空间中的球不关闭所有点。外部点的数量由参数C控制,nbsv=1/C,其中nbsv是bsv的数量,C是软间隙常数。p=1/NC,1/NC是BSV部分的上界。图4示出了没有BSV等高线的数据和需要BSV的数据之间的差异。如果BSV不存在,由两个概率分布之间的小重叠产生的数据足以防止轮廓线分离。例如,63,64,Iris数据,数据集考虑150个实例,每个实例由4个鸢尾花的测量数据组成。有3种类型的花,每种都有50个例子。嘿。65,更改“p”和“q”,从q的初始值开始,此标度中的所有点对生成可在结果单个聚类中估计的核值。该值不需要外部点,因此选择了C=1。如果增加Q,个体或某些点的聚类被破坏,或者聚类边界变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论