支持向量机(SVM)原理及应用概述.doc

上传人：f*** IP属地：河南上传时间：2020-01-16 格式：DOC 页数：13 大小：170.50KB 积分：20 举报 版权申诉

已阅读5页，还剩8页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

东北大学东北大学研究生考试试卷研究生考试试卷评分考试科目信号处理的统计分析方法课程编号 09601513 阅卷人刘晓志考试日期 2012 年 11 月 07 日姓名赵亚楠学号 1001236 注意事项 1 考前研究生将上述项目填写清楚 2 字迹要清楚保持卷面清洁 3 交卷时请将本试卷和题签一起上交 4 课程考试后二周内授课教师完成评卷工作公共课成绩单与试卷交研究生院培养办公室专业课成绩单与试卷交各学院各学院把成绩单交研究生院培养办公室东北大学研究生院培养办公室支持向量机支持向量机 SVM 原理及应用原理及应用目录目录一 SVM 的产生与发展 3 二支持向量机相关理论 4 一统计学习理论基础 4 二 SVM原理 4 1 最优分类面和广义最优分类面 5 2 SVM的非线性映射 7 3 核函数 8 三支持向量机的应用研究现状 9 一人脸检测验证和识别 10 二说话人语音识别 10 三文字手写体识别 11 四图像处理 11 五其他应用研究 12 四结论和讨论 12 支持向量机支持向量机 SVM 原理及应用原理及应用一一 SVM 的产生与发展的产生与发展自1995年Vapnik在统计学习理论的基础上提出SVM作为模式识别的新方法之后 SVM一直倍受关注同年 Vapnik和Cortes提出软间隔 soft margin SVM 通过引进松弛变量度量 i 数据的误分类分类出现错误时大于0 同时在目标函数中增加一个分量用来惩罚非零 i x i 松弛变量即代价函数 SVM的寻优过程即是大的分隔间距和小的误差补偿之间的平衡过程 1996年 Vapnik等人又提出支持向量回归 Support Vector Regression SVR 的方法用于解决拟合问题 SVR同SVM的出发点都是寻找最优超平面但SVR的目的不是找到两种数据的分割平面而是找到能准确预测数据分布的平面两者最终都转换为最优化问题的求解 1998年 Weston等人根据SVM原理提出了用于解决多类分类的SVM方法 Multi Class Support Vector Machines Multi SVM 通过将多类分类转化成二类分类将SVM应用于多分类问题的判断此外在SVM算法的基本框架下研究者针对不同的方面提出了很多相关的改进算法例如 Suykens提出的最小二乘支持向量机 Least Square Support Vector Machine LS SVM 算法 Joachims等人提出的SVM 1ight 张学工提出的中心支持向量机 Central Support Vector Machine CSVM Scholkoph和Smola基于二次规划提出的v SVM 等此后台湾大学林智仁 Lin Chih Jen 教授等对SVM的典型应用进行总结并设计开发出较为完善的SVM工具包也就是LIBSVM A Library for Support Vector Machines 上述改进模型中 v SVM是一种软间隔分类器模型其原理是通过引进参数v 来调整支持向量数占输入数据比例的下限以及参数来度量超平面偏差代替通常依靠经验选取的软间隔分类惩罚参数改善分类效果 LS SVM则是用等式约束代替传统SVM中的不等式约束将求解 QP问题变成解一组等式方程来提高算法效率 LIBSVM是一个通用的SVM软件包可以解决分类回归以及分布估计等问题它提供常用的几种核函数可由用户选择并且具有不平衡样本加权和多类分类等功能此外交叉验证 cross validation 方法也是LIBSVM对核函数参数选取问题所做的一个突出贡献 SVM 1ight的特点则是通过引进缩水 shrinking 逐步简化 QP问题以及缓存 caching 技术降低迭代运算的计算代价来解决大规模样本条件下SVM学习的复杂性问题二支持向量机相关理论二支持向量机相关理论一统计学习理论基础一统计学习理论基础与传统统计学理论相比统计学习理论 Statistical learning theory或SLT 是一种专门研究小样本条件下机器学习规律的理论该理论是针对小样本统计问题建立起的一套新型理论体系在该体系下的统计推理规则不仅考虑了对渐近性能的要求而且追求在有限信息条件下得到最优结果 Vapnik等人从上世纪六七十年代开始致力于该领域研究直到九十年代中期有限样本条件下的机器学习理论才逐渐成熟起来形成了比较完善的理论体系统计学习理论统计学习理论的主要核心内容包括 1 经验风险最小化准则下统计学习一致性条件 2 这些条件下关于统计学习方法推广性的界的结论 3 这些界的基础上建立的小样本归纳推理准则 4 发现新的准则的实际方法算法二二 SVM 原理原理 SVM方法是20世纪90年代初Vapnik等人根据统计学习理论提出的一种新的机器学习方法它以结构风险最小化原则为理论基础通过适当地选择函数子集及该子集中的判别函数使学习机器的实际风险达到最小保证了通过有限训练样本得到的小误差分类器对独立测试集的测试误差仍然较小支持向量机的基本思想是首先在线性可分情况下在原空间寻找两类样本的最优分类超平面在线性不可分的情况下加入了松弛变量进行分析通过使用非线性映射将低维输入空间的样本映射到高维属性空间使其变为线性情况从而使得在高维属性空间采用线性算法对样本的非线性进行分析成为可能并在该特征空间中寻找最优分类超平面其次它通过使用结构风险最小化原理在属性空间构建最优分类超平面使得分类器得到全局最优并在整个样本空间的期望风险以某个概率满足一定上界其突出的优点表现在 1 基于统计学习理论中结构风险最小化原则和VC维理论具有良好的泛化能力即由有限的训练样本得到的小的误差能够保证使独立的测试集仍保持小的误差 2 支持向量机的求解问题对应的是一个凸优化问题因此局部最优解一定是全局最优解 3 核函数的成功应用将非线性问题转化为线性问题求解 4 分类间隔的最大化使得支持向量机算法具有较好的鲁棒性由于SVM自身的突出优势因此被越来越多的研究人员作为强有力的学习工具以解决模式识别回归估计等领域的难题 1 最优分类面和广义最优分类面最优分类面和广义最优分类面 SVM是从线性可分情况下的最优分类面发展而来的基本思想可用图1来说明对于一维空间中的点二维空间中的直线三维空间中的平面以及高维空间中的超平面图中实心点和空心点代表两类样本 H为它们之间的分类超平面 H1 H2分别为过各类中离分类面最近的样本且平行于分类面的超平面它们之间的距离叫做分类间隔 margin 图1 最优分类面示意图所谓最优分类面要求分类面不但能将两类正确分开而且使分类间隔最大将两类正确分开是为了保证训练错误率为0 也就是经验风险最小为O 使分类空隙最大实际上就是使推广性的界中的置信范围最小从而使真实风险最小推广到高维空间最优分类线就成为最优分类面设线性可分样本集为是类别符号 d维空间中线性判 1 1 1 x yRxniy d ii 别函数的一般形式为是类别符号 d维空间中线性判别函数的一般形式为分bxwxg 类线方程为将判别函数进行归一化使两类所有样本都满足也就是0 bxw1 xg 使离分类面最近的样本的此时分类间隔等于因此使间隔最大等价于使1 xg 2w 或最小要求分类线对所有样本正确分类就是要求它满足 w 2 w 1 1 nibxwyi 2 1 01 满足上述条件 1 1 并且使最小的分类面就叫做最优分类面过两类样本中离分 2 w 类面最近的点且平行于最优分类面的超平面H1 H2上的训练样本点就称作支持向量 support vector 因为它们支持了最优分类面利用Lagrange优化方法可以把上述最优分类面问题转化为如下这种较简单的对偶问题即在约束条件 1 0 1 i n i i y 2a 1 2b ni i 2 1 0 下面对求解下列函数的最大值 i 1 n ji jijiji n i xxyy 1 1i 2 1 Q 3 若为最优解则 1 n i i yw 1 4 即最优分类面的权系数向量是训练样本向量的线性组合这是一个不等式约束下的二次函数极值问题存在唯一解根据k hn Tucker条件解中将只有一部分通常是很少一部分不为零这些不为0解所对应的样本就是支持向量 i 求解上述问题后得到的最优分类函数是 1 5 sgn sgn 1 n i iii bxxybxwxf 根据前面的分析非支持向量对应的均为0 因此上式中的求和实际上只对支持向量 i 进行是分类阈值可以由任意一个支持向量通过式 1 1 求得只有支持向量才满足其中 b 的等号条件或通过两类中任意一对支持向量取中值求得从前面的分析可以看出最优分类面是在线性可分的前提下讨论的在线性不可分的情况下就是某些训练样本不能满足式 1 1 的条件因此可以在条件中增加一个松弛项参数变成 0 i 1 6 nibxwy iii 2 1 01 对于足够小的s 0 只要使 1 7 n i i F 1 最小就可以使错分样本数最小对应线性可分情况下的使分类间隔最大在线性不可分情况下可引入约束 1 k c 2 w 8 在约束条件 1 6 幂1 1 8 下对式 1 7 求极小就得到了线性不可分情况下的最优分类面称作广义最优分类面为方便计算取s 1 为使计算进一步简化广义最优分类面问题可以迸一步演化成在条件 1 6 的约束条件下求下列函数的极小值 1 9 2 1 1 n i i Cwww 其中C为某个指定的常数它实际上起控制对锩分样本惩罚的程度的作用实现在错分样本的比例与算法复杂度之间的折衷求解这一优化问题的方法与求解最优分类面时的方法相同都是转化为一个二次函数极值问题其结果与可分情况下得到的 1 2 到 1 5 几乎完全相同但是条件 1 2b 变为 1 10 niC 1 0 i 2 SVM 的非线性映射的非线性映射对于非线性问题可以通过非线性交换转化为某个高维空间中的线性问题在变换空间求最优分类超平面这种变换可能比较复杂因此这种思路在一般情况下不易实现但是我们可以看到在上面对偶问题中不论是寻优目标函数 1 3 还是分类函数 1 5 都只涉及训练样本之间的内积运算设有非线性映射将输入空间的样本映射到高 i xx HR d 维可能是无穷维的特征空间H中当在特征空间H中构造最优超平面时训练算法仅使用空间中的点积即而没有单独的出现因此如果能够找到一个函数K使得 ji xx i x 1 11 jiji xxxxK 这样在高维空间实际上只需进行内积运算而这种内积运算是可以用原空间中的函数实现的我们甚至没有必要知道变换中的形式根据泛函的有关理论只要一种核函数满足Mercer条件它就对应某一变换空间中的内积因此在最优超平面中采用 ji xxK 适当的内积函数就可以实现某一非线性变换后的线性分类而计算复杂度却没有 ji xxK 增加此时目标函数 1 3 变为 1 12 n ji jijiji n i i xxKyyQ 11 1 2 1 而相应的分类函数也变为 1 13 sgn 1 n i jiii bxxKyxf 算法的其他条件不变这就是SVM 概括地说SVM就是通过某种事先选择的非线性映射将输入向量映射到一个高维特征空间在这个特征空间中构造最优分类超平面在形式上SVM分类函数类似于一个神经网络输出是中间节点的线性组合每个中间节点对应于一个支持向量如图2所示图2 SVM示意图其中输出决策规则权值为基于 sgn 1 n i iii bxxKyy iii yw i xxK s个支持向量的非线性变换内积为输入向量 s xxx 21 21d xxxx 3 核函数核函数选择满足Mercer条件的不同内积核丞数就构造了不同的SVM 这样也就形成了不同的算法目前研究最多的核函数主要有三类 1 多顼式核函数 1 14 q ii xxxxK 1 其中q是多项式的阶次所得到的是q阶多项式分类器 2 径向基函数 RBF 1 15 exp 2 2 i i xx xxK 所得的SVM是一种径向基分类器它与传统径向基函数方法的基本区别是这里每一个基函数的中心对应于一个支持向量它们以及输出权值都是由算法自动确定的径向基形式的内积函数类似人的视觉特性在实际应用中经常用到但是需要注意的是选择不同的S 参数值相应的分类面会有很大差别 3 S形核函数 1 16 tanh cxxvxxK ii 这时的SVM算法中包含了一个隐层的多层感知器网络不但网络的权值而且网络的隐层结点数也是由算法自动确定的而不像传统的感知器网络那样由人凭借经验确定此外该算法不存在困扰神经网络的局部极小点的问题在上述几种常用的核函数中最为常用的是多项式核函数和径向基核函数除了上面提到的三种核函数外还有指数径向基核函数小波核函数等其它一些核函数应用相对较少事实上需要进行训练的样本集有各式各样核函数也各有优劣 B Bacsens和S Viaene等人曾利用LS SVM分类器采用UCI数据库对线性核函数多项式核函数和径向基核函数进行了实验比较从实验结果来看对不同的数据库不同的核函数各有优劣而径向基核函数在多数数据库上得到略为优良的性能三支持向量机的应用研究现状三支持向量机的应用研究现状 SVM方法在理论上具有突出的优势贝尔实验室率先对美国邮政手写数字库识别研究方面应用了SVM方法取得了较大的成功在随后的近几年内有关SVM的应用研究得到了很多领域的学者的重视在人脸检测验证和识别说话人语音识别文字手写体识别图像处理及其他应用研究等方面取得了大量的研究成果从最初的简单模式输入的直接的SVM 方法研究进入到多种方法取长补短的联合应用研究对SVM方法也有了很多改进一人脸检测验证和识别一人脸检测验证和识别 Osuna最早将SVM应用于人脸检测并取得了较好的效果其方法是汽接训练非线性SVM 分类器完成人脸与非人脸的分类由于SVM的训练需要大量的存储空间并且非线性SVM分类器需要较多的支持向量速度很慢为此马勇等提出了一种层次型结构的SVM分类器它由一个线性SVM组合和一个非线性SVM组成检测时由前者快速排除掉图像中绝大部分背景窗口而后者只需对少量的候选区域做出确认训练时在线性SVM组台的限定下与自举 bootstrapping 方法相结合可收集到训练非线性SVM的更有效的非人脸样本简化SVM 训练的难度大量实验结果表明这种方法不仅具有较高的检测率和较低的误检率而且具有较快的速度人脸检测研究中更复杂的情况是姿态的变化叶航军等提出了利用支持向量机方法进行人脸姿态的判定将人脸姿态划分成6个类别从一个多姿态人脸库中手工标定训练样本集和测试样本集训练基于支持向量机姿态分类器分类错误率降低到1 67 明显优于在传统方法中效果最好的人工神经元网络方法在人脸识别中面部特征的提取和识别可看作是对3D物体的2D投影图像进行匹配的问题由于许多不确定性因素的影响特征的选取与识别就成为一个难点凌旭峰等及张燕昆等分别提出基于PCA与SVM相结合的人脸识别算法充分利用了PCA在特征提取方面的有效性以及 SVM在处理小样本问题和泛化能力强等方面的优势通过SVM与最近邻距离分类器相结合使得所提出的算法具有比传统最近邻分类器和BP网络分类器更高的识别率王宏漫等在PCA基础上进一步做ICA 提取更加有利于分类的面部特征的主要独立成分然后采用分阶段淘汰的支持向量机分类机制进行识别对两组人脸图像库的测试结果表明基于SVM的方法在识别率和识别时间等方面都取得了较好的效果二说话人语音识别二说话人语音识别说话人识别属于连续输入信号的分类问题 SVM是一个很好的分类器但不适合处理连续输入样本为此忻栋等引入隐式马尔可夫模型HMM 建立了SVM和HMM的混合模型 HMM适合处理连续信号而SVM适台于分类问题 HMM的结果反映了同类样本的相似度而SVM的输出结果则体现了异类样本间的差异为了方便与HMM组成混合模型首先将SVM的输出形式改为概率输出实验中使用YOHO数据库特征提取采用12阶的线性预测系数分析及其微分组成24维的特征向量实验表明HMM和SVM的结合达到了很好的效果三文字手写体识别三文字手写体识别贝尔实验室对美国邮政手写数字库进行的实验人工识别平均错误率是2 5 专门针对该特定问题设计的5层神经网络错误率为5 1 其中利用了大量先验知识而用3种SVM方法采用3种核函数得到的错误率分别为4 0 4 1 和4 2 且是直接采用16 16的字符点阵作为输入表明了SVM的优越性能手写体数字O 9的特征可以分为结构特征统计特征等柳回春等在心理测试自动分析系统中组合SVM和其他方法成功地进行了手写数字的识别实验另外在手写汉字识别方面高学等提出了一种基于SVM的手写汉字的识别方法表明了SVM对手写汉字识别的有效性四图像处理四图像处理 1 图像过滤一般的互联网色情网图像过滤软件主要采用网址库的形式来封锁色情网址或采用入工智能方法对接收到的中英文信息进行分析甄别段立娟等提出一种多层次特定类型图像过滤法即以综合肤色模型检验支持向量机分类和最近邻方法校验的多层次图像处理框架达到85 以上的准确率 2 视频字幕提取揽频字幕蕴含了丰富语义可用于对相应视频流进行高级语义标注庄越挺等提出并实践了基于SVM的视频字幕自动定位和提取的方法该方法首先将原始图像帧分割为N N的子块提取每个子块的灰度特征然后使用预先训练好的SVM分类机进行字幕子块和非字幕子块的分类最后结合金字塔模型和后期处理过程实现视频图像字幕区域的自动定位提取实验表明该方法取得了良好的效果 3 图像分类和检索由于计算机自动抽取的图像特征和人所理解的语义间存在巨大的差距图像检索结果难以令人满意近年来出现了相关反馈方法张磊等以SVM为分类器在每次反馈中对用户标记的正例和反例样本进行学习并根据学习所得的模型进行检索使用由幅图像组成的图像库进行实验结果表明在有限训练样本情况下具有良好的泛化能力目前3D虚拟物体图像应用越来越广泛肖俊等提出了一种基于SVM对相似3D物体识别与检索的算法该算法首先使用细节层次模型对3D物体进行三角面片数量的约减然后提取3D 物体的特征由于所提取的特征维数很大因此先用独立成分分析进行特征约减然后使用 SVM进行识别与检索将该算法用于3D丘陵与山地的地形识别中取得了良好效果五其他应用研究五其他应用研究 1 由于SVM的优越性其应用研究目前开展已经相当广泛陈光英等设计并实现了一种基于SVM分类机的网络入侵检测系统它收集并计算除服务器端口之外TCP IP的流量特征使用SVM算法进行分类从而识别出该连接的服务类型通过与该连接服务器端口所表明服务类型的比较检测出异常的TCP连接实验结果表明系统能够有效地检测出异常TCP 连接 2 口令认证简便易实现但容易被盗用刘学军等提出利用SVM进行键入特性的验真并通过实验将其与BP RBF PNN和LVQ 4种神经网络模型进行对比证实了采用SVM进行键入特性验真的有效性 3 李晓黎等提出了一种将SVM与无监督聚类相结合的新分类算法并应用于网页分类问题该算法首先利用无监督聚类分别对训练集中正例和反例聚类然后挑选一些例子训练 SVM并获得SVM分类器任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或SVM分类器进行分类该算法充分利用了SVM准确率高与无监督聚类速度快的优点实验表明它不仅具有较高的训练效率而

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

支持向量机(SVM)原理及应用概述.doc

文档简介

温馨提示

最新文档

评论

支持向量机(SVM)原理及应用概述.doc

文档简介

温馨提示

最新文档

评论

相关文档