版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、神经网络配套Ch12presSV支持向量机(SVM)网络神经网络配套Ch12presSV 最优线性分界面(二分类问题)对线性可分集,总能找到使样本正确划分的分界面,而且有无穷多个,哪个是最优的?一种最优的分界准则(从对样本及参数的鲁棒性看)是使两类模式向量分开的间隔最大。支持向量机神经网络配套Ch12presSV 最优线性分界面的确定两分类的线性判别函数的一般表达式为: 。方程 定义了一个超平面H,它把两类训练样本完全分开。设个样本为: , , ,则有分类规则: , ,由于训练集线性可分,改变权向量的摸,总可改写分类规则为: , ,进一步合并有紧凑式: 同样还有:支持向量机bxwxgT)(0)
2、(xg),(),.,(),(2211NNyxyxyx 1, 1iy nixR0bxwiT0bxwiT1bxwiT1Tiw xb1)(bxwyiTi1iy1iy1iy1iy1| )(|ixg0Tiw xb0Tiw xb 神经网络配套Ch12presSV 最优线性分界面的确定(续) g(x)可以看成是从x到超平面的距离的一种度量,见图。把x表示成: ,其中r是x到的垂直距离,则有:,即:支持向量机wwrxxpwxgr)(wrbwwrxwxgpT)()(神经网络配套Ch12presSV 最优线性分界面的确定(续)间隔:间隔:离分界面H最近的样本点(即使 的样本点)与分界面的距离,它是 。这样,两类模
3、式间隔的距离为 。最优分界面:最优分界面:为使两类间隔最大,应使 最小,等价于使 最小。所以,最优分界面应满足: 和支持向量:支持向量:距离最优分界面最近的位于间隔边界上的那些样本向量,也就是使得等号或 成立的那些样本向量。支持向量机w21| )(|xgw2wwwTw21min1)(bxwyiTiwwxg1)(1)(bxwyiTi| ( )| 1ig x神经网络配套Ch12presSV 最优分界面的求解用Lagrange乘子法最小化代价函数: 。 构造Lagrange函数: 其中 为Lagrange乘子,达到极值的必要条件为: 必要条件1: 即: 必要条件2: 即: 从最优化理论的KTT条件得
4、出解必须满足: 从必要条件1看到,只有 的样本对权起作用,而此 时必有 ,即相应的样本是支持向量。 故解向量w是由支持向量构建的,它们决定分类结果。支持向量机NiiTiiTbxwywwbwL1 1)()(21),(0i0),(wbwLNiiiixyw100),(bbwLNiiiy10)(21)(wwwT0 1)( bxwyiTiiNi,.,2 , 10i01)(bxwyiTi神经网络配套Ch12presSV 最优分界面的求解(续)根据Lagrange优化方法,用对偶定理求乘子 最优解。 展开Lagrange函数有: 将 和 代入上式,则有: 求上式的最大值,可得最优解 ,则最优权向量为: (
5、是支持向量的个数) 最优偏置可选用一个支持向量样本求得: 。最优分界面是:支持向量机NiNiiNiiiiTiiTybxwywwbwL111)(21),(Niiiixyw1Niiiy10ijNiNjTijijiNiixxyybwLQ11121),()(sNiiiixyw1*iTixwyb*i0*bxwTsN神经网络配套Ch12presSV 线性不可分问题向高维空间(特征空间)映射 模式可分性的Cover定理 将复杂的模式分类问题非线性地投射到高维空间将比投射到低维 空间更可能是线性可分的。 基本原理 通过某种非线性映射 将样 本映射到一个高维空间(特征空间),在这个高维空间中构造最 优分类超平面
6、:在特征空间用线性可分的结果,即代入上式得这样在映射到高维空间也只须进行内积运算,这是可以用原空间 的函数实现的。根据泛函理论,只要核函数 满足Mercer条件,它就对应某个变换空间中的内积。支持向量机Tmxxxxz)(),.,(),()(210)(bxwTNiiiixyw1)()()(),(xxxxKTiiNiTiiibxxy10)()(神经网络配套Ch12presSV 线性不可分问题(续)向高维空间(特征空间)映射 只要找到适当的核函数 就可实现某个非线性变换后的线性分类,类似线性可分情形有:对 求以下函数的极大值 满足约束条件 和 。 设最优解为 ,则最优分界面可写为:支持向量机Niii
7、ibxxKy1*0),(),(jixxKi),(21)(111jNiNjijijiNiixxKyyQ*iNiiiy100i神经网络配套Ch12presSV 线性不可分问题(续)向高维空间(特征空间)映射 不同的核函数将形成不同的算法,常用的有:多项式核函数:径向基函数: 支持向量机的结构图支持向量机diTixxxxK)1(),()exp(),(2iixxxxKsgn( )y神经网络配套Ch12presSV 线性不可分问题(续)(映射后也不能保证线性可分)增加松弛项,使分界面在训练集上平均分类误差最小。 原问题为:寻找权向和偏置的最优值,使得它们们满足约束条件 和 , 其中松弛变量 时, 是支持
8、向量 松弛变量 , 落入间隔区,在分界面的正确一侧 松弛变量 时, 落入分界面的错误一侧 此时,使得权向量和松弛变量最小化代价函数为 其中 是个常数,由使用者选定控制对错分样本的惩罚程度支持向量机NiiTCwww121),(0iiiTibxwy1)(Ni,.,2,10C0iix10iixi1ix神经网络配套Ch12presSV 对偶问题为:寻找Lagrange乘子最大化目标函数 满足约束条件 和 (此项与前面线性可分情况结果不同)支持向量机jNiNjTijijiNiixxyyQ 11121)(Niiiy10Ci0神经网络配套Ch12presSV 支持向量机的设计算法在能够进行变换 的情况下:(
9、1)在约束条件 和 (或 )下求函数 极大值点 ;(2)计算最优权值和偏置值: , ;(3)支持向量机的最优分界面为: 。在选择核函数 避免进行变换情况下,不同处有:(1)求函数 极大值点 ;(2)计算最优权值: ,其中 是隐层输出;(3)支持向量机的最优分界面为:支持向量机( )xNiiiy10Ci00i1111( )()()2NNNTiijijijiijQy yxx *1()sNiiiiwyx*iTixwyb*1()( )0NTiiiiyxxb( , )iK x x1111()(,)2NNNiijijijiijQy y K xx *1sNiiiiwy y*iy*1(,)0Niiiiy K
10、xxb神经网络配套Ch12presSV 支持向量机的特点适合对小样本数据的学习,注重样本自身信息,而非产生样本的规律(概率及条件概率等)。网络结构简单,只有一个隐层,隐层的节点数由所求得的支持向量个数自动决定。可以根据核函数的选择自动计算重要的网络参数。在解决模式分类问题方面,能提供较好的泛化性能。有些参数(如控制对错分样本惩罚程度的C)不易确定。虽然可以不需知道非线性映射 的具体形式,但非线性映射的核函数 不易得。判定一个给定的核函数是否满足Mercer定理条件是一件困难事。在待分类的模式为线性不可分时,怎样控制支持向量的选择是一个困难的问题。支持向量机)(),(xxKi神经网络配套Ch12
11、presSV 支持向量机类型的RBF网络和MLP网络RBF网络 Gauss核函数 ; 对所有核相同,由设计者预先指定; 隐层节点的数量由支持向量的个数自动决定; 中心由支持向量的值自动决定。单隐层MLP网络 Sigmoid核函数 ,其中只有一些特定的 , 值满足Mercer定理; 隐层节点的个数由支持向量的个数自动决定; 隐节点的权值由支持向量的值自动决定。支持向量机21(,)exp()iiK X XXX12(,)tanh()TiK X Xk X Xk2k1k神经网络配套Ch12presSV 支持向量机设计举例 XOR问题训练样本:方法一: 选择非线性映射函数: 将二维输入样本映射到一个六维特
12、征空间。(1)求极值满足约束条件: (即必要条件2: )支持向量机22112212()1,2,2,2TXxx xxxx1111( )()()2NNNTiijijijiijQy yXX 222223243344922929) 2123411213141(92222 0i1,2,3,4i ( 1, 1), 1),( 1, 1), 1),( 1, 1), 1),( 1, 1), 1)410iiiy04321神经网络配套Ch12presSV 支持向量机设计举例 XOR问题(续)方法一(续): 对 求导并令导数为零,得到下列联立方程组:解得极值点为 , 。可见4个样本都是支持向量。(2)计算最优权值和偏
13、置值: 支持向量机12349118i1,2,3,4i 123491123491123491*123411()()()()()8sNiiiiWyXXXXX ()Qi(1,1,2,1,2,2)(1,1,2,1,2,2) (1,1,2,1,2,2)(1,1,2,1,2,2)(0,0,12 ,0,0,0)神经网络配套Ch12presSV 支持向量机设计举例 XOR问题(续)方法一(续): (3)支持向量机的最优分界面为:支持向量机*22112212()()(0,0, 1/2,0,0,0)(1,2,2 ,2)TTWXbxx xxxx120 x x *22()TbywX1 (0,0, 12,0,0,0)(
14、1,1,2,1,2, 2)T 1 (0,0, 12,0,0,0)( 1,1) 1 1 0 神经网络配套Ch12presSV 支持向量机设计举例 XOR问题(续)方法二: 选择核函数为: 将 和 代入上式,核函数可表为: 将各训练样本代入,可计算出4*4对称矩阵为: 9 1 1 1 K K= = 1 9 1 1 1 1 9 1 1 1 1 9(1)用拉格朗日乘子法求极大值点: 支持向量机2(,)(1)TiiK X XXX12(,)TXxx12(,)TiiiXxx2222111212221122(,)1222iiiiiiiK XXx xx x x xx xx xx x11(,)K XX21(,)K
15、 XX31(,)K XX41(,)K XX12(,)K XX22(,)K XX32(,)K XX42(,)K XX13(,)K XX23(,)K XX33(,)K XX43(,)K XX14(,)K XX24(,)K XX34(,)K XX44(,)K XX1111()(,)2NNNiijijijiijQy y KXX 222223243344922929) 2123411213141(92222 神经网络配套Ch12presSV 支持向量机设计举例 XOR问题(续)方法二(续): 对 求导并令导数为零,得到下列联立方程组:解得极值点: 。由于4个样本都是支持向量,隐层应有4个节点,各节点的输出为: , (2)计算最优权值和偏置值:其中 支持向量机1234911234911234911234911234181,2,3,4i 2(,)(1)TiiiyK X XX X4*1iiiiwy y()Qi*14 124 11( (,)(,)8jjwK XXK XX( 1,1,1, 1) *0b 34 144 1(,)(,)jjK XXK XX神经网络配套Ch12presSV 支持向量机设计举例 XOR问题(续)方法二(续): (3)支持向量机的最优分界面为: 即: 将 和下式( )代入上式 整理后有:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工噪音污染防治方案
- 真布病患者的健康教育
- 急救护理中的急救远程医疗
- 控油皮肤的护理工具
- 电光性眼炎的护理要点
- 2026年都市圈交通基础设施重大项目谋划与储备指南
- 2026年智算中心网络安全保障数据加密访问控制方案
- 特种设备基础知识的分类和管理要求
- 2026年食疗按摩改善脾胃虚弱实操技巧养生培训课件
- 2026年社区防骗知识讲座
- 2026年安庆医药高等专科学校单招职业适应性测试题库及参考答案详解(新)
- 2026年安徽审计职业学院单招职业技能测试题库参考答案详解
- 2026年湖南张家界桑植县招聘20名城市社区专职工作者笔试备考试题及答案解析
- 2025-2026学年冀教版(2024)小学信息技术四年级上册(全册)教学设计(附目录P178)
- 2026山东铁路投资控股集团有限公司招聘80人考试备考试题及答案解析
- 融媒体中心廉政监督制度
- 2026春小学美术岭南版(2024)三年级下册美术教学计划、教案及每课教学反思(附目录)
- 人力资源服务行业安全生产应急预案
- 2025早产儿经口喂养临床实践专家共识解读课件
- 2026湖南省卫生健康委直属事业单位招聘185人考试备考试题及答案解析
- 2026广东茂名市化州市村(社区)后备干部选聘321人笔试备考题库及答案解析
评论
0/150
提交评论