




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 实实 验验 报报 告告 实验名称: SVM 算法实现 学 员: 何浩辰 学 号: 17060*4 专 业: 软件工程 所属学院: 2 一、实验目的和要求 Homework 2:实现线性支持向量机算法 二、实验内容和原理 1.SVM 算法原理 核心思想:对于线性可分的数据,找到一个划分超平面,将两类样本分开,使 得两类样本距离划分超平面的距离尽可能大。 样本集到超平面的距离定义为: 因此优化目标为: 其中,w 必须满足约束条件是将所有样本分类正确。为了简化上式, ,得到下式: 3 注意到,化简并不影响结果,因为分类器最终是取符号, 而。 取优化目标的倒数,得到 SVM 问题的原始形式: 其中,优化目标是严格正定的,所有的约束都是线性的,因此本优化问题是具 有线性约束的二次规划典型的凸优化问题,则最优解存在且唯一。 可以直接对上面问题进行求解,也可对其进行进一步化简。 为解上式,使用拉格朗日乘子法: 得到需满足的 KTT 条件 将 KTT 条件中的等式带入拉格朗日函数,得到原始问题的对偶问题: 该问题也是一个标准的带约束二次规划问题。未知数为,求解出后,需要 在求解 w、b:。注意到, 4 支持向量的点为对应 i 0 (i)的样本。 上述方法对线性可分数据有效,对于非线性可分数据: 超平面 x + b = 0: i)错误地分类 x i ; ii)正确地分类 x j ,但间隔小于 1。可以 假设,此时需要在间距最大化和训练误差最小化之间找到一个平衡点。则考虑允许 训练过程中有误差: 其中,C 为正则化参数是调节模型复杂度与训练误差的。但此时多了未知变量 ,直接对原始问题求解变得困难,所以要转换为其对偶形式。此时的拉格朗日函数 和 KTT 条件为: 将 KTT 条件带入拉格朗日函数: 5 相比于线性可分的情况,仅仅多出一个约束条件,且和均未出现,可以容易 的求解。得到后,按线性可分的情况求解 w 和 b 即可。 2.数据集 IRIS花的萼片的长度、宽度和花瓣的长度宽度数据,标签为画的种类: 。 。 。 。 。 。 上图为 iris 数据集, 分别选取线性可分数据 (第 1-100 行) 和非线性可分数据 (第 51-150 行) ,用于训练原始的 SVM 和引入松弛变量后的 SVM。考虑到 2 维和 4 维 在实现上无本质区别,为方便展示结果和可视化,选取两维(线性可分: sepal.lengthline150 和 sepal.width150 非线性可分:sepal.lengthline51150 和 petal.widthline51150)数据进行实验。 三、操作方法与实验细节 6 实验环境:Windows 10 编程语言:Matlab 1. 数据预处理 首先进行数据中心化处理,对于 SVM 算法而言,是否进行数据中心化,对训练 速度影响没有感知机那么大。 2. 线性可分-算法过程 对于线性可分数据, 本实验对原问题使用二次规划求解, 使用的函数为 quadprog 函数() 。要使用这个函数,就要先将 化成标准的二次规划的形式: 具体演算为本人手写,如下图所示: 7 3. 非线性可分-算法过程 8 对于非线性可分数据,本实验使用原问题的对偶问题进行求解: 因为约束中出现了等式约束,所以 quadprog 函数需要更多的参数: 。同样,需要将对偶问题化成标准的二 次规划的形式,过程如下所示: 9 求出后,再用公式和求 出 w 和 b: 四、实验结果与分析 1.时间开销 原始 SVM 算法运行时间: 引入松弛变量的 SVM 算法运行时间: 第二个模型比第一个模型要复杂,所用时间约为 10 倍 2.对于数据线性可分的情况 10 完全划分 一共四个支持向量点(=0 对应的样本点) ,如图所示。显然,超平面距离支 持向量样本距离足够远。 3.对于数据非线性可分的情况 11 非线性可分的情况 共有 31 个支持向量点,其中参数 C 取 2.3。参数 C 取值超过某个值就不会再对 训练结果产生影响,这个阈值在 4 左
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建理工大学《国际经贸》2023-2024学年第二学期期末试卷
- 三江学院《花灯演唱与欣赏》2023-2024学年第二学期期末试卷
- 华中科技大学《食品质量检测技术》2023-2024学年第二学期期末试卷
- 南通师范高等专科学校《移动设备开发》2023-2024学年第二学期期末试卷
- 江苏城乡建设职业学院《世界纪录片史话》2023-2024学年第二学期期末试卷
- 山东劳动职业技术学院《美国文学史及作品选读》2023-2024学年第二学期期末试卷
- 青海高等职业技术学院《计量统计学》2023-2024学年第二学期期末试卷
- 青岛飞洋职业技术学院《传统文化研究》2023-2024学年第二学期期末试卷
- 黑龙江省哈尔滨市宾县2025届英语七下期末监测模拟试题含答案
- 中科大热能与动力机械制造工艺课件2-2 常用铸造合金
- 2025汾西矿业井下操作技能人员招聘300人(山西)笔试参考题库附带答案详解析集合
- 伊春市纪委监委所属事业单位招聘笔试真题2024
- 2025餐厅管理与服务合同
- 2025年全国“银行业金融消费者权益保护”应知应会知识考试题与答案
- (期末复习)常考知识清单(八大单元52个小知识点)-2024-2025学年三年级下册数学期末备考总复习(人教版)
- 社会工作者的政策与法律试题及答案
- 2025年时事政治试题库(含答案)
- 2025年农村经济发展考试试卷及答案
- 充电桩设备生产建设项目投资可行性报告
- T/CECS 10011-2022聚乙烯共混聚氯乙烯高性能双壁波纹管材
- 2025届江苏省宿迁市名校八下数学期末检测试题含解析
评论
0/150
提交评论