下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 支持向量机在意大利葡萄酒种类识别中的应用 朱立云刘媛华摘 要:葡萄酒的化学成分是辨别葡萄酒品种的主要依据。考虑到常规检测方法复杂、繁琐,准确率低,选择机器学习方法识别葡萄酒种类。针对目前常用的k均值算法在葡萄酒识别中存在的问题,尝试使用支持向量机进行分类,并与k均值算法进行对比分析。结果表明,基于支持向量机的模型分类性能更好,准确率达到98.15%。关键词:葡萄酒识别;机器学习;支持向量机;k均值doi:10. 11907/rjdk. 201277中图分类号:tp301 文献标识码:a
2、60; 文章编号:1672-7800(2020)011-0029-04application of support vector machines in the type identification of italian winezhu li-yun,liu yuan-hua(management college,university of shanghai for science and technology, shanghai 200093, china)abstract:the chemical composition of wine i
3、s the main basis for distinguishing wine varieties. considering that the conventional detection methods are complicated and cumbersome, and the accuracy is low, we employ the machine learning method to identify the type of wine. aiming at the problems existing in the commonly used k-means algorithm
4、in wine recognition, we use support vector machine to classify and compare with k-means. the results show that the classification performance based on support vector machine is better, and the accuracy rate reaches 98.15%.key words:wine recognition; machine learning; support vector machines; k-means
5、0 引言葡萄酒的化學成分复杂,因此是区分不同葡萄酒的重要依据。在进行葡萄酒识别时,目前国内外常用的检测方法是化学成分分析法和感官评价法。化学成分分析法1是指采用近红外光谱2和三维荧光光谱等技术检测葡萄酒化学成分,从而区分不同葡萄酒。采用该技术需要专业的化学知识,步骤繁琐、成本高,而且无法检测葡萄酒所有化学成分。感官评价法是指根据品酒师个人经验,凭借感官鉴别葡萄酒种类。该方法虽然成本较低,但是主观性很强,分类准确率很容易受到品酒师个人经验的影响。因此,本文使用机器学习方法识别葡萄酒种类。目前机器学习领域常用的几种分类器为:逻辑回归、人工神经网络、决策树和支持向量机。逻辑回归3-4操作简单、容易解
6、释,支持数值变量和分类变量,是学者们最常使用的分类器,但其更适用于二分类问题,即只有两个类别,而本文葡萄酒类别有3个,出于准确率的考虑,本文舍弃该方法;在样本量充足的情况下,人工神经网络5-7分类准确率较高,但本文样本只有178个,不满足神经网络对样本量的要求;决策树8-9简单、直观,但在实际使用时经常会出现过拟合的情况,即训练集准确率很高,而测试集准确率很低;支持向量机在解决小样本识别问题中体现出其它分类器所不具备的优势,并且通过定义恰当的核函数可解决神经网络局部最优问题。鉴于上述分析,本文选择支持向量机进行葡萄酒种类识别。1 数据来源与可视化1.1 数据来源本文葡萄酒数据来自于uci数据库
7、的wine数据集,记录了意大利同一地区3种不同品种葡萄酒的13种化学成分。本次拟分类样本共有178个,每个样本有13个属性。葡萄酒共分为3种类别,其中类别1包含59个样本,类别2包含71个样本,类别3包含48个样本。1.2 字段解释数据集共包括以下13个字段,都为葡萄酒化学成分,属性含义如表1所示。1.3 数据可视化通过画出属性的二维散点图,以直观分析数据分布情况。样本散点图如图1所示。由于从图1中很难区分出每种葡萄酒属于哪个类别,因此接下来构建支持向量机模型对葡萄酒进行分类。2 基于支持向量机的模型构建2.1 理论介绍支持向量机10-12简称svm,是一种非常常见的广义线性分类器,主要用于小样本数据的分类与回归问题,其最终目标是找到一个最优超平面对样本进行分割。支持向量机可分为3种类别:完全线性可分支持向量机、部分线性可分支持向量机与线性不可分支持向量机。完全线性可分支持向量机原理如图2所示。图中,实心点和空心点代表两类不同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肛瘘手术患者营养支持
- 腰椎间盘突出预防策略
- 智研咨询发布-2026年中国真空镀铝纸行业市场竞争格局、行业政策及需求规模预测报告
- 卫生院干部教育培训制度
- 国企审计风控工作制度
- 三重一大选人用人制度
- 内部审计激励制度
- 全年教育培训制度
- 培训中心绩效考核制度
- 医药公司财务审计制度
- 2024年电脑动画13464自考复习题库(含答案)
- 2024年中国铁路上海局集团有限公司招聘笔试参考题库含答案解析
- 大学有机化学实验必做试题
- 幼儿园小班绘本故事《大熊山》
- S型单级双吸离心泵安装说明中英文
- 建设施工分包安全管理培训讲义图文并茂
- (完整版)英语仁爱版九年级英语下册全册教案
- JJG 602-2014低频信号发生器
- GA 1800.6-2021电力系统治安反恐防范要求第6部分:核能发电企业
- 教学课件-氢氧化钠溶液的配制与标定
- 人教版政治七年级下册全套课件
评论
0/150
提交评论