【《基于肌电信号的手部动作识别和结果分析案例》5500字】_第1页
【《基于肌电信号的手部动作识别和结果分析案例》5500字】_第2页
【《基于肌电信号的手部动作识别和结果分析案例》5500字】_第3页
【《基于肌电信号的手部动作识别和结果分析案例》5500字】_第4页
【《基于肌电信号的手部动作识别和结果分析案例》5500字】_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于肌电信号的手部动作识别和结果分析案例目录TOC\o"1-3"\h\u4887基于肌电信号的手部动作识别和结果分析案例 1214231.1手部动作模式分类方法 129531.1.1线性判别分析 1265041.1.2支持向量机 3142321.1.3K近邻算法 638911.2实验与分析 754231.2.1实验数据准备 7287361.2.2三种分类器性能分析 875971.2.3单一特征和组合特征数据分析 821701.3SVM分类器的参数选取与优化 1187141.4小结 141.1手部动作模式分类方法分类处理是手势识别的最终环节,采集肌电数据的好坏、特征选取效果优势都能通过分类器识别的准确率来判断。本章将探究不同肌电特征值及其组合在三种有监督分类器下的识别准确率。三种分类器包括:LDA、SVM、KNN三种方法。三种分类器各自的识别原理如下。1.1.1线性判别分析线性判别分析(LinearDiscriminantAnalysis,LDA)是Fisher在1936年提出的一种模式识别算法,因此也叫作Fisher线性判别法,在机器学习中被广泛应用。LDA算法原理为通过将高维样本数据投影到寻找到的线或者空间上,使投影后的不同类别样本间距尽可能的大,相同类别样本间距离尽可能近,即类间散度分布大,类内散度分布小。其原理图如图4-1所示。图4-1LDA原理图LDA算法进行二分类的过程如下:设样本训练集中有两个点集和。属于的样本点为,属于的样本点为,两类样本的均值向量分别为,其表达式为:(4-1)将数据投影在直线上,两类样本中心投影后的结果为:(4-2)两类样本中心投影后距离为:(4-3)两类样本的方差公式为:(4-4)设S为两类样本方差之和:(4-5)想让不同类别样本投影点尽可能远离,就要增大D的值。想让同类别样本投影点尽可能靠近,S的值自然越小越好。所以将二者结合可构建出目标模型:(4-6)对(4-6)公式进行化简后,得到如下公式:(4-7)其中为类内散度矩阵,为类间散度矩阵。它们的表达式分别为:(4-8)此时注意到J为w的二次函数,所以将J求导,令导数为零就能求出J的最大值。J求导后表达式为:(4-9)即让。令,可以得到如下表达式:(4-10)从上式可看出w与成比例关系,所以只要求出,就能求出投影线w。1.1.2支持向量机支持向量机(SupportVectorMachine,SVM)是1995年由Cortes等人首先提出的,它是一种二分类模型。相比于其他算法而言,SVM所要求的样本数较少并且擅长应付数据线性不可分的情况,在高维模式识别中不会占据太多存储空间。因此成为一种经典的分类算法。其原理主要是找出一个最优决策超平面,该超平面能在保证训练集的正确划分的基础上令几何间隔最大。如下图4-2所示即为其原理图:图4-2SVM求解最优超平面原理图空间上任意超平面可以用下面这个线性方程来表示:(4-11)其中w为样本的向量表示,为第i个特征向量,b为偏置。设训练集为其中为样本特征向量,为类别标记,当它为1的时候为正类,-1时为负类。d为样本维度。定义一个样本点到某个超平面的间隔,其表达式为:(4-12)用与分别代替雨来的w和b,那么间隔就可以写成:(4-13)这就是样本点到超平面g(x)=0的距离,其中为向量w的范数。因为几何间隔。因此最大化几何间隔就相当于最小化范数。将所有样本点中间隔最小的一点间隔定为1(定为1方便计算),则得到如下公式:(4-14)从而目标函数便转换成了(4-15)于是只要求出在此约束条件下几何间隔的最大值,即求出最小值,就能得到最优解。以上针对线性分类的方法称为硬间隔分类。若数据集交融,即一大类样本中混入了一两个小类样本,硬间隔分类就不能很好的把他们区分出来,这时可用软间隔分类,即添加容错率,在找到决策边界分界面是距离尽可能大的同时,保证大局上的正确性。当遇到线性不可分的情况,通常使用核函数将其映射到高维度空间,用线性超平面来求解SVM。核函数既能减少计算量,也能减少储存数据的内存使用量。常用的核函数有如下几种:(1)线性核函数(4-16)(2)多项式核函数(4-17)(3)径向积核函数(4-18)(4)sigmoid核函数(4-19)针对样本多分类的问题有“一对其余”分类法、“一对一”分类法、有向无环图等方法。“一对其余”法主要是其中一类样本定为正样本,其余合起来定为负样本。该方法分类速度快,但会出现分类重叠和不可分类现象。“一对一”方法为每次选一个类样本作为正类样本,而负类样本变成只选一类。即用排列组合的方法,最后的结果通过投票表决,哪个分类器获得票数最多,其类别就为样本最终类别。该方法虽然不会有不可分类现象,但对于n类样本需要构建分类器数目为k(k-1)/2个,计算过于复杂。有向无环图采用树状排列,分类时先判断是否为两类分类器中的一类,若是,则向下一步继续判断。该方法不会出现重叠和不可分现象,但若一开始分类器答错,后面的分类器无法纠正。但该错误可通过调节输出“置信度”来改善。因此有向无环图也不失为一种好方法。1.1.3K近邻算法K近邻算法是一种经典的分类回归算法。其原理为寻找离待测样本点最近的点的类型,以此来推测样本的类型,采取少数服从多数的原则,即投票制。而选取范围取决于k的大小。该算法识别准确率高,不易受到噪声的影响。但计算量比较大,占用内存较多。在使用KNN算法时通常要考虑三个要素,分别为k的取值、距离度量的方式、分类决策规则。由于分类决策规则通常都采用投票法,因此不多赘述。下文主要介绍剩下两个要素。(1)k的取值从knn算法名字中就能看出k值的重要性。通常k值的选取要结合样本的分布选取一个较小的值,或者通过交叉验证来寻找合适的k值。k值过大或过小都会产生不同的现象导致识别准确率出现问题。下文将分别介绍两种情况产生的现象。当选取的k值过大时,就相当于扩大了选择训练集中样本的范围,这样的好处是泛化误差比较小。但此时分类器产生识别误差的概率就大幅上升。容易受到距离较远的错误样本的影响而误判待测样本点的类别。此时的模型也会随着k值的增大而变得简单。当k值为样本数时,无论输入什么测试样本,最终结果都会是训练集中样本数最多的那一类。当选取的k值过小时,相当于缩小了选择训练集中样本的范围,这样能起到减小识别误差的作用,但泛化误差随之增大,此时模型也会随着k值减小而变得复杂,容易产生过拟合的现象。表现为分类器能很好地拟合训练集,但对测试样本的预测能力不足。当k值为1时,如果离测试样本最近的是噪声,那么预测结果就会错误。(2)距离度量方式距离度量的方法有很多,下文主要介绍三种常见的方式。1)欧氏距离即空间中两点之间的距离,是最常用的距离度量方式。假设有两个n维向量x和y,二者的欧式距离表达式为:(4-20)2)曼哈顿距离曼哈顿距离是赫尔曼闵可夫斯基在十九世纪所创造的定义。它表示两个点在标准坐标系中连线的投影之和。其定义为:(4-21)3)闵可夫斯基距离该距离是多种距离度量公式的概述,许多距离公式都是它的特例。其定义为:(4-22)可以看出欧氏距离是该式在p=2时的特例,曼哈顿距离是该式在p=1时的特例。1.2实验与分析1.2.1实验数据准备本实验对象为五个20-23之间的5个健康人,每个人做两次实验,实验中每个受试者做五组手势的循环,每个手势做五秒,休息五秒,最后得到400秒的实验数据。截取有效手势中的三秒,特征提取后分成五组。选择五组八个手势中的四组作为训练集,剩余一组作为测试集。同时为8个动作添加8个不同的标签。标签设置情况如表4-1所示。表4-1手势动作标签动作类型五指弯曲四指弯曲,拇指伸直食指、中指伸直,其余弯曲无名指、小拇指弯曲,其余伸直中指、无名指弯曲,其余伸直小拇指伸直,其余弯曲拇指、小拇指伸直,其余弯曲五指伸直标签12345678分类器将预测出的标签与训练集中数据的标签进行比对,若相同则表示识别正确,反之识别错误。最终的手势识别率是判别分类器性能的标准。识别率公式为:(4-23)1.2.2三种分类器性能分析将十组肌电信号原始数据经过特征处理后送入分类器中进行训练,对得到的每种手势的识别率取均值。图4-3为八种动作在三种分类器中的识别率对比。图4-3八种手势动作在三种分类器中的识别准确率通过上图可知,三种分类器在识别前三种手势都有不错的识别率。在第三个手势上SVM和LDA分类器都能达到90%以上的准确率,但三者对4到6三种手势的识别率都不足70%。在总体手势识别方面,KNN算法识别率为68.11%,SVM和LDA算法识别率分别为71.5%、73.9%。可以看出SVM和LDA识别率十分接近,但SVM在稳定性方面更胜一筹。因此本文决定使用SVM作为手势动作识别的分类器。1.2.3单一特征和组合特征数据分析本文将研究五个单一特征及其组合特征的手势识别分类结果,经过对比分析选出识别率最高的肌电信号分类识别组合模式。首先分别运用五种典型的单一特征提取算法对自主采集的8种手势进行分类识别,其中六种特征分别为均方根、波形长度、绝对平均值、肌电积分值、方差、不同绝对标准差。分类器都为SVM分类器。对自主采集的8种手势识别准确率如下表所示:表4-2不同特征提取算法对自主采集数据集的手势识别准确率数据库特征名称识别准确率%自主采集RMS(均方根值)72.38%自主采集WL(波形长度)65.95%自主采集MAV(绝对平均值)71.91%自主采集IEMG(肌电积分值)62.28%自主采集VAR(方差)71.71%自主采集DASDV(不同绝对标准差)79.03%从表中可以看出SVM分类器对于均方根值、绝对平均值、方差及不同绝对标准差的识别率均能达到70%以上。对波形长度和肌电积分值的识别率较差。因此下文通过将四种识别率较高的特征进行组合,研究组合特征能否提高手势识别准确性。表4-3反映了对5名测试者进行实验的平均识别准确率结果,结果表明在两种特征组合中绝对平均值与方差的组合平均识别准确率比其它三种组合高了2.2%左右,三种特征组合与两种分类准确率相差不多。表4-3四种特征提取算法组合对自主采集数据集的手势识别准确率数据库特征名称识别准确率%自主采集MAV+DASDV72.76%自主采集MAV+VAR75.08%自主采集RMS+DASDV72.69%自主采集VAR+DASDV72.71%自主采集DASDV+VAR+MAV75.74%自主采集VAR+RMS+MAV72.70%为了能探究组合特征与单一特征对8种手势的识别率情况,本文挑选了单一受试者最佳肌电数据来进行实验,实验采用的单一特征为MAV、RMS,组合特征为MAV+RMS图4-4到4-6为手势识别结果的交叉混淆矩阵。图4-4采用MAV单一特征算法的手势识别混淆矩阵图4-5采用RMS单一特征算法的手势识别混淆矩阵图4-6采用MAV+RMS特征组合算法的手势识别混淆矩阵通过三个混淆矩阵我们发现两个特征向量组合的算法相比于单一特征算法的结果主要将第五个手势的识别率从77%提升至95%。但对第三个手势的识别率略有降低。两种特征算法的组合总体而言起到了取长补短的作用。1.3SVM分类器的参数选取与优化上一小节主要对三种分类器性能进行分析并选出SVM作为接下来特征对比和特征组合分析的分类器。SVM主要参数-s表示SVM的类型,-t表示核函数的类型,在核函数参数的设置中,惩罚系数c与核函数参数g对分类器识别率起到了关键性的作用。上文所用到的SVM分类器选择的核函数为多项式核函数。本小节将使用径向基核函数并探究c、g参数对分类器识别准确率的影响。采用CV的方法可以在某种意义下得到最优的参数,能避免过学习和欠学习状态的发生,最终对于测试集合的预测得到较为理想的准确率。CV方法的原理为将原始数据分成训练集和验证集,先用训练集对分类器进行训练,再用验证集对训练得到的模型进行测试,得到的分类准确率可以作为评价分类器性能的指标。常见的CV方法有Hold-OutMethod、K-foldCrossValidation(K-CV)、Leave-One-OutCrossValidation(LOO-CV)。Hold-OutMethod只是简单地将原始数据随机分成两组进行训练和测试,因此最后分类准确率的高低与原始数据分组关联很大,所以该方法得到的结果并不具备说服力。K-CV将原始数据分成K组,将每个子集数据都做一个验证集,其余K-1组子集作为训练集,这样就会得到K个模型,用K个模型得到的分类准确率的平均值作为该方法下分类器的性能指标。K取值默认为3。该方法可以有效避免过学习和欠学习现象,最后得到的结果也具有说服性。LOO-CV与K-CV法近似,只不过是将N个样本进行拆分,每个样本单独作为验证集,其余样本做训练集。相比于K-CV法,LOO-CV法存在计算量大的缺点。当样本数过大时,该方法在实际操作上就会出现问题。因此综上考虑在下面SVM参数优化过程中使用的是K-CV方法。关于SVM中c、g的优化,目前常用方法为将训练集作为原始数据带入K-CV法得到在选定c、g下验证分类准确率。c、g的取值限定在一定的范围中。多次计算最终取令验证分类准确率最高的那组c和g作为最佳参数。对于最高准确率会同时对应多组c、g的问题,本文选取最小参数c对应的那组c、g作为最佳参数。之所以这样做是因为如果c过大的话,会出现过拟合现象,即训练集准确率很高而测试集准确率很低。因此较小的惩罚参数是更好地选择对象。本文采用函数SVMcgForClass来寻找最佳参数c和g。首先将c和g的取值范围限制在2^(-10)到2^(10)之间,其它参数均采用默认值,得到的等高线图和3D视图如下图4-7、图4-8所示。图4-7SVC参数选择等高线图图4-8SVC参数选择3D视图上图中,x轴表示c取2为底的对数函数后的值,y轴表示g取以2为底的对数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论