模糊支持向量机的自适应摩尔斯电码识别-中文版翻译.docx_第1页
模糊支持向量机的自适应摩尔斯电码识别-中文版翻译.docx_第2页
模糊支持向量机的自适应摩尔斯电码识别-中文版翻译.docx_第3页
模糊支持向量机的自适应摩尔斯电码识别-中文版翻译.docx_第4页
模糊支持向量机的自适应摩尔斯电码识别-中文版翻译.docx_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模糊支持向量机的自适应摩尔斯电码识别摘要:摩尔斯电码现在是被广泛地用在可供选择的通讯和辅助技术的修复应用,促进流动性、环境控制和适应现场访问。在本文中,摩尔斯电码作为为患有肌肉萎缩、脑瘫或其他严重障碍者的通信自适应装置。对于摩尔斯电码成为有效的沟通工具是严格要求有一个稳定的打字速度的。因此,需要一个高识别率的自适应自动识别方法。所提出的系统使用模糊支持向量机和可变程度可变步长的最小均方算法来实现这些目标。我们应用模糊成员的每个点,并提供不同的贡献来决定学习函数的支持向量机。统计分析表明,所提出的方法比文献中其他的算法引起了较高的识别率。关键词:摩尔斯电码;最小二乘算法;支持向量机;模糊理论1. 介绍目前,大多数的技术产品,特别是传统的电脑键盘,是为没有身体残疾的人设计的。通常,残疾人需要用辅助工具去顺利的使用这些技术设备。随着计算机科学及其相关技术的不断进步,这些自适应工具,结合计算机软硬件,将逐渐在残疾人的生活中扮演越来越重要的角色。因此,许多计算机辅助密钥系统已经为残疾人开发了,如头鼠、迷你键盘、国王的键盘、轨迹球、操纵杆、替代键盘、重点防范(钥匙防护)和触摸屏1,2。许多研究人员都集中在为这些输入设备的效率接近每一个按键选定的字符的一套减少开关。去帮助由于如肌肉萎缩、脑神经麻痹或其他严重障碍等疾病而受损的手的协调能力和敏捷性的人,替代键盘是必要的。作为这种通信自适应装置,摩尔斯电码已被证明是一个很好的选择3-8。对于摩尔斯电码成为有效的沟通工具是严格要求有一个稳定的打字速度的。因此,一个合适的自适应自动识别方法是必要的。在本文中,一种先进的识别方法,即结合模糊支持向量机(FSVMs)9,10和可变程度可变步长的最小均方(vdvslms)算法 11 ,建议其提高性能的预测。支持向量机(SVM)理论,基于结构风险最小化原则(SRM) 12 ,是一种新的分类方法,在最近几年,更多的关注都被吸引到这个话题13,14。支持向量机已成功地应用于许多现实世界的问题,如手写体数字识别、人脸识别、机器视觉15,16文本分类和目标检测。它们表明,支持向量机比传统学习机9,10具有更高的性能。在模糊支持向量机中,对于决策面的学习,不同输入点可以做出不同的贡献。该方法通过减少数据点中的异常值和噪声的影响,提高了支持向量机的效率。2. 方法论摩尔斯电码是一种异步数据比特的二进制编码电路构成对立系统(长短)用于发送和接收数字信息的每一个字可以翻译成一个点和线组成的预定义的序列(摩尔斯电码的元素)。一个点表示一个时期”。”,而破折号等价于一个连字符或减号“”。每一个音调元素,点或破折号,以发送一个信号的标准长度的时间被传播。由于对摩尔斯电码的定义,对于点破折号的色调比和点-破折号的空格字符空间的沉默比必须是1:36。然而,根据许多用户的实际体验,莫尔斯电码自动识别是具有挑战性的,因为保持一个稳定的打字速度是很难达到的。在1996年,罗和西施17提出了一个系统,采用自适应技术,最小均方(LMS)算法可以识别不同的打字速度。他们的系统可以调整它的特点,成功地在一个不稳定的打字条件下识别信息,但在打字速度的变化上是有限制的。为了消除目前0.72倍的打字速度的限制,一个残疾人用户为了使系统成功地识别他或她的摩尔斯电码信息必须是训练有素的。然而,对于初学者或严重残疾的人遵从这个限制被证明是困难的。随后,施和罗 18 提出了一种改进的方法,把按字符匹配技术和最小均方算法相结合来克服这种限制。在2001年,杨通过结合最小均方算法和学习矢量量化(LVQ)解决了同样的问题19。本文提出的方法分为以下五个阶段:声调识别、训练过程、空间识别、自适应处理和字符识别。摩尔斯码的识别过程的框图如图1所示。最初,输入数据流被单独发送到音识别或空间识别,这取决于开关的时间长度(音元素)或切换时间(空间元素)。在声调的识别阶段,基调元素值REC认为或者一个点或一个破折号,然后送到训练过程,并重新计算决策函数。同时,在色调,缓冲段,公认的音元(点或破折号)和每个连续的音元素保存在一个点-破折号缓冲和一个调元缓冲。在空间识别阶段,空间元素的值是公认的一点-破折号空间(一个字符元素之间的空间)或一个字符(字符空间之间的空间),然后送入自适应处理阶段。在字符空间被获得后,在色调缓冲区中的值(是)发送到字符识别阶段,该字符识别该字符2。图1. 莫尔斯电码的识别过程框图。 摩尔斯电码字符,xi,表示如下:在ej(xi):当一个键被按下,它是作为“点”或“破折号”,根据输入的字符xi,jth莫尔斯代码元素的持续时间。bj(xi):当一个键被举起,它是作为三个空间:一个字符元素之间的空间,字或词与词之间的空间之间的空间,这是对输入字符xi两空间时间。N:在字符xi摩尔斯代码元素的总数。2.1.音调识别最初,输入的数据流发送单独的声调识别和空间识别和数据缩放到范围内的1得到一个输入值,+1。这可以通过以下操作来描述:下= -1,上= + 1,调元是一个输入值,音min是输入点的最小的点破折号值,音调Max是输入点的最大的点破折号值。音元素的值首先被确认为一个点或一个破折号,调元价值首先是公认的一个点或一个破折号,然后发送到培训过程的阶段,这是用来计算决策函数。在这个阶段,缩放的音值(),可以发送到决策功能确定认可价值为破折号(F(XJ)0)或一个点(F(XJ)0),其中我是一个最佳的解决方案,一1 + 1 和B是偏见。从最初的决策功能缺失开始,训练过程中应进行计算的FSVMs决策函数。首先要定义一个初始训练数据集。为了阻止我的初始训练数据集,在第一个12个顺序的音调元素的值的关系计算。如果一个值是其邻近值的两倍大,那么值被处理为长(音);较小的值表示短的值(音)。语气和声调的值作为对训练数据集的代表。一旦获得音和音的值,就可以计算出它们的平均值,并分别指定为基础和基础。计算起始标准音的基础是如下方程后的基调基础已经获得,我们可以回去隔离的第一个12个值的色调元素。如果孤立的值是一个破折号,这是标记一= + 1,否则易标记= 1。在训练数据集的基础上,对声调识别的初始决策函数进行了训练过程。例如,摩尔斯电码的数字流为:251 133 240 329 56 131 244 152 52 555 126 314 109 157 136 64 368 242 142 61 135 103 390 79,其中奇数位置数据(下划线)被定义为音调甚至被定义为空间位置数据。前12个色调值是240 56 244 52 126 109 136 368 142 135 251 390。经过计算,这12个值的可微性元素是240 56 244 52 136 368 135 390。这些值(244,240,368,390)在数据流中是大于相邻的值两倍的,从而为色调的候选人。其余的邻居值(52,56,136,135)是音的候选人。因此,可以计算出的样本数据流的音和音基础如下: 因此,声调的基础是202.63,因此训练数据集定义为(240,1),(56,1),(244,1),(52,1),(136,1),(368,1),(135,1),(390,1)和缩放设置成为(0.112,1),(0.976,1),(0.136,1),(1,1),(0.503,1),(0.870,1),(0.509、1),(1,1)。一旦最初的训练数据集是确定的,它可以用来运行训练程序和找到最初的决策函数,构成点破折号分类器。培训过程的细节将在下一节中描述。通过初始化阶段,输入流的新色调值将投入决策函数f(x)确定的公认值为破折号(f(x)0)或一个点(f(x)0)。声调识别后,得到的值可以被送入训练数据集。然后训练过程进行重新计算决策功能,等待下一个值。此值送入训练数据集,而且参与接下来的训练过程。但是,在实践中,并非所有的数据的模糊支持向量机的训练都是必要的,丰富的。换句话说,我们可以在将数据发送到训练数据集之前过滤掉数据。一些数据是远大于或小于音最大或音分钟,超过三倍的值。此数据应被视为噪声和忽略,被引用后,对一个阈值。我们使用标准偏差作为阈值。2.2.训练过程VC理论 12 在文献中提供了一个有关统计学习模型集的复杂性的一般措施。基于VC理论,支持向量机可以设计用于分类问题。支持向量机提供卓越的性能 14 ,但是,他们对于如噪声或更少有意义远离自己的类的数据等损失的数据是敏感的,这会影响支持向量机的泛化能力。为此,黄、刘 10 提出了一种模糊化的概念,建立在所谓的模糊支持向量机的训练数据(FSVMs)。2.3.模糊支持向量机和模糊隶属度 在许多实时信号处理的应用中,顺序学习和推理方法是重要的 9 。摩尔斯电码识别可以被视为一个顺序的学习问题。例如,我们希望有一个学习机,在这一点从最近的过去被给予更多的重量比远回到过去。为了这个目的,我们可以选择的模糊隶属函数的时间点,在该点产生。假设我们给出了一系列的训练点在 t1. . . titl是在哪些时间点到达在系统中,让模糊隶属度是一个函数时间ti。这样,我们使用了三个功能的时间,包括线性函数式(9),边界函数方程(7)和Sigmoid函数方程(8),单独列示如下:这里 a = 0.1, b = , p = 3 和 i = ti 0.5 tl.这些都是模糊隶属函数的识别。我们应用FSVMs字符识别。然而,培训这些系统是不平凡的,计算成本高,所需的优化包的使用。使用内核Adatron(KA)没有偏见 16 算法可以简化FSVMs的训练程序,如下:(1)初始化 i0 = 0。(2)当 i = 1, . . ., l,执行下面的 3, 4步骤。(3)标记点 (xi, yi) 计算:(4)理论计算:(5)如果超出了最大迭代次数或约1后停止,否则返为下一步的2步。是训练程序的学习率。0.1的值在这项研究中。2.4.空间识别空间识别阶段是用来识别字符空间和隔离一个人的摩尔斯电码的字符元素。S1是最初的无声的基值。这个字符检测操作程序显示如下面:(1) 启动j=1。(2) 如果bj(xi)无声的基值,然后转到步骤3,否则去步骤4。(3) bj(xi)是一个点-破折号空间,让j=j+1,然后去步骤2。(4) bj(xi)是字符空间。然后,得到的字符空间之间的音调持续时间序列,去步骤1。 由于一个初始的空间长度值S1的缺失,第一个字xi不能立即隔离。因此,初始间距S1是通过无声的元素的前九个值作为参考值;然后,所有取的值按降阶排序。排序后,每个值之间的关系进行比较。如果一个值比其他任何一个值大一倍,这个值表示为长(沉默升),如果值较小,则表示为短(沉默的)。一旦这种关系已经确定,分为初始间距S1。每当一个S1值,数据流分为字符集和空间点冲刺空间。后一个字符的摩尔斯电码的元素是从数据流中分离的元素,可以识别的字符识别阶段。2.5.自适应过程变化的程度,变步长LMS算法(vdvslms)系统中使用,可以巧妙地改变无声的基础来预测一个不稳定的打字速度20。这一变化利用当前的数据去计算带有步长标准的LMS使用权重递归的一个新的权重向量11。X(n)是n最近的输入数据的输入向量,(n)是错误的。VDVSLMS方程式所产生的权重更新递归算法:在这里在2(n)的下标表示的程度,是一个梯度的估计。这里d(n)是所需信号的标量。步长参数控制的收敛速度,以及自适应滤波器的稳态和/或跟踪行为。步长已经在我们的系统中的值是0.02,一个算法与九个输入信号x(n)进行实验。更新的权重递归后的W(n + 1)的计算方法,它可以与输入向量XT(n)乘以的结果作为一个新的调整,无声基值。结果得到一个VDVSLMS比采用归一化LMS算法得到的更准确。2.6.特征识别一旦一个特征空间价值已经抵达缓冲音调,这是一个语气缓冲元件送到字符识别信号。如果识别的字符集可以直接从摩尔斯电码表匹配到一个代码集,然后立即从摩尔斯电码表翻译。超视距调节,它是由下面的最小距离计算翻译。首先,在一个未知的音元流的每个音的元素值除以前面的音元的FSVM的决策函数集。然后,计算每个色调值在摩尔斯电码表的每个字符的代码元素之间的距离。以最小欧氏距离为基调的字符被选择作为未知字符的值。确定最短欧氏距离的程序是以下。首先,每个音调的元素,ej(xi),被判定函数j = 1n分开。然后,对新的音元和在摩尔斯电码表的字符之间的平方距离的总和的根进行计算,ej(xi)。在摩尔斯电码表,欧氏距离最小的特性是公认的未知字符。假设,例如,在一个未知的字符的音调元素的值是以下:756,234和212(非缩放)。由决策职能分工后,三音元素标记为1(点)、1(破折号)和-1(点)。在摩尔斯电码表的欧氏距离最小的特点是字符“R”(即点破折号点或131)。因此,字符“R”作为未知字符的摩尔斯码匹配。3. 实验结果与讨论对于运动或感觉障碍的许多人去使用微处理器的设备,摩尔斯代码作为输入系统,通过交换机外部的计算机,使用新开发的自适应接入软件程序、硬件外设,并学习方法。对于运动和感知能力有限制的人通过调整切换机制和键盘输入功能莫尔斯代码仿真已经被证明可以成功地操作电脑和其他设备。研究和临床经验表明在摩尔斯电码输入系统的快速入门率和低水平的体力消耗对于残疾人对微处理器的控制方法可以制造 一个可行的和有竞争力的方法22。识别系统是采用微软Visual C+ 6的Windows版本实现。探讨了该方法的有效性,测试数据(DIS-N)收集到三名残疾人(P1,P2,P3)。第一次测试的参与者(P1)是一个14岁的男孩,他被诊断为脑瘫。他自愿运动接近但初始延迟展出之前发起的运动。智商测试表明他的智力是正常的。参与者2(P2)是一个14岁的青少年女性,诊断为脑瘫,手足徐动型。她表现出她的四involun性和无法控制的肢体动作。当她兴奋的时候,不由自主的运动增加了。她英特尔智能是正常的,但dysarticulation指出,造成交际困难。第三参与者(P3)是一个40岁的成年男性遭受脊髓损伤不完全瘫。他的右手腕不能延伸的目的地,这使得他的手运动功能失调性。每个参与者类型100个字符15测试样品,这是表示对dis-15 dis-01表1。测试结果如图2所示。 图2.四种不同算法对三个用户测试问题的精度曲线。 该方法相对于其他三个方法,罗和西的(LS)方法 17 ,施和罗的(SL)方法 18 分别地学习向量量化(LVQ)神经网络 19 。正如预期的那样,最差的方法显示了最贫穷的四种比较方法的比赛(表1)。虽然LS方法已成功地应用于速度不稳定的摩尔斯电码的时间序列分析,打字速度从一个角色到另一个不能提高到超过1.6的一个因素或减缓超过两倍,前面的字符没有LS方法遇到的一些问题。该方法提出了这里在15个测试中的13个问题的比赛次数是最多的,而这就等于在剩余的2个问题进行。SL、LS、LVQ的平均比赛次数,提出的方法分别为21.7、73.5、79.1和84.8。所提出的方法获得这样的高识别率的原因可以解释如下。FSVMs有良好的泛化能力的分类问题,可以调整权重和隶属度函数与时间关系的最近点和点更远的过去后。换句话说,所提出的方法可以适应用户的打字速度。此外,根据统计理论,FSVMs可以找到字符识别优化边缘。虽然已经有许多吸引力,FSVMs强大的能力,他们仍然可以改进实践。这样的一个改进的参数C的唯一的自由参数赋值(自定义)在FSVM是C.表1.三个残疾人使用不同的自适应方法对15个测试问题的识别结果问题参与者P1P2P3P1 and P2 and P3 (平均)LSSLLVQFSVMLSSLLVQFSVMLSSLLVQFSVMLSSLLVQFSVMDis-0113628686106988851065868511.066.786.785.3Dis-0210558085765828486683848.363.381.784.3Dis-0312687283780719177983908.777.075.388.0Dis-0415818285177382821772858216.376.783.083.0Dis-0512678488228084901982889017.777.785.389.3Dis-066777686481788518382853.781.778.785.3Dis-079636985682688568281867.077.072.785.3Dis-0810646370126861751170627511.068.761.773.3Dis-0974888893737991947184919272.785.090.093.0Dis-1057647577486476784869777751.067.076.077.3Dis-1140938795337784953375959453.383.088.794.7Dis-1258586667485666685352676753.056.766.367.3Dis-13136684949778391879929310.075.386.392.7Dis-1411727090775718667676898.075.772.388.3Dis-1512678083127078861171858511.770.781.084.7平均23.569.777.484.521.073.177.585.020.673.782.584.921.773.579.184.8图例: LS:罗和西法17; SL: 施和罗法18. LVQ:学习向量量化19; FSVM: 模糊支持向量机(方法).根据优化准则,C重分类误差,但没有一般的规则选择C.通常情况下,C值的范围应该试过的最好的一个可以选择的。 在本文中,我们提出了几种策略算法的应用。首先,训练数据过滤:数据是更大或更小的语气或音调然后最大最小是不容忽视的,因为无信息数据会降低泛化能力。其次,培训规则:我们提出了一种利用阈值为培训过程中减少培训时间触发策略。再培训的触发几率会降低约68%,如果阈值被分配到1的意思。最后,利用所提出的模糊支持向量机的方法来建立一个自适应算法具有以下优点:(1)VC理论建立的理论基础为了良好的推广效果。(2)一个全局解的优化问题,可以有效地找到使用专门设计的二次规划算法。(3)模糊隶属函数可以表示的时间序列,这是重要的,从最近点给予更多的权重比点更远的过去。(4)策略提高FSVMs的泛化能力,同时避免影响较有意义的数据,并通过抑制触发阈值提高训练效率。四种识别方法通过应用匹配数,双统计检验,弗里德曼检验和多重比较法进行了比21。炸人试验是用来测试不同的识别方法的总数量是否相等。多重比较法被用来判定哪种方法有中位总比赛的显著差异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论