基于bp神经网络的数字识别方法_第1页
基于bp神经网络的数字识别方法_第2页
基于bp神经网络的数字识别方法_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于bp神经网络的数字识别方法

0局部输出接口人工神经网络是一个并行且分布处理结构,由处理单元和连接的无向信号通道组成。这些处理单元(PE—ProcessingElement)具有局部内存,可以完成局部操作。每个处理单元有一个单一的输出联接,这个输出可以根据需要被分支成所希望的许多并行联接。这些并行联接都输出相同的信号,即相应处理单元的信号,而信号的大小不因分支的多少而变化。处理单元的输出信号可以是任何需要的数学模型,每个处理单元中进行的操作必须是完全局部的。也就是说,它必须依赖于经过输入联接到达处理单元的所有输入信号的当前值,和存储在处理单元局部内存中的值。1可视bp网络模型反向传播算法(Back-Propagation,简写为BP)是一种单向传播的多层前向神经网络,其结构除输入输出结点外,还有一层或多层隐含结点。由于它在同层结点间无任何联接,故每层结点的输出只影响下一层结点的输出。因此,可视BP网络从输入到输出为高度非线性映射,它也是目前应用最广泛的一种模型。BP算法是在导师指导下,适合于多层神经元网络的一种学习算法,它是建立在梯度下降法的基础上。2基于数据的计算机认识数字识别的原理框图如图1所示。经光电转换后,二维文字图象信号转换为电信号。信号经模数转换成具有一定灰度值的数字采样信号,并被送入计算机,预处理环节一般包括消除噪声、二值化、行字切分、平滑、规范化、进行线性或非线性变换等。经过预处理环节的文字成为规范化的二值点阵信息。对于二值化点阵,按照识别方法的要求,抽取代表该字的特征,并与存储在计算机中已知标准文字的特征进行匹配判别,找出字典特征集中与输入文字特征最接近的一个文字,这个字被认为是该字的识别结果。图1点划线的下部分是识别系统的学习部分,它的功能是自动生成计算机特征字典,根据已经准备好的多个字样,抽取出代表该字的特征后,自动进行修改,按照字典的规定位置存放该特征。学习有两种:一是在人的参与下进行,称之“有教师学习”;二是由机器自动进行,称之“无教师学习”。这两种学习方式是人工神经网络的主要学习方式。3基于人工神经网络的数字识别3.1建立人工神经网络模型首先应采集对应的输入集和输出集,即采集输入/输出对组成的训练学习样本,然后确定设计变量与固有频率之间的映射关系(神经网络结构),从而建立起人工神经网络模型。在此基础上,将属于设计空间且任意给定的输入变量作为网络输入,在稳态下进行网络(利用BP学习算法训练好的网络)输出,如图2所示。3.2特征判别与特征匹配对数字0~9进行特征提取(样本是处于一个高维空间中,通过变换的方法可以用低维空间来表示样本,这个过程叫做特征提取)。本系统主要研究的是数字识别,它是模式识别的一个重要的分支,一般通过特征判别及特征匹配的方法来进行处理。特征判别是通过文字类的共同的规则进行分类判别,它不需要利用各种文字的具体知识,而只需根据特征提取的程度(知识的使用程度),分阶段地用结构分析方法完成字符的识别。因此,整个文字识别的历史,就是特征提取的发展史。如图3及图4所示,对数字0~5进行特征提取,将数字分别向X、Y轴方向进行投影,所得象素点数存放在二进制文件Number0.dat~Number5.dat中。3.3含实际神经网络即b的隐层天气形貌为了减少反向传播算法的计算复杂度,作者取输出层结点的激活函数为简单的线性函数(purelin函数),它只是简单地将神经元输入经阀值调整后传递到输出端。在隐含层,取结点的激活函数为tansig双曲正切S型(sigmoid)传递函数。双曲正切sigmoid函数用于将神经元的输入范围为(-∞,+∞)映射到(-1,+1)。正切sigmoid函数是可微函数,因此很适合于利用BP算法训练神经网络。函数表达式为tansig(n)=tanh(n)。从理论上而言,隐层tansig激活函数和输出层purelin激活函数的组合可完成任意精度的非线性函数映射。这两个函数可满足本次应用的需要。3.4培训过程的设计采用MATLAB语言的函数initiff来具体实现已建立的BP网络模型。3.5bp神经网络匹配方法是根据各个文字的知识(称为字典),采取按行匹配方法进行。按实现技术途径的不同,又可分为两种:①直接利用输入的二维平面图象与字典中记忆的图象进行全域匹配;②只抽出部分图象与字典进行匹配,然后根据各部分形状及其相对位置关系,与保存在字典中的知识进行对照,从而识别出每一个具体的文字。前一种匹配方法适合于数字、英文字符一类的小字符集;后一种匹配方法适合于汉字一类的大字符集。匹配的方法一般适用于规范化的印刷文字,特别是同一字体的印刷文字。一般来说,匹配方法的程序编制简单,字典占据空间大,识别速度快。所以,本系统用匹配方法来进行数字识别。对与原训练数字有所不同的,数字进行重新采样,采样数据存放在文件Number10.dat~Number15.dat中,用已训练好的BP网络进行仿真,若输出结果与原来的结果基本相同,则识别成功。图5为举例说明(训练数字为0)BP网络学习的误差曲线。由图5的收敛曲线可以看出,本次应用所建立的BP神经网络模型,其收敛速度比较快,达到了预期误差目标的精度,网络学习结束。由识别结果的正确性可见,网络具有较好的样本泛化能力。4bp网络模型人工神经网络在本质上是一种非线性动力系统,而反向传播算法则能够解决一种特殊的非线性最小二乘问题。BP算法的目的就是要确定加权向量W,使得对这些已知的输入和输出得到最佳的一致性,这是一种典型的非线性二乘问题。BP网络是应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论