matlab代做神经网络手写数字识别文献综述剖析

上传人：s*** IP属地：天津上传时间：2021-01-18 格式：DOCX 页数：7 大小：135.88KB 积分：16 举报 版权申诉

已阅读5页，还剩2页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、基于神经网络的手写体数字识别系统1 前言自 1946 年第一台计算机面世以来，让电脑能说会看，能写会画，使人与计算机的交流更加充分融洽，就成为电脑专家们努力追求的目标。其中计算机的输入技术也由最早的磁带输入到键盘鼠标操作，然而，笔输入的更加直观方便使之成为每个人的梦想。1987 年，美国电气和电子工程师学会 IEEE(institute for electrical and electronicen gi neers在圣地亚哥召开了盛大规模的神经网络国际学术会议，国际神经网络学会(international neural networks society也随之诞生。1990年 IE

2、EE 神经网络会刊问世，各种期刊的神经网络特刊层出不穷，神经网络的理论研究和实际应用进入了一个蓬勃发展的时期 1。目前关于人工神经网络的定义尚不统一 2 ，例如，美国神经网络学家 Hecht Hielsen 关于人工神经网络的一般定义是： “神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算系统，该系统是靠其状态对外部输入信息的动态响应来处理信息的”。综合人工神经网络的来源、特点及各种解释，可以简单表述为：人工神经网络是一种旨在模仿人脑结构及其功能的脑式智能信息处理系统。神经网络经过训练可有效地提取信号、语音、图像、雷达、声呐等感知模式的特征，并能解决现有启发

3、式模式识别系统不能很好解决的不变量探测、自适应、抽象或概括等问题。2 手写体数字识别系统的现状2.1 手写体数字识别手写体字符的识别是多年来的研究热点，在过去的数十年中，研究者们提出了许许多多的识别方法。数字识别问题是根据待识别数字符号的特征观察值将其分类到 0-9 共10 个类别中去。手写体数字识别方法大致可以分为两类3:基于统计的识别方法和基于结构的识别方法。统计法所使用的技术大致有一下几类 :1) 模板匹配法2) 从像素点统计分布的角度来抽取特征，主要的方法有 :采样点方法，矩方法、特征轨迹方法等。3）用全局变换和级数展开的方法抽取特征。全局变换和级数展开可以减少特征向量

4、的维数，且对于一些全局的形变，如平移和旋转，具有一定的不变性。上述统计方法中，对仅使用单个特征的分类器而言，其识别率还不够高。对结构方法而言，它一般是通过分析字符的轮廓或骨架来取得字符的几何和拓扑特征，如环路、端点、弧状线及凹凸性等等。一般来说，结构方法有较高的识别速度，而且对于字符的变形具有良好的抗干扰能力，同时对字符的旋转，平移和伸缩具有较好的稳定性，但是这种方法的特征抽取过程比较复杂，由于特征定义和抽取都直接依赖于研究者的直觉，对图像预处理要求较高。2.2 识别系统的性能评价作为一个识别系统，最终要用某些参数来评价其性能的高低，手写数字识别也不例外。评价的指标

5、除了借用一般文字识别里的通常做法外，还要根据数字识别的特点进行修改和补充。对一个手写数字识别系统，可以用三方面的指标表征系统的性能 5:正确识别率 A=（正确识别样本数/全部样本数）X 100%替代率（误识率）S=（误识样本数/全部样本数）X 100%拒识率R=（拒识样本数/全部样本数）X 100%三者的关系是 : A+S+R=100%数字识别的应用中，人们往往很关心的一个指标是“识别精度” ，即 :在所有识别的字符中，除去拒识字符，正确识别的比例有多大，定义 :识别精度 P=A/ （A+S） X 100%一个理想的系统应是 R, S尽量小，而P, A尽可能大。而在一个实际系统中，S,R

6、是相互制约的，拒识率 R的提高总伴随着误识率 S的下降，与此同时识别率 A和识别精度P的提高。因此，在评价手写数字识别系统时，必须综合考虑这几个指标。另外，由于手写数字的书写风格、工整程度可以有相当大的差别，因此必须弄清一个指标在怎样的样本集合下获得的。以上多种因素使得不同系统的性能很难做绝对比较，根据从文献中所看到的和在科研研究的较高水平是：对自由书写的数字，在不拒识时达到 96%以上的识别率；在拒识少于 15%的样本时，误识率能降到 0.1%以下。2.3 基于人工神经网络的字符识别技术人工神经网络具有自学习、容错性、分类能力强和并行处理等特点 5，对于手写体阿拉伯

7、数字的识别来说，神经网络的方法是一种较有效地手段，也渐渐得到广泛的应用。用神经网络进行字符识别主要有两种方法：首先对待识别字符进行特征提取，然后用所获得的特征训练神经网络。这种网络的识别效果与字符特征的提取有关，而字符的特征提取往往比较耗时。(2)充分利用神经网络的特点，直接把待处理图像输入网络，由网络自动实现特征提取直至识别。这种网络互联较多，待处理信息量大。2.3.1预处理识别字体的过程首先是要在输入图像后进行预处理89，预处理一般包括二值化、行字切分、平滑、去噪声、规范化和细化等。不同的识别方法对预处理的要求不同。所谓的二值化(Binarization)就是指把字符灰度图像处理成二

8、值(0, 1)图像的过程。对灰度图像二值化能显著地减小数据存储的容量，降低后续处理的复杂度。其次，在二值化后利用均值滤波的方法消除孤立点、线的噪声，这样图中就只剩下手写体数字。平滑去噪后，对图像进行规范化处理。找出图像中数字的边界，然后提取出数字把它举重放置在正方形方框中，再对此正方形图像进行线性插值缩放，使它变为统一规格大小的图像。接下来，要对手写体数字进行细化。数字图像预处理前后效果比较如图 1.1与图1.2，图2.1与图2.2所示10。图1.1原始图像图1.2预处理后图像图2.1原始图像图2.2预处理后图像在对字体进行预处理后要进行的是特征的提取，选取图像的灰度特征时要考虑到

9、特征量的维数与识别的准确率的要求。例如，我们将字符归一化为17像素X8像素点阵图按每个像素位为0或1,形成网络的136个输入特征值，如图3所示。O o o O o o o o O 1 o c o Co o o o O c o o o O o o o o Oo o o o o O o o o o o O 00000O 1 1 o O I O 1 I o o O o 1 1 Q o O 0 I 1 o o C O 1 1 c o O图3字符特征编码得到的特征图像是二值图像，对应一个元素为0和I的17像素X 8像素的特征矩阵，然后是对特征图像编码。编码规则是，按照从左至右、从上到下的顺序，依次扫

10、描整个特征矩阵，将每一行的0和1转换成一个136像素X 1像素的特征列。将每一个字符都进行编码后，顺序送送入已经训练好的神经网络识别，识别结果最后以文本格式输出。2.3.2使用BP网络的字符识别技术T.F.Pawlicki将多层BP等多种神经网络用于识别手写体数字的实验，在比较实验结果之后，证实了多层网络的分类能力要比其它几种网络好，它在一定的字符集上取得了很好的识别效果。BP神经元与其他神经元类似，不同的是BP神经元的传输函数为非线性函数，最常用的函数是logsig和tan sig函数，有的输出层也采用线性函数(pureli n)。其输出如。a = logsig(Wp+b)(1

11、)BP神经元模型11如图4所示。Input General NeuronWhere 图4 BP神经元的一般模型BP网络一般为多层神经网络。BP网络的信息从输入层流向输出层，因此是一种多层前馈神经网络。多层BP网络算法实现的简单流程如图 5所示。i预处理Wr样茸训稣字符特征输；Vq 识别出结果.图5 BP数字识别然而孙光民等人利用非线性PCA神经网络对手写体字符进行识别的研究7，非线性PCA算法的神经网络结构如图6所示将基于非线性PCA神经网络与基于BP神经网络识别的结果进行对比见表 1表1采用非线性PCA神经网络与BP神经网络对手写体数字识别结果（）类型识别率拒识率误识率训练集测试集训练集测

12、试集训练集测试集BP网格手写体数字97901.76.71.33.3非线性PCA手写体数字10094.74000.78.97由表1中的测试结果可以看出，同样对于手写体数字识别，与BP网络识别法相比，他们提出的非线性PCA神经网络方法识别率较高，由90%提高到94. 74%。另外，对于部分手写体样本，BP网络无法识别而被拒识，但非线性 PCA网络方法拒识率为0。由此他们得出结论：基于非线性 PCA神经网络信号重构模型组成的字符识别系统识别率高于传统的BP网络识别方法。2.4手写体数字识别的研究难度数字的类别只有十种，笔划又简单，其识别问题似乎不是很困难。但事实上，一些测试结果表明，数字的

13、正确识别率并不如印刷体汉字识别正确率高，甚至也不如联机手写体汉字识别率高，而只仅仅优于脱机手写体汉字识别。这其中主要原因是：第一，某些数字的相似性很大，字形相差不大，使得准确区分某些数字相当困难第二，数字虽然只有十种，而且笔划简单，但同一数字写法千差万别，全世界各个国家各个地区的人都用，其书写上带有明显的区域特性，很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。如图7所示为部分手写体数字。04 3“r:&7/夕- - S, . -亠丄争# 1.1 o/i“ E7I- JlT-U% r_f.wxj， .1/=a- 1.x o/7PA $/l V d7a oz 3 s/7 TsJ川？*喩 o i d V H c- * 7 尿參 /:/-;!r.mr IWA,I.str1.vJl-.-Le绽苦 Qi A j*孑上岁孑, 03-wy *wr舷图7部分手写体数字另外，在实际应用中，对数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为，数字没有上下文关系，每个单字的识别都事关重要，而且数字识别经常涉及的财会、金融领域其严格性更是不言而喻的。因此，用户的要求不是单纯的高正确率，更重要的是极低的、千分之一甚至

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

matlab代做神经网络手写数字识别文献综述剖析

文档简介

温馨提示

最新文档

评论

matlab代做神经网络手写数字识别文献综述剖析

文档简介

温馨提示

最新文档

评论

相关文档