版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、a,1,基于BP神经网络的数字识别,a,2,主要内容,1.课题研究背景2图像预处理3模式识别4识别效果5总结,a,3,1.课题研究背景,近年来,人工神经网络技术取得了巨大的发展,它所具有的优势:固有的并行结构和并行处理、知识的分布存储、容错性、自适应性、模式识别能力,为手写体数字识别开辟了新的途径。数字识别作为模式识别的一个重要分支,在邮政、税务、交通、金融等行业的实践活动中有着及其广泛的应用。数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值。一方面,阿拉伯数字是世界各国通用的符号,因此,数字是一个重要枢纽。在符号识别领域,数字识别为这一领域提供了一个算法研究的平台。另一方面,数字
2、的识别方法很容易推广到其它一些相关问题,特别是对英文字母的识别,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。,a,4,1.1.数字识别的发展现状,模式识别(PatternRecognition)是对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。它是信息科学和人工智能的重要组成部分。而数字识别作为模式识别的一个分支。在日常生活和科研中具有十分重要的作用。数字识别的算法一般是采用以知识、神经网络、人工智能为基础的模板匹配法、轮廓多边形相关、傅立叶系数法等方法来进行识别的。以上方法识别效
3、率高,但是实现较为复杂。,a,5,2.图像预处理,(1)彩色图像的灰度化,图像输入后一般都是256色彩色图像,灰度化后灰度图像的RGB值是相等的,灰度值为255的像素为白色,灰度值为0的像素为黑色。(2)灰度图像的二值化,彩色图像灰度化后每像素只有一个值,即灰度值,二值化就是根据一定标准将图像分成黑白二色。(3)梯度锐化,梯度锐化同时对噪声也起一定的去除作用,采取Roberts算子对图像锐化,可以让模糊的边缘变清楚,同时选用合适阈值可以减弱和消除细小的噪声。(4)去离散噪声,扫描整个图像,当发现一个黑色像素就考察和它直接或间接相连的黑色像素有多少,如果大于一定值(具体数值视情况定),就可以认为
4、它非离散点,否则就认为他是离散点,将其从图像中去掉。(5)归一化调整,先得到原来字符的高度,并与系统要求的高度比较,得出高度变换系数,然后根据这个系数得到变换后应有的宽度,得出高度、宽度后,把新图像里的点按照插值的方法映射到原图像。,图像输入,图像锐化,归一化,灰度转化,二值化,去除噪声,图1图像处理流程,a,6,3.模式识别,3.1.特征提取经过预处理,把原来大小不同、分布不规律的各字符变成大小一样、排列整齐的字符。下面要从预处理完的字符中提取最能体现这一个字符的特征向量,将提取出的训练样本中的特征向量代入BP网络中就可以对BP网络进行训练。提取出待识别的样本中特征向量代入训练好的BP网络中
5、就可以进行识别。在这里采取逐像素特征提取法,方法是对图像进行逐行逐列扫描,当遇到黑色像素时,取其特征值为1,当遇到白色像素时,取其特征值为0。这样扫描结束后就形成一个维数与图像中像素点的个数相同的特征向量矩阵。,a,7,3.2.BP神经网络,采用BP算法的多层感知器是至今为止应用最广泛的神经网络,在多层感知器的应用中,一般习惯将单隐层感知器称为三层感知器,所谓三层包括了输入层、隐层和输出层。,3.2.1.BP算法的多层感知器,图2三层BP网,a,8,3.2.1.BP算法的多层感知器,反向传播(Backpropagation)算法:从后向前(反向)逐层“传播”输出层的误差,以间接算出隐层误差。分
6、两个阶段:正向过程:从输入层经隐层逐层正向计算各单元的输出。反向过程:由输出层误差逐层反向计算隐层各单元的误差,并用此误差修正当前层的权值。,a,9,正向过程,正向过程:,BP算法,a,10,梯度下降(gradientdecent)法,准则函数:sumsquarederror,SSE,权值修正:梯度下降法,BP算法,a,11,Case1:输出层权值修正,对于sigmoid函数:,局部梯度,扩展delta学习规则,BP算法,a,12,Case2:隐层权值修正,后层的全部单元都受nj的影响,BP算法,局部梯度的反向传播,a,13,3.2.2.BP算法过程,初始值选择前向计算,求出所有神经元的输出对
7、输出层计算反向计算:从后向前计算各隐层计算并保存各权值修正量:修正权值:判断是否收敛,如果收敛则结束,不收敛则转至Step2,BP算法,a,14,3.2.2.BP算法过程,图3BP学习算法的流程图,a,15,3.3BP神经网络设计与训练,(1)BP神经网络的设计方法按照BP神经网络设计方法选用两层BP网络。采用newff函数来建立BP网络。其输入节点数为1616256,隐层传输函数为Sigmoid函数。假设用一个输出节点表示10个数字,则输出层传输函数为pureline,隐层节点数为,取25。(2)神经网络仿真程序设计构造训练样本集,并构成训练所需的输入向量p和目标向量t.通过画图工具获得数字
8、。本例构造了新宋体12号、8号字体各10个,黑体12号、8号各10个,及宋体加粗18号字体。(3)神经网络测试。由于图像处理的复杂性,对于不同噪声的污染选择不同的方法,选择没有噪声的数字进行测试。选择训练样本中的任意数据进行测试,结构非常正确。选择生成的新宋体8号大小的数字进行测试。结果正确,选择其他类型的字体进行测试,则结果不是完全正确。,a,16,4.仿真实验识别效果,图4数字0的识别效果,图5数字4的识别效果,a,17,5.总结,本课题结合神经网络技术,对数字识别问题进行了探讨和研究,主要研究成果如下:(1)针对数字数据,首先进行了灰度化、二值化、平滑去噪、归一化、细化等常规预处理,然后对处理完的数字图像进行特征提取,提取了能体现字符特点的特征向量。(2)针对数字识别问题,研究了BP神经网络分类器的建立和识别过程。仿真结果表明,对于字体和字号与训练样本集相同的测试样本,无论图像中的数字在什么位置,都可以识别出来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 齐齐哈尔拜泉县乡镇卫生院招聘笔试真题及答案
- 青岛市市属事业单位遴选工作人员考试真题2025
- 临床腹部脂肪坏死影像诊断及鉴别
- 数据的分组课件2025-2026学年人教版数学八年级下册
- 2026年小学二年级语文第二学期期末考试卷及答案(三)
- 2029年工厂员工宿舍电费结算协议三篇
- 经皮穿刺微创手术技术
- 汽车轻量化趋势推动后副车架产业持续升级
- 传染病病人的护理练习试卷(题后含答案及解析)
- 校园欺凌事件报告制度(2篇)
- 派出所2026上半年意识形态工作总结
- 河南省顶级名校2026届高三年级5月押题导向卷(一)语文试卷(含答案及解析)
- 2026中国土地征收补偿机制改革与社会稳定风险评估报告
- 2026年《医疗器械质量管理规范》培训试题及答案
- 2026年四川省安全员-A证每日一练试卷1套附答案详解
- 代理记账行业内部规章制度
- 2026年青岛市市级机关遴选考试笔试试题(含答案)
- 工程项目经理奖惩制度
- (2025年)汽车电工电子技术试题+参考答案
- 初中三年级数学《网格背景下无刻度直尺作图-几何直观与逻辑推理的深度融合》教案
- 财报思维:写给忙碌者的财报学习书阅读记录
评论
0/150
提交评论