版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 II一、背景介绍 11.1.研究背景 11.3.本课题主要的研究内容 1二、图像预处理 22.1.彩色图像的灰度化 22.2.灰度图像的二值化 22.3.梯度锐化 22.4.去离散噪声 22.5.归一化调整 3三、模式识别 33.1.特征提取 33.2.BP神经网络 33.2.1.BP算法的多层感知器 33.2.2.BP算法过程 43.3.BP神经网络设计与训练 63.3.1.BP神经网络的设计方法 63.3.2.神经网络仿真程序设计 63.3.3.神经网络测试。 6四、仿真实验的结果 7五、总结 8参考文献 92.5.归一化调整因为扫描的字符大小存在差异而对同一尺寸的图像进行识别准确率高一些,所以要进行归一化调整。归一化方法是先得到原来字符的高度,并与系统要求的高度比较,得出高度变换系数,然后根据这个系数得到变换后应有的宽度,得出高度、宽度后,把新图像里的点按照插值的方法映射到原图像,为了以后特征提取方便,进行BP网络训练时缩短训练时间,高和宽不宜设置过大。这里取高为m,宽为n。三、模式识别3.1.特征提取经过预处理,把原来大小不同、分布不规律的各字符变成大小一样、排列整齐的字符。下面要从预处理完的字符中提取最能体现这一个字符的特征向量,将提取出的训练样本中的特征向量代入BP网络中就可以对BP网络进行训练。提取出待识别的样本中特征向量代入训练好的BP网络中就可以进行识别。在这里采取逐像素特征提取法,方法是对图像进行逐行逐列扫描,当遇到黑色像素时,取其特征值为1,当遇到白色像素时,取其特征值为0。这样扫描结束后就形成一个维数与图像中像素点的个数相同的特征向量矩阵。3.2.BP神经网络3.2.1.BP算法的多层感知器采用BP算法的多层感知器是至今为止应用最广泛的神经网络,在多层感知器的应用中,一般习惯将单隐层感知器称为三层感知器,所谓三层包括了输入层、隐层和输出层。三层BP神经网络如图2所示。图2三层BP网三层感知器中,输入向量为,隐层输出向量为,输出层输出向量为,期望输出向量为,输入层到输出层的权值为,隐藏层到输出层的权值矩阵为,各层之间的信号关系如下:对输出层有:对隐藏层有:上式中,变换函数f(x)均为单极性sigmoid函数F(x)具有连续可导的特点,以上共同构成三层感知器的数学模型3.2.2.BP算法过程(1)初始化对权值矩阵W、V赋随机数,将样本模式计数器p和训练次数计数器q置为1,误差E置0,学习率η设为0~1内的小数,网络训练后达到的精度设为一个正的小数。(2)输入训练样本对,计算各层输出用当前样本对X,d序列赋值(3)计算网络输出误差设共有P对训练样本,网络对于不同的样本具有不同的误差:采用均方根误差作为总误差:(4)计算各层误差信号·(5)调整各层权值(6)检查是否对所有样本完成一次轮训若p<,P,计数器p、q增1,返回步骤(2),否则转步骤(7)。(7)检查网络总误差是否达到精度要求初始化给定输入向量和目标输出求隐层和输出层各单位输出求目标值与实际输出偏差E初始化给定输入向量和目标输出求隐层和输出层各单位输出求目标值与实际输出偏差E求隐层单元误差求误差梯度权值学习E满足要求?全部E满足要求结束YYN图3BP学习算法的流程图3.3.BP神经网络设计与训练3.3.1.BP神经网络的设计方法按照BP神经网络设计方法选用两层BP网络。采用newff函数来建立BP网络。其输入节点数为16×16=256,隐层传输函数为Sigmoid函数。假设用一个输出节点表示10个数字,则输出层传输函数为pureline,隐层节点数为,取25。3.3.2.神经网络仿真程序设计构造训练样本集,并构成训练所需的输入向量p和目标向量t.通过画图工具获得数字。本例构造了新宋体12号、8号字体各10个,黑体12号、8号各10个,及宋体加粗18号字体。3.3.3.神经网络测试。由于图像处理的复杂性,对于不同噪声的污染选择不同的方法,选择没有噪声的数字进行测试。选择训练样本中的任意数据进行测试,结构非常正确。选择生成的新宋体8号大小的数字进行测试。结果正确,选择其他类型的字体进行测试,则结果不是完全正确。四、仿真实验的结果简单起见,只对含有单独数字的图片样本进行识别,不涉及分割字符等前期处理。使用BP网络进行数字识别的流程如下:首先利用大量的训练样本来训练网络,以得到以文件形式保存的权值。训练样本为精心选择的可以很好地反映样本可分特性的已知数据。将训练样本图片进行特征提取后,就可以送入BP网络进行训练。其次,训练完BP网络后就可以用它对未知数据进行识别了。首先要经过预处理,然后进行特征提取,最后送入BP网络直至得出结果。数字识别效果如图4、5、6所示。图4数字0的识别效果图5数字4的识别效果图6数字9的识别效果五、总结数字识别是多年来的研究热点,将神经网络应用于数字识别是神经网络应用最为成功的方面之一,人工神经网络在模式识别问题上,相比其他传统方法有其优势:要求对问题的了解较少;可以对特征空间进行较复杂的划分;适用于高速并行处理系统来实现。本课题结合神经网络技术,对数字识别问题进行了探讨和研究,主要研究成果如下:(1)针对数字数据,首先进行了灰度化、二值化、平滑去噪、归一化、细化等常规预处理,然后对处理完的数字图像进行特征提取,提取了能体现字符特点的特征向量。(2)针对数字识别问题,研究了BP神经网络分类器的建立和识别过程。仿真结果表明,对于字体和字号与训练样本集相同的测试样本,无论图像中的数字在什么位置,都可以识别出来,而对于字体和字号与训练样本集不同的测试样本,只有一部分能正确识别。并且对于带有噪声的数字,运行程序的实验结果是不理想的,所以本课题程序有待于进一步的整理和调试。为提高识别率,可以增加训练样本,或通过增加字体的特征向量等途径来解决。参考文献[1]李望晨.BP神经网络改进及其在手写数字识别中的应用.第3-4页.哈尔滨工业大学硕士学位论文,2006.6[2]刘长安.《人工神经网络的研究方法及应用》电子工业出版社出版,2004.7[3]R.C.Gonzales等.《阮秋崎等译.数字图像处理》电子工业出版社出版,2002.5[4]王正林,刘明.精通MATLAB7[M].北京:电子工业出版社,2006.7[5]瞿海金.手写体数字识别方法的研究与实现南京理工大学硕士学位论文,2005.6[6]杨述斌.图像边缘检测技术概述[J].武汉化工学院学报,2003,25(1):73—76.[7]章毓晋.图像工程(上册)一图像处
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纸箱纸盒制作工岗前工作效率考核试卷含答案
- 预拌混凝土中控工岗前设备性能考核试卷含答案
- 钻石检验员岗前安全实践考核试卷含答案
- 电线电缆拉制工岗前安全风险考核试卷含答案
- 园艺生产技术员岗前流程考核试卷含答案
- 支护锚喷工岗前技能认知考核试卷含答案
- 纺丝原液制造工持续改进模拟考核试卷含答案
- 重点大学考试题库及答案
- 贵州省毕节市2026届高三上学期第一次适应性考试数学试题
- 零售商店布局设计与营销策略指南
- 2024-2029全球及中国超精密机床行业市场发展分析及前景趋势与投资发展研究报告
- 冲压设备的维护与保养
- 消防职业道德教育课件
- 数学史全套课件
- 2021市政工程资料表格填写范例样本
- 高空作业专项施工方案
- 成都建筑装饰装修工程设计收费标准
- GB/T 6117.1-1996立铣刀第1部分:直柄立铣刀的型式和尺寸
- GB/T 16301-2008船舶机舱辅机振动烈度的测量和评价
- GB/T 1185-2006光学零件表面疵病
- 商务星球版七年级下册地理知识点归纳
评论
0/150
提交评论