版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于神经网络和集成学习的字符识别文字是人类表达和交流信息的重要工具之一,不论是在生产还是日常生活中,人们都要接触和处理大量的文字信息。字符识别能够将字符高速、快效的输入到计算机系统,实现人机交互,减轻人们的劳动,将人力从枯燥冗杂的工作中解放出来,提高处理效率,因而具有重要的研究价值。CONTENTSONE 研究意义TWO 研究相关神经网络识别文字研究的意义,目的,识别文字能够进行的相关工作。研究主要涉及的领域、研究中所使用的相关理论、以及研究所使用的技术和方法。THREE 研究结果FOUR 算法改进到目前为止,研究的结果,使用神经网络对字符进行识别能达到的效果。对前面所述的研究进行创新性的改进
2、,使得能够更高效地识别,主要有四种改进。FIVE 扩展及实际运用对算法的进行实际运用性的扩展,以及实际运用。01研究意义神经网络识别文字研究的意义,目的,识别文字能够进行的相关工作。简化文字输入字符识别能够将字符高速、快效的输入到计算机系统,实现人机交互,减轻人们的劳动,将人力从枯燥冗杂的工作中解放出来,提高处理效率,因而具有重要的研究价值。车牌号码识别车牌智能自动识别作为智能交通管理系统中的重要组成部分,应用非常广泛,高速公路收费管理、超速违章自动拍照、停车场管理、小区进出车辆管理、交通数据采集等许多系统中都需要识别车牌号码。快递信息录入快递信息录入能够极大地减轻快递工作人员文字信息录入的工
3、作,使得工作人员能够从辛苦、单一无聊的工作中解放出来,有效地加速中国快递业的发展。邮件文字录入在传统模式邮件寄送过程中,邮件的分类主要靠人工阅读并分类,再往各个地区发送,整个过程费时耗力。近年来,着计算机理论与技术为背景的人工智能运用的不断普及,使得机器录入成为现实。SIGNIFICANCE OF RESEARCH研究意义S R02研究相关研究主要涉及的领域、研究中所使用的相关理论、以及研究所使用的技术和方法。DOMAIN OF KNOWLEDGE领域D K机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专
4、门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心。人工智能(Artificial Intelligence, AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。21 世纪,已经取得了长足的进步,但是到目前为止,还没有一台计算机能产生“自我”的意识。深度学习深度学习(Deep Learning, DL)是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。机器学习人
5、工智能集成学习集成学习(ensemble learning)集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。THE TWO NEURAL NETWORK OF RECGNIZATION两种神经网络M R反向传播神经网络向传播(back propagation, BP)算法是1986年由Hinton和McClelland为首的科学家提出的概念。BP神经网络是一种采用这种算法进行高效训练的多层前馈神经网络,是目前应用最强大最广泛的神经网络之一。卷积神经网络卷积神经网络(Convolutional Neural Netwo
6、rk, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。一般包括卷积层(convolutional layer)、池化层(pooling layer)和全连接层(dense layer)。THE TWO FRAME OF NEURAL NETWORK两种框架F NTensorFlowTensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上
7、展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。KerasKeras 是一种高度模块化,使用简单上手快,合适深度学习初学者使用的深度学习框架。Keras由纯Python编写而成并以Tensorflow、Theano以及CNTK为后端。Keras为支持快速实验而生,能够把你的idea迅速转换为结果。03研究结果到目前为止,研究的结果,使用神经网络对字符进行识别能达到的效果。BP-NNBP神经网络B NCONVOLUTIONAL NEURAL NETWORK卷积神经网络B NCOMMITTEE OF NEURAL NETWORKS神经网络集成C NTHE CURVE
8、 OF ERROR误差曲线(mnist)E RTHE ERROR RATE OF RECOGNITION误差率(mnist)E R97.3%搭建BP-NN搭建组合BP-NN搭建CNN+调参搭建组合CNNInput(Batch_size*28*28) -Dense(1024) -Relu activation -Dense(10) -Softmax activation -Output(10) Input - Conv2d - Pooling - relu -Conv2d - Pooling - relu -Flat - dense - dense -OutputMulti-(Input - C
9、onv2d - Pooling - relu -Conv2d - Pooling - relu -Flat - dense - dense - Output)- Combination- Final outputMulti-(Input - Dense(1024) - Relu activation -Dense(10) - Softmax activation - Output(10) )- Combination- Final output98.3%99.1%99.4%04算法改进对前面所述的研究进行创新性的改进,使得能够更高效地识别,主要有四种改进。在传统CNN上添加了DropOut、R
10、egularization、Batch Normalization 优化层。优化层传统为sigmod、tanh,本文采用ReLU、PReLU、Leakly ReLU等激活函数激活函数传统优化器为SGD、Momentum,采用Adam优化器进行神经网络的优化优化器010203IMPROVEMENT OF ALGORITHM神经网络参数改进I A残差网络(residual network, ResNet),通过残差网络,可以把网络层弄的很深,现在达到了1000多层,最终的网络分类的效果也是令人十分满意。ResNet紧接卷积神经网络(Densely Connected Convolutional N
11、etworks,DenseNet),可以看做是ResNet的一个特例,通过紧密连接,能够减轻梯度消失。DenseNetHarmonica算法是优秀一种调参算法,十分高效,并且能够适应于几乎一切场景。在机器学习里面,调参尤其重要。HarmonicaBagging算法是一种集成学习算法。因为单一模型具有局限性,任何一种模型,都有其缺陷,通过多模型组合能够趋近完美。尽管是很简单的思想,但其所带来的效果令人惊叹。Bagging01020304IMPROVEMENT OF ALGORITHM算法改进I A 原因/理由:单一模型具有局限性 。 任何一种模型,都有其缺陷,通过多模型组合能够趋近完美。 启发:
12、某一次听说有人用多分类器跑mnist到100%正确率。一个计算天才去算10000道四则运算题,很大某一道题可能会犯错,那么他就只能算是趋近完美。但如果十个计算天才一起去做这10000道题,每道题由多数人投票决定,那么,最终的效果必定是更优秀的 。尽管是很简单的思想,但其所带来的效果令人惊叹。(Error: 0.9% - 0.6%)因为单一模型的就已经足够优秀,所以数字上反应并不明显CONBINATION CLASSIFICATION MODEL集成学习-BaggingC M1. 在参数空间中,随机采样(比如)100 个点2.对每个点计算低度数傅里叶基的特征向量,捕捉参数之间的相关性3.对于计算
13、好的 100 个特征向量,跑拉锁算法,得到(比如) 5 个重要的特征,以及这些特征对应的参数4.固定这些参数的值,得到了新的调参数问题(参数个数减少,搜索空间降低)。5. 回到第一步。重复若干轮之后,固定了很多参数的值,得到令人满意的参数Harmonica 调参算法H A论文:论文:Hyperparameter Optimization: A Spectral Approach/abs/1706.00764Instead of hoping each few stacked layers directly fit a desired underlying map
14、ping, we explicitly let these layers fit a residual mapping. Formally, denoting the desired underlying mapping as H(x),we let the stacked nonlinear layers fit another mapping of F(x): H(x)-x. The original mapping is recast into F(x)+x.并不通过简单的stack的方式把网络的深度增加就可以提高performance(因为梯度消失/弥散问题、神经退化问题(神经元或其他
15、失效)。假设原本期望的映射函数为H(x),我们让堆叠的非线性层去拟合另一个映射F(x):H(x)- x,而原来函数映射则变为F(x)+ x。学习到的F(x)即为残差。残差:残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。RESIDUAL NETWORK残差网络R N论文:论文:Deep Residual Learning for Image RecognitionCVPR2015/2016 最佳论文最佳论文 /abs/1512.03385For each
16、layer, the feature maps of all preceding layers are treated as separate inputs whereas its own feature maps are passed on as inputs to all subsequent layers.一个词概括就是:Dense,多层神经网络组合成一个Dense Block,每一个Dense Block都紧密相连。DENSELY CONNECTED CONVOLUTION NETWORK紧接卷积网络D N论文:论文:Densely Connected Convolutional NetworksCPVR2017最佳论文最佳
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高效压铸生产线升级与改造方案
- 医疗废弃物处理与回收方案
- 产业发展项目协议书
- 多肽原料药生产工艺优化方案
- 船舶环保型特种涂料生产线项目风险评估报告
- 体检中心健康协议书
- 创新智慧教学评价模式实施方案
- 销售经理合同范本模板
- 天然气管道应力分析与优化设计方案
- 交通委托服务协议书
- 无人机在野生动物保护中的监控与追踪可行性分析报告
- 2025贵州毕节市中医医院招聘暨人才引进编外聘用专业技术人员78人考试笔试模拟试题及答案解析
- 农交会营销方案
- 2024-2025学年山东省青岛市李沧区青岛版五年级上册期中测试数学试卷(无答案)
- 篮球场施工合同(标准版)
- 2025年plc电气自动化笔试题及答案
- 2025年汽车后市场汽车维修配件电商平台研究报告
- 中小企业数字化转型实施报告
- 电机与电气控制 课程思政 三相异步电动机正反转运行的控制线路
- 2025-2030高端装备制造业数字化转型实施难点分析
- (2024新版)七上第14课:丝绸之路的开通与经营西域
评论
0/150
提交评论