版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文字识别神经网络相关技术理论基础综述目录 1 1 1 2 2 2 3 5 5 61.1Flask框架介绍在本系统中,采用Flask作为后端框架进行编编写的轻量级Web应用框架,是基于PythonWebServerGatewayInterface(WSGI)本系统前端主要采用Vue框架与Element-ui来进行封装组成。Vue是渐进式从未起到了从前端其中创建HttpRequest,从前后端发出http请求,支持拦截相应、讲述转换为JSON数据等。Element-ui是基于Vue实现的组件库,它可以是1.3汉字数据集由于汉字与英文在本质上的不同,国内暂时并未追赶上国外系统的发展。一方面是因为国内起步较晚,另一方面是因为中文识别比英文识别复杂很多。汉字作为世界上最古老的语言之一,从甲骨文一直发展到现在的集音、形和义为一体的简体汉字,在结构上,存在着许多不同结构的方块字,并且在数量级上,有大概十几万个汉字,与仅存在36个英文字母的英文相比,两者之间难度的区别可见一斑。随着时代的发展,文字识别应用在越来越多方面,也有越来越多学者开始研究文字方面的技术,并且国内外开展了许多比赛,创造了大量数据集。从上个世纪发展到现在,出现了许多优秀的训练集。在英文字符字符集方面,ICDAR竞赛为识别提供了大量优秀的字符集,如ICDAR2012与ICDAR2015,二者都包含了大量的训练集图片与测试集图片,图片中的文字都是水平方向,在文字识别方面有了很大的应用。在中文识别方面,也涌现出了众多优秀的字符集,如ReadingChineseTextintheWild(RCTW),次数及采用是场景识别;还用本系统中所使用的SyntheticChineseStringDataset是一个拥有360万张训练图片,5824个字符,对于机器学习来说,训练集足够,但是存在场景比较简单,并且是印刷字体;CASIA手写汉字训练集包括CASIA-HWDB与CASIA-OLHWDB,其中HWDB为手写单子样本,含有3895135个手写汉字,所有文本样本都已经存为灰度图像,按书写人序号分别存储,OLHWB含有3912017个手写单字样本,其中的所有文字和文本样本存为笔画序列,按照书写人序号分别存储。1.4文字检测从计算机科学与技术发展开始到现在,在文字检测方面,出现了许许多多优秀的算法,不同的算法在不同的应用场景所达到的检测水平是不同的,本节简单概述一下文字检测算法,并解释文字识别的基础神经网络。随着深度学习的崛起,人们将文字识别分为了大概两个部分:文字检测与文字识别。其中文字检测是文字识别的前提,只有将文字检测到以后,才能够识别出文字,因此,文字检测就显得十分重要。在机器学习得到发展以后,先在文字识别都是基于深度学习对文字进行检测。做出反应3。神经网络最基本的单位神经元(neuron)模型,神经元接收到来自n个其他神经元传递过来的输入信号,对输入信号进行处理,球的处输入信号的总强度,然后根据神经元本身的阈值,确定转移特性。现在说常用的神经元为“M-P神经元模型”,其结构如图2-1所示:连通域的文本检测方法和基于纹理的文字检测方法。并人发现文字笔画的宽度接近常数的特点,基于此提出了一种基于笔画宽度变换 (StrokeWidthTransform,SWT)的算法。这种算法局限性十分强,只能根据人工设置的参数与规则,对水平文字进行检测。同年,LukasNeumCNN)的发展推动了目标检测任务的研究,出现了越来越多的神经网络与复杂多学者提出了具体的解决问题的解决方案:2016年LiaoM等人设想出ProposalNetwork,CTPN),通过特征提取与连接上下文信息,更好的实现水平四种算法的优缺点如表2-1所示:算法名称优点缺点使用场景升文本检测很好检测水平方向文字非水平方向检测效果差水平方向文本检测向文字长文本框检测效果不好旋转方向文本检测进行端到端的文本检测检测字,因此经过综合对比,本系统采用CPTN进行文本检1.5文字识别经过文字识别之后,那么接下来就需要将文字进行识别。随着时代的发展与神经网络的崛起,越来越多文字识别神经网络应用在我们日常生活中,不同的场景下文字识别各有优缺点,本节文字识别所基于最基本的神经网络,并且简单概述一下文字识别算法。文字识别在上个世纪就曾经大火,由最开始邮件文字识别到场景中的文字识别再到文档文本中的文字识别,随着计算机科学与技术的发展与深度学习的崛起,文字识别技术又有了质的飞跃。但是文字识别的都是在基本最的两个神经网络实现的,下面将会分别介绍这两种神经网络。卷积神经网络6(ConvolutionNeuralNetworks,CNN)是神经网络中的一种,是现在应用比较广泛的一种深度学习模型,并且成为了语音识别与图像识别领域的研究热点。该模型通过模拟人眼观察图像或人耳听取音频的机制,即它的权值神经网络类似于生物神经网络,从而降低了网络模型的复杂度,减少了权值的数量。并且从边缘特征、低纬度纹理到高级语义特征,以及静态图像的特点,从本人降低了网络参数,因此CNN在网络输入时多为图像时表现得十分明显。直接将图像作为输入,从而避免了在传统特征提取中复杂的数据重建与特征提取的过程。现如今卷积神经网络在已经得到了充分了应用,对于图像识别来说具有划时代的意义,具有很高的价值,现在已经称为图像识别甚至计算机视觉的主流。卷积神经网络有五个层级结构,分别实输入层,输出层,卷积层,激活层,池化层和全连接层。在识别时所对应结构模型如图2-2所示:数据层16*10*10数据层16*10*10数据层16*5*56*14*14池化卷积池化输入图像节点数输出10数据层全连接层卷积除了卷积神经网络外,在深度学习中,循环神经网络[7](RecurrentNeural1997年,ZhouJ⁸等人构建了一个n元贝叶斯最大似然分类器,此方法将颜向下的文字识别方法。2014年BaiX¹1等人通过借助字典使用动态K邻近(K-NearestNeighborhoods,KNN算法,学习字符的笔画和结构特征,利用预先现代文字识别中都有应用,如我们常说的长短期记忆网络(LSTM)、联合主义时间分类器(CTC)以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电气管理考核制度
- 电子商务客户关系管理(AIGC版) 课件 第7、8章 电子商务客户服务管理体系构建、电子商务智能客服系统应用
- 2026年工程施工技术交底创新方法模拟试卷
- 基孔肯雅热防控责任落实测试题库单选题及答案解析
- 第7讲 习题课一匀变速直线运动推论和应用(学生版)
- 2026年注册水利水电工程师考试题库及答案
- 2025年山西省晋中市检察官、法官入员额考试真题(附答案)
- 2026年自考03205急救护理学试题及答案
- 2026年事业编医疗类中医骨伤模拟试卷
- 2025浙江嘉兴市海宁市黄湾村级创业创新投资开发有限公司招聘1人笔试历年备考题库附带答案详解
- 农村宅转让合同
- 载货汽车主减速器设计及三维建模
- 癫痫病人的护理业务学习
- 广西壮族三月三主题作文800字
- 2024届高考英语语法填空模拟题-传统文化篇(含答案)
- RTK使用原理及应用
- 身份证籍贯对照表(自动)
- 颅内高压患者的监护
- 铁道概论高职PPT完整全套教学课件
- 医生进修申请表(经典版)
- 100+华为云高层主打胶片-华为云+智能+见未来
评论
0/150
提交评论