CN110555372A 数据录入方法、装置、设备及存储介质 (深圳壹账通智能科技有限公司)_第1页
CN110555372A 数据录入方法、装置、设备及存储介质 (深圳壹账通智能科技有限公司)_第2页
CN110555372A 数据录入方法、装置、设备及存储介质 (深圳壹账通智能科技有限公司)_第3页
CN110555372A 数据录入方法、装置、设备及存储介质 (深圳壹账通智能科技有限公司)_第4页
CN110555372A 数据录入方法、装置、设备及存储介质 (深圳壹账通智能科技有限公司)_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像输入预先训练的图像文本识别模型进行文本识别,以输出与所述边界图像对应的文本信2提取所述文本区域在所述待处理图像内的边界框将所述边界图像输入预先训练的图像文本识别模将所述文本信息输入预先训练的关键词提取模型进行关将所述文本信息和与所述文本信息对应的关键词存储至对所述待处理图像中的文本区域进行识别,以获取所述文本区根据所述尺寸信息和位置信息确定所述文本区域的将至少一个所述分词分别输入预先训练好的关键词提取根据所述重要性权重,选取与所述重要性权重对应的根据所述查询关键词匹配所述目标数据库中的关键词,基于卷积神经网络,根据所述文本图像样本进行模型训练以得到图像文本识别模型,3边界框提取模块,用于提取所述文本区域在所述文本识别模块,用于将所述边界图像输入预先训练的图像文本识别模型进行文本识关键词提取模块,用于将所述文本信息输入预数据录入模块,用于将所述文本信息和与所述文本信息对所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1456[0040]需要说明的是,在本实施例中,使用GoogLeNet进行模型训练以得到目标识别模[0047]用随机值初始化所有过滤器和参数/权重;卷积神经网络将训练的样本数据作为据通过大规模迭代训练,让卷积神经网络在学习图片语义信息后输出每个文本的输出概率,使用输出概率与标定数据(groundtruth)的定义损失函数(loss),在模型训练中尽量78[0069]例如:从边界图像中识别出的文本信息为:本合同有效期自2017年6月28日起至2019年6月28日。经过关键词提取模型进行关键词提取,得出对应的关键词为:生效日期9[0087]请参阅图6,图6是本申请实施例提供的另一种数据录入方法的步骤示意流[0098]由于所接收的合同可能会有多种旋转角度,因而需要将合同在获得文本信息对应的分类类别后,可以确定目标数据库中与该分类类别对应的子数据[0126]在一个实施例中,边界框提取模块502包括区域识别子模块5021和边界框确定子[0128]文本识别模块503,用于将所述边界图像输入预先训练的图像文本识别模型进行[0129]关键词提取模块504,用于将所述文本信息输入预先训练的关键词提取模型进行与所述重要性权重对应的所述分词作为所述[0133]数据录入模块505,用于将所述文本信息和与所述文本信息对应的关键词存储至[0134]请参阅图10,图10是本申请的实施例还提供另一种数据录入[0140]文本识别模块603,用于将所述边界图像输入预先训练的图像文本识别模型进行[0141]类别确定模块604,用于将所述文本信息输入预先训练的文本分类模型进行类别[0142]关键词提取模块605,用于将所述文本信息输入预先训练的关键词提取模型进行[0150]非易失性存储介质可存储操作系统和计算机程序。该计算机用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(Smart

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论