CN110751143A 一种电子发票信息的提取方法及电子设备 (中电万维信息技术有限责任公司)_第1页
CN110751143A 一种电子发票信息的提取方法及电子设备 (中电万维信息技术有限责任公司)_第2页
CN110751143A 一种电子发票信息的提取方法及电子设备 (中电万维信息技术有限责任公司)_第3页
CN110751143A 一种电子发票信息的提取方法及电子设备 (中电万维信息技术有限责任公司)_第4页
CN110751143A 一种电子发票信息的提取方法及电子设备 (中电万维信息技术有限责任公司)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本发明实施例公开了一种电子发票信息的片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;对ROI截取区域进行识别操2导入增值税电子发票文件,所述增值税电子发票文件包括PDF格式的增值税电子发票将PDF类的增值税电子发票文件进行结构解析,转换为图片格式的第二增值税电子发将目标增值税电子发票文件进行预处理和几何校正包括所述图片格式的第一增值税电子发票文件和所述图片格式的第二增值税电子发票文将所述处理后的增值税电子发票文件与所述基准图将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识及选定所述目标类型的增值税电子发票的标准图片作为基准图片,制作自定义识别模板,选定一张标准的增值税电子发票的图片,所述标准的增值税电子发票的图片为完整、选定所述标准的增值税电子发票的图片上表格的外接框上4个角点作为图片对齐变换根据需求选定电子发票中的待识别区域,保存待识别区通过Hough变换提取所述平滑降噪图像中的4条外边框直线,进而计算得到外边框的43值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值税电子发票值税电子发票文件包括所述图片格式的第一增值税电子发票文件和所述图片格式的第二增值税电子发票文件;将所述处理后的增值税电子发票文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到所述收发器,用于选定目标类型的增值税电子发票,以增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值税电子发器执行时实现如权利要求1-7中任一项所述的电子发票信4[0003]传统的光学字符识别(OpticalCharacterRecognition,)技术处理流程包括以[0009]导入增值税电子发票文件,所述增值税电子发票文件包括PDF格式的增值税电子[0010]将PDF类的增值税电子发票文件进行结构解析,转换为图片格式的第二增值税电5文件包括所述图片格式的第一增值税电子发票文件和所述图片格式的第二增值税电子发[0013]将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,[0014]利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文[0019]选定所述标准的增值税电子发票的图片上表格的外接框上4个角点作为图片对齐[0023]采用高斯滤波处理对所述单通道灰度图像进行平滑降噪处理,得到平滑降噪图6模型可以识别出所述待识别区域图片中的文字信息,不再需要进行文本行分割和字符分述增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值税电子标增值税电子发票文件包括所述图片格式的第一增值税电子发票文件和所述图片格式的用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操定所述标准的增值税电子发票的图片上表格的外接框上4个角点作为图片对齐变换的基准7所述增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值税电序被处理器执行时实现如本发明实施例中第一方面及第一方面中任一可选实现方式中所件,所述增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值片格式技术,以及基于深度学习的端到端OCR技术实现了对增值税发票指定区域的文本识8识别模板的基准图片;选定所述标准的增值税电子发票的图片上表格的外接框上4个角点[0066]示例性的,导入增值税电子发票文件的导入类型分别支持单个9个角点的坐标位置与自定义识别模板中的4个角点比对,通过多级透视变换,进行几何校过Hough变换提取发票图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位件,所述增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值所述增值税电子发票文件包括PDF格式的增值税电子发票文件和图片格式的第一增值税电式的第二增值税电子发票文件;将目标增值税电子发票文件进行预处理和几何校正处理,述目标增值税电子发票文件包括所述图片格式的第一增值税电子发票文件和所述图片格所述标准的增值税电子发票的图片上表格的外接框上4个角点作为图片对齐变换的基准的边界区域以及ROI区域,使得与所述自定义识别模板尺寸保持一致,得到待识别区域图体介质(例如固态硬盘SolidStateD[0109]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式部或部分步骤。而前述的存储

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论