CN114005126B 表格重构方法、装置、计算机设备及可读存储介质 (成都数联云算科技有限公司)_第1页
CN114005126B 表格重构方法、装置、计算机设备及可读存储介质 (成都数联云算科技有限公司)_第2页
CN114005126B 表格重构方法、装置、计算机设备及可读存储介质 (成都数联云算科技有限公司)_第3页
CN114005126B 表格重构方法、装置、计算机设备及可读存储介质 (成都数联云算科技有限公司)_第4页
CN114005126B 表格重构方法、装置、计算机设备及可读存储介质 (成都数联云算科技有限公司)_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

由贸易试验区高新区吉泰五路88号32对所述表格图像进行检测与识别,获得多个文本框各自对应的文本内容和布局信息,根据所述文本内容、所述布局信息以及所述行表格线的坐标和所述列表格线的坐标,对所述表格图像进行检测与识别,获得多个文本框各自对应的文本内容和布局信息,根据所述多个文本框各自对应的所述位置信息,确定所述多个文本分别从所述行标签序列和所述列标签序列中确定行根据所述行分界位置,确定所述多个文本框各自对应的所述行序号,根据所述多个文本框各自对应的所述位置信息,确定所述多个将所述多个文本框按照所述第一方向上的子坐标的大小进行排将所述多个文本框按照所述第二方向上的子坐标的大小进行排分别对所述第一特征图和所述第二特征图进行直线检测3根据所述行序号和所述列序号,生成文本矩阵,并将所述文本内根据所述文本矩阵中每一行和每一列存在的文本框的位置信根据所述文本矩阵中每一行和每一列存在的文本框的位置信息,确将所述行表格线的坐标分别与所述每一行的行平均中心坐标和所述每一列的列平均将所述列表格线的坐标分别与每一列的列平均中心坐标和每一行的行平均中心坐标识别模块,用于对所述表格图像进行检测与识别,获得多个文4重构模块,用于根据所述文本内容、所述布局信息以及所述行表格线的坐所述识别模块,具体用于对所述表格图像进行文本识别,分别获得所述识别模块,还具体用于将所述多个文本框分别沿第一方向和第二方述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现权利要求1-9任一56序列顺序与第二文本框序列的序列顺序一致;分别对行标签序列和列标签序列进行解析,[0012]通过上述技术方案中可以迅速、准确的确定出每个文本框对应的行序号和列序[0019]在可选的实施例中,根据文本矩阵中每一行和每一列存在的文本框的位置信息、7处理器执行时实现如前述实施方式任一项的表8[0040]图9为本发明实施例提供的一种按垂直方向和水平方向对文本框进行排序的示例9[0056]终端120可以实时制作或者生成上述文字资料,并将文字资料实时上传到数据库[0059]请继续参见图1,针对上述具有表格信息的文字资料,为了获得可编辑的表格文别能力的电子设备获得如图4所示的表格图像,进而发送给本发明实施例提供的计算机设该表格区域特征图是采用二值化处理的待识别图像,其中图像中的白色区域即为表格区图6为本发明实施例提供的步骤S202的实现方式的示意性流程图,步骤S202可以包括以下y34c和yc的计算方式为:[0087]在一种可能的实施方式中,上述步骤S202-2可以通过预测模型的示意图,行预测模型的输入是第一文本框序列内每个文本框对应的位置信息,输出结果是行标签序列,行标签序列的序列顺序与第一文本框序列的序列顺序一致,也就是[0098]本实施例中,获得第二文本框序列的方式与上述获得第一文本框序列的方式类2=62=y2=48和终止位置指得的是某一行或者是某一列。[0117]步骤2,将行表格线的坐标分别与每一行的行平均中心坐标和每一列的列平均中2=5)与第一行的行平均中心坐[0120]步骤3,将列表格线的坐标分别与每一列的列平均中心坐标和每一行的行平均中[0140]需要说明的是,本发明实施例提供的表格重构装置300中的各个功能模块可以软件或固件(Firmware)的形式存储于存储器中或固化于计算机设备的操作系统(Operating于与其他节点设备进行信令或数据的通信。在本发明中该计算机设备130可以具有多个通[0142]其中,存储器133可以是但不限于,随机存取存储器(RandomAccessMemory,理器,包括中央处理器(CentralProcessingUnit,CPU)、网络处理器(Network

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论