CN110852079B 文档目录自动生成方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第1页
CN110852079B 文档目录自动生成方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第2页
CN110852079B 文档目录自动生成方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第3页
CN110852079B 文档目录自动生成方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第4页
CN110852079B 文档目录自动生成方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

道福安社区益田路5033号平安金融中述目标文档中的内容与所述正则表达式进行对2将所述初始标题规则输入至预先构建的生成对抗网络模型中训规则;获取训练后的所述标题规则的句式主体和所述句式主体的语义槽,根据所述句式主遍历所述目标文档全部内容,将所述目标文档中的内容与所述正则表达式将所述生成模型和判别模型通过互相博弈学习得到最优化解,括所述训练后的标题规则。3.如权利要求2所述的文档目录自动生成方法,其特征在于,所述生成正则表达式之对训练后的标题规则进行语法解析,并将所述训练后的标题规则改写将构建的状态机转换成生成正则表达式所需要的格将所述目标文档的大纲结构与所述正则表达式进行对比匹配分析,若所述目标文档的文件格式为MicrosoftOff将所述初始标题规则输入至预先构建的生成对抗网络模型中训规则;3获取训练后的所述标题规则的句式主体和所述句式主体的语义槽,根据所述句式主遍历所述目标文档全部内容,将所述目标文档中的内容与所述正则表达式将所述生成模型和判别模型通过互相博弈学习得到最优化解,括所述训练后的标题规则。对训练后的标题规则进行语法解析,并将所述训练后的标题规则改写将构建的状态机转换成生成正则表达式所需要的格遍历所述目标文档全部内容,将所述目标文档中的内容与所述正则表达式将所述目标文档的大纲结构与所述正则表达式进行对比匹配分析,若4[0002]目前已有的提取文档目录的方法主要是通过POI(PointofInterest,兴趣点)读标题规则;5述文档目录自动生成程序被所述处理器执行时实现标题规则;述训练后的标题规则。建所需的状态机规则;6[0039]图3为本发明一实施例提供的文档目录自动生成装置中文档目录自动生成程序的文档目录自动生成方法的流程示意图。所述文档目录自动生成方法可以由一个装置执行,题规则。word文本等等不同类型的文本文档。本发明目的在于对所述目标文档的文本内容进行识提取目标文档中的初始标题之后,基于所述初始标题的具体形式(即初始标题实际具体所的语法为名词;所述语义逻辑是采用现代逻辑方法,揭示语言表达式及其意义之间关系,7[0054]生成模型G在获得输入的所述初始标题规则后,生成服从真实数据分布的样本G入数据集中可能包含所述目标文档的文本内容以及样本G(z)中的一种入数据是来自生成模型G还是来自真实数据即所述目标文档文本内容(此处真是数据指目判别模型D上的表现和真实数据(所述目标文档的文本内容)在D上包括所述训练后的标题规则。[0062]对所述训练后的标题规则进行语法分析,提取所述训练后的标题规则的句式主8程序对MicrosoftOffice格式档案读[0079](1)首先通过POI操作XWPFDocument中XWPFParagraph来获取目标文档的所有段[0080](2)通过xwpfPara9在一些实施例中可以是文档目录自动生成装置1的内部存储单元,例如该文档目录自动生以既包括文档目录自动生成装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于文档目录自动生成装置1的应用软件及各类数据,例如文档目录自动生[0091]处理器12在一些实施例中可以是一中央处理器(CentralProcessingUnit,称为显示屏或显示单元,用于显示在文档目录自动生成装置1中处理的信息以及用于显示[0095]图2仅示出了具有组件11-14以及文档目录自动生成程序01的文档目录自动生成器12执行存储器11中存储的文档目录自动生成程序01word文本等等不同类型的文本文档。本发明目的在于对所述目标文档的文本内容进行识提取目标文档中的初始标题之后,基于所述初始标题的具体形式(即初始标题实际具体所[0106]生成模型G在获得输入的所述初始标题规则后,生成服从真实数据分布的样本G入数据集中可能包含所述目标文档的文本内容以及样本G(z)中的一种入数据是来自生成模型G还是来自真实数据即所述目标文档文本内容(此处真是数据指目判别模型D上的表现和真实数据(所述目标文档的文本内容)在D上包括所述训练后的标题规则。[0114]对所述训练后的标题规则进行语法分析,提取所述训练后的标题规则的句式主程序对MicrosoftOffice格式档案读[0131](1)首先通过POI操作XWPFDocument中XWPFParagraph来获取目标文档的所有段[0132](2)通过xwpfPara12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序标题确定所述目标文档的标题规则。上存储有文档目录自动生成程序,所述文档目录自动生成程序可被一个或多个处理器执[0149]将所述初级文章数据集及初级摘要数据集进行词向量化及词向量编码后分别得[0150]将所述所述初

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论