CN119293230B 基于自然语言处理的图表可视化实现方法及系统 (杰软科技(集团)有限公司)_第1页
CN119293230B 基于自然语言处理的图表可视化实现方法及系统 (杰软科技(集团)有限公司)_第2页
CN119293230B 基于自然语言处理的图表可视化实现方法及系统 (杰软科技(集团)有限公司)_第3页
CN119293230B 基于自然语言处理的图表可视化实现方法及系统 (杰软科技(集团)有限公司)_第4页
CN119293230B 基于自然语言处理的图表可视化实现方法及系统 (杰软科技(集团)有限公司)_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于自然语言处理的图表可视化实现方法本申请提供一种基于自然语言处理的图表自然语言处理网络是将文本学习样例加载至拟进行调校的初始自然语言处理网络进行调校获个文本段落训练模板各自抽取获得的多个模板隐式表示和与每个模板隐式表示对应的映射数与当下文本隐式表示的融合与反馈的方式进行2获取拟进行处理的初始文本段落集合,其中,所述初始文本段落集合包将所述初始文本段落集合加载至事先调校完成的目标自然语落训练模板各自抽取获得的多个模板隐式表示以及与每个模板隐式表示对应的映射数据类型和反馈信号进行组成,所述映射数据类型用于指示一个模板隐式表示的可视化类型,文本段落训练模板的上一个文本段落训练模板一起获取到的隐根据所述识别结果集合确定所述初始文本段落集合中每一文本段落对应的识别结果,对所述多个文本段落训练模板进行第一隐式表示挖掘处理,得到第一隐式表示集合,对所述多个文本段落训练模板进行第二隐式表示挖掘处理,得到第二隐式表示集合,落训练模板对应,所述第一文本段落训练模板的上一个段落文本为第二文本段落训练模对所述第一隐式表示集合和所述第二隐式表示集合分别进行特征整基于以下操作对所述多个文本段落训练模板进行第二隐式所述第一核心文本字符集合用于在所述当下文本段落训练模板中指示所述目标可视文本对所述当下文本段落训练模板的上一个文本段落训练模板进基于所述第一核心文本字符集合和所述第二核心文本字符集合确定所述当下隐式表3基于以下操作各自确定和所述多个模板隐式表示中每个模板隐式表示对应的映射数将所述当下模板隐式表示加载至所述初始自然语言处理网络,得到基于所述当下映射数据类型和与所述当下模板隐式表示对应的模板先验标记确定所信号表征所述当下映射数据类型与所述目标可视化将预设可视化类型库中的每一可视化类型逐一与所述当下模板隐式表示一并加载到将所述第一映射值集合中最大的第一映射值对应的待选映射数据类型确定为所述当在所述将预设可视化类型库中的每一可视化类型逐一与所述当下模板隐式表示一并在所述目标探索因子符合所述事先确定的置信度要求时,型库中的待选映射数据类型作为所述当下映射在所述目标探索因子不符合所述事先确定的置信度要求时,将在所述第一映射值对应的待选映射数据类型和所述目标可视化在所述第一映射值对应的待选映射数据类型和所述目标可在所述文本学习样例中获取多个学习样例多元组,其中,所述4基于所述多个学习样例多元组对拟进行调校的初始自然语言处理网络进迭代调校时的输入为所述多个学习样例多元组中的基于以下操作通过多组学习样例多元组对拟进行调校的初始自然语言处理网络进行确定所述第y个模板隐式表示对应的文本段落训练模板是否是样例文本段落集合中的在所述第y个模板隐式表示对应的文本段落训练模板为所述末尾文本段落训练模板当所述第y个模板隐式表示对应的文本段落训练模板不为所述末尾文本段落训练模板自然语言处理网络与所述初始自然语言处理网络的网络配基于所述中间变量与所述初始自然语言处理网络的输出,确定所述8.根据权利要求7所述的方法,其特征在于,所述将预设可视化类型库中的每一可视化类型逐一与所述第y个模板隐式表示一并加载到将所述第二映射值集合中最大的第二映射值与所述第x个反馈信号的相加结果作为所一个或多个计算机程序;其中所述一个或多个计算机程序被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序被所述处理器执行时,5段落训练模板各自抽取获得的多个模板隐式表示以及与每个模板隐式表示对应的映射数据类型和反馈信号进行组成,所述映射数据类型用于指示一个模板隐式表示的可视化类6样例包括由多个文本段落训练模板各自抽取获得的多个模板隐式表示和与每个模板隐式[0009]图1是本申请实施例提供的一种基于自然语言处理的图表可视化实现方法的流程[0013]本申请实施例中基于自然语言处理的图表可视化实现方法的执行主体为计算机7计算机系统不仅获取了必要的文本数据,还确保了这些数据之间的内在关联性和有序性,由多个文本段落训练模板各自抽取获得的多个模板隐式表示以及与每个模板隐式表示对板和所述一个文本段落训练模板的上一个文本段落训练模板一起获取到8于某公司季度财报的描述,那么隐式表示就会同时考虑到当前季度和前一季度的财报数[0023]抽取隐式表示的具体方法例如包括词嵌入(WordEmbedding)、句嵌入(Sentence9系统还可能利用一些智能算法来自动调整图表的布局和元素位置,以避免信息重叠或遗板间的相关性,计算机系统可以采用多种方法。一种常见的方法是使用注意力机制模板的隐式表示外,计算机系统还可以计算它们合(加权和),也可能是一个更复杂的神经网络层,它学习[0069]在步骤S223中,计算机系统将注意力转向当下文本段落训练模板的上一个模板(即时间上或逻辑上的前一个文本段落),并对该模板执行与步骤S222相同的文本检测处“谷歌公司2022年第四季度广告收入达到45亿美元”这一模板执行文本检测处理,提取出来生成当下隐式表示。这个表示不仅包含了当下文本段落训练模板中的关键财务指标信系统可以训练一个序列模型(如LSTM或Transfo[0075]假设已经得到了第一核心文本字符集合{100,心文本字符集合转换为模型可以处理的格式。这通常涉及将文本转换为词嵌入向量序列,[0080]基于以下操作各自确定和所述多个模板隐式表示中每个模板隐式表示对应的映[0082]步骤S32:基于所述当下映射数据类型和与所述当下模板隐式表示对应的模板先[0083]步骤S31中,计算机系统的主要任务是将经过复杂处理得到的每个模板隐式表示(这些表示蕴含了文本段落中的关键财务信息及其相互关系)输入到一个已经初始化的自一定的泛化能力和鲁棒性。当计算机系统获型之后,步骤S32的任务是根据这一预测结果与模板的实际可视化类型(即模板先验标记)个当下模板隐式表示,计算机系统都会将其对应的预测映模板先验标记进行比较。这个比较过程可能是简[0088]继续前面的例子,假设网络对于模板隐式表示向量v预测的可视化类型是“折线与先验标记之间的相似度或距离。例如,如果映射数据类型以概率分布形式给出(如[0094]在步骤S311中,计算机系统将预设的可视化类型库中的每一种可视化类型(如柱反映了当前模板隐式表示与给定可视化类型的假设使用softmax函数作为映射函数的一个示例,尽管实际应用中可能选择其他类型的函类型的某种表示(如独热编码或嵌入向量)相结合。so是一个长度为100的向量v,它捕捉了某个财经新闻段落中关于公司收入变化的关键信息。[0098]通过步骤S31的实施,计算机系统能够利用预设的可视化类型库和类型映射函数述预设可视化类型库中的待选映射数据类型作为所述当下映射在验证集上的性能动态调整目标探索因子。如果模型在连续多个迭代中性能没有显著提随机选择了折线图作为当前迭代的待选映射并获取网络预测的映射数据类型作为当前迭代[0114]步骤S3121:在所述第一映射值对应的待选映射数据类型和所述目标可视化类型[0115]步骤S3122:在所述第一映射值对应的待选映射数据类型和所述目标可视化类型[0117]步骤S3121中涉及识别成功时的反馈信号生成。当第一映射值对应的待选映射数将第一反馈信号定义为1(表示成功)或'succe[0118]一旦系统确定预测的可视化类型与目标类型匹配,它会可视化类型不一致时,意味着初始自然语言处理网络未能正确识别出最适合的可视化类算两种类型在可视化特征空间中的欧氏距离),并将这个差异度作为额外的反馈信息记录样例多元组中的第x个学习样例多元组包括第x个模板隐式表示、与所述第x个模板隐式表样例通常包含文本段落(或文本段落序列)及其对应的可视化类型标签(映射数据类型)和此每个学习样例还可能包含多个连续文本段落的隐够数量的学习样例多元组之后,接下来就需要利用这些样本来调校初始自然语言处理网[0144]计算损失:根据预测结果与实际映射数据类型(即第x个映射数据类型)之间的差[0150]基于以下操作通过多组学习样例多元组对拟进行调校的初始自然语言处理网络模板为末尾模板,计算机系统接下来会根据与该模板对应的第x个反馈信号来确定初始自[0162]步骤SA2在基于自然语言处理的图表可视化实现中,确保了模型在处理序列文本段落训练模板时,基于所述第x个反馈信号与对照自然语言处理网络的输出确定所述中间[0164]在步骤SA3中,计算机系统确认当前处理的文本段落训练模板(通过其对应的第y量(如权重和偏置)与初始网络不同,因此能够提供一个独立的视角来评估当前预测的质中间变量可能是一个结合了两者预测结果的复合值,用于后续的误差计算和网络参数调号表明初始网络的预测与实际标签之间存在[0168]在步骤SA4中,计算机系统基于前面步骤(如SA2或SA3)确定的中间变量和初始自的网络配置变量,即权重(Weights)和偏置(Biases)。这一过程可以通过反向传播算法[0171]步骤SA4是模型调校过程中的关键环节,它通过计算误差值并根据误差值调整网存和使用。测财经报道中关键财务指标的可视化类型,如将描述收入变化的文本段落映射为折线图,[0175]步骤SA5是模型调校阶段的终点和模型部署的起点。通过设定最大迭代次数并严[0177]步骤SA31:将预设可视化类型库中的每一可视化类型逐一与所述第y个模板隐式[0178]步骤SA32:将所述第二映射值集合中最大的第二映射值与所述第x个反馈信号的计算机系统将当前处理的文本段落(通过第y个模板[0180]对于预设可视化类型库中的每一种类型,计算机系统将其与第y个模板隐式表示(代表当前处理的文本段落)一并加载到一个线性函数中。线性函数是一种简单的数学模[0183]对于预设可视化类型库中的每一种类型,计算机系统都会执行上述线性函数计大值反映了对照网络认为与当前文本段落最匹配的图表类型。第x个反馈信号是初始网络在之前某个迭代中对第x个模板隐式表示进行预测后得到的,它反映了预测结果与实际标[0190]步骤SA3通过结合对照自然语言处理网络的输出和第x个反馈信号来确定中间变合了最大映射值和反馈信号来生成中间变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论