版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于大语言模型的多模态文档结构化处理本发明公开了一种基于大语言模型的多模本数据与特征提取后的非文本数据进行多模态2S1、接收输入的多模态文档,所述多模态文档包S51、将融合后的多模态特征矩阵Mr输入至预先训练的改进BERT模型执行深度语义分非文本实体节点En表示从图像和图表非文本数据中提取的示文本描述与图像中对象之间关系的边和表示图表数据与文g2.根据权利要求1所述的一种基于大语言模型的多模态文档结构化处理与知识提取方3S13、对输入的文本数据Td和非文本数据Nd进行初步数S14、根据识别结果,将文本数据Td和非文本数据Nd分3.根据权利要求1所述的一种基于大语言模型的多模态文档结构化处理与知识提取方S21、使用基于上下文注意力机制的词汇匹配算αi和βi分别表示全局词典匹配权重和上下文相似度权重,W(Tdi)表示词典中的词条匹配得S24、使用基于双向长短期记忆和条件随机场的实体识别模型对经过句法分析的文本4.根据权利要求1所述的一种基于大语言模型的多模态文档结构化处理与知识提取方4d表示输入的图像数据,Ilk表示图像中的第l层和第k个特征点,wlk表示权重参5.根据权利要求1所述的一种基于大语言模型的多模态文档结构化处理与知识提取方m5其中,βij表示融合后的权重系数,Lm(Ta)田(VBsg)表示文本数据词与图像及图表特6.根据权利要求1所述的一种基于大语言模型的多模态文档结构化处理与知识提取方S632、基于梯度下降算法优化节点权重和边权重,迭代更新节点和边的权重值u"和和分别表示损失函数L对节点权重和边权重的偏导数;gg6在信息提取和知识表示方面存在明显的局限性,尤其是在需要自动化处理大量非结构化、[0005]本发明的一个目的在于提出一种基于大语言模型的多模态文档结构化处理与知[0006]根据本发明实施例的一种基于大语言模型的多模态文档结构化处理与知识提取[0011]S5、通过预先训练的改进BERT模型对所述融合后的多模态数据进行深度语义分7[0022]S21、使用基于上下文注意力机制的词汇匹配算法对接收的文本数据Td进行分词di与上下文词Tj的相似度;[0031]S24、使用基于双向长短期记忆和条件随机场的实体识别模型对经过句法分析的8g)表示图表数据元素与其标签之间的关联关系g9[0053]其中,βij表示融合后的权重系数,Lm(Taun)B(viBsg)表示文本数据词与图像及[0055]S51、将融合后的多模态特征矩阵Mr输入至预先训练的改进BERT模型执行深度语括表示文本描述与图像中对象之间关系的边和表示图表数据与文本描述之间gg[0068]S632、基于梯度下降算法优化节点权重和边权重,迭代更新节点和边的权重值和和分别表示损失函数L对节点权重和边权重的偏导数;gg[0079](1)本发明通过将文本数据与非文本数据进行融合处理,提出了基于改进BERT模[0080](2)在本发明的技术方案中,基于图结构学习模型对知识图谱的节点权重和边权[0083]图1为本发明提出的一种基于大语言模型的多模态文档结构化处理与知识提取方[0101]S21、使用基于上下文注意力机制的词汇匹配算法对接收的文本数据Td进行分词di与上下文词Tj的相似度;[0110]S24、使用基于双向长短期记忆和条件随机场的实体识别模型对经过句法分析的g)表示图表数据元素与其标签之间的关联关系g[0132]其中,βij表示融合后的权重系数,Lm(Tan)田(VBsg)表示文本数据词与图像及[0134]S51、将融合后的多模态特征矩阵Mr输入至预先训练的改进BERT模型执行深度语gg示文本描述与图像中对象之间关系的边和表示图表数据与文gg[0147]S632、基于梯度下降算法优化节点权重和边权重,迭代更新节点和边的权重值和uy":和分别表示损失函数L对节点权重和边权重的偏导数;gg[0165
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026长沙惠湘禽业有限公司招聘3人建设考试参考试题及答案解析
- 2026上海荣庆堂实业发展有限公司招聘2人建设考试备考题库及答案解析
- 2026山东威海市立第三医院招聘152人建设考试备考题库及答案解析
- 2026南方科技大学生物医学工程系招聘建设考试备考试题及答案解析
- 2026大连金普新区两家公立医院公开选聘17人建设考试备考题库及答案解析
- 2026舟山希尔船舶工程有限公司招聘3人建设考试参考试题及答案解析
- 2026四川泸州枫叶佳德学校招聘建设考试备考题库及答案解析
- 2026年东营港经济开发区卫生类事业单位人才引进(6人)建设笔试备考试题及答案解析
- 2026湖南湘西泸溪县妇幼保健计划生育服务中心招聘高校见习生建设考试参考题库及答案解析
- 2026贵州磷化(集团)有限责任公司春季社会招聘228人建设笔试备考题库及答案解析
- 横山县众源煤矿矿山地质环境保护与土地复垦方案
- 打造宜居城市创造舒适宜居的居住环境
- 信阳职业技术学院单招《职业技能测试》参考试题库(含答案)
- 全麻术后舌后坠护理
- 跨期入账整改报告
- 适老化工程改造合同范本
- 离婚协议书电子版下载
- 社会调查方法练习题与答案
- 张培基散文佳作108篇详解
- 2023年初中体育与健康学科优质课评选活动方案(预)
- GB/T 9341-2008塑料弯曲性能的测定
评论
0/150
提交评论