CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）

上传人：1*** IP属地：山西上传时间：2026-05-13 格式：DOCX 页数：76 大小：1.55MB 积分：10.8 举报 版权申诉

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）_第2页

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）_第3页

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）_第4页

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）_第5页

已阅读5页，还剩71页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

所述源图片集中选择与所述文本摘要信息语义2从多个数据源中分别获取需要创建描述信息的目标对象对应的源文本集和源图片在文本摘要模型中，对来自不同数据源的源文本进行语义按照各源文本对融合后语义的影响权重，对各源文本的语义进行融合，从所述源图片集中选择与所述文本摘要信息语义匹配的目标采用相同的编码参数，对来自不同数据源的源文本进行编码，以获将作为t时刻模型输出字段的概率最大的待取词，作为所述文本摘要将所述目标对象的背景知识文本输入所述文本摘要模型，所述背景在所述文本摘要模型中，对所述背景知识文本进行语义识别对所述源文本集对应的融合后语义以及所述背景知识文本的语义基于各源文本的语义以及各源文本对融合后语义的影响权重，计算各待取词作为t时按照所述源文本集及所述背景知识文本各自对应的融合权重，根据各待取词作为t时刻源文本语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各3将作为t时刻模型输出字段的概率最大的词，作为所述文本摘要模型对所述源图片集中的各源图片分别进行视觉质量评估，将符合预设视从备选图片中选择与所述文本摘要信息语义匹配的目标在所述视觉评估模型中，分别确定所述源图片集中的各源图根据所述各源图片各自在至少一个视觉维度下的视觉特征，分别计将视觉质量参数符合预设标准的源图片作为获取至少一组样本图片，每组样本图片标注有组内样本图片之间在视根据所述多个备选图片的内容解析结果，从所述多个备选图片中选取确定内容理解结果与目标文本摘要语句的语义匹配的备选图片所述目标文本摘要语句为所述多个文本摘要语句中的基于文本摘要语句与目标图片之间的关联关系，确定多个在组间排序的基础上，按照显示需求对各目标图片组进行组4将所述多个文本摘要语句的显示顺序和所述多个目标图片的显示顺序相关联若接收到内容选取指令，则从所述多个目标图片和所述多个文根据与所述内容选取指令匹配的目标图片和文本摘要语句，生按照各源文本对融合后语义的影响权重，对各源文本的语义进行融合，将作为t时刻模型输出字段的概率最大的待取词，作为在t时刻的输5获取所述来自不同数据源的源文本对应的背景知识文本对所述融合后语义以及所述背景知识文本的语义进行语义融合，以产生文本摘要信基于各源文本的语义以及各源文本对融合后语义的影响权重，计算各待取词作为t时按照源文本集及所述背景知识文本各自对应的融合权重，根据各待取词作为t时刻源文本语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各待取将作为t时刻输出字段的概率最大的词，作为在t时刻的输出字段，以23.一种实体对象的处理方法，其特征在于，应用于需要为对象创建描述信息的场景确定需要创建描述信息的实体对象关联的多个网络数据源，从所述多个网络数据源获取实体对象的文本数据集和图片数据在文本摘要模型中，对来自不同网络数据源的文本数据进按照各文本数据对融合后语义的影响权重，对各文本数据的语义进行融从所述图片数据集中筛选与所述关键文本数据匹配的关键图根据所述关键文本数据和关键图片数据生成所述实体对象的描述24.一种实体对象的提供方法，其特征在于，应用于需要为对象创建描述信息的场景从网页和第一数据平台获取需要创建描述信息的实体对象的文本数据集和图片数据在文本摘要模型中，对从网页和第一数据平台获取的文本数据集进行语义识6按照各文本数据对融合后语义的影响权重，对各文本数据的语义进行融从所述图片数据集中筛选与所述关键文本数据匹配的关键图根据所述关键文本数据和关键图片数据生成所述实体对基于对实体对象的搜索请求，在第二数据平台的客户端展示实体对采用相同的编码参数，行对从网页和第一数据平台获取的文本数据采用神经网络模型的注意力机制，对从网页和第一数据平台获取的文本数据进行编将所述实体对象的背景知识文本输入所述文本摘要模型，所述背景在所述文本摘要模型中，对所述背景知识文本进行语义识别基于各文本数据的语义以及各文本数据对融合后语义的影响权重按照所述文本数据集及所述背景知识文本各自对应的融合权重，根据各待取词作为t时刻文本数据语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计将作为t时刻模型输出字段的概率最大的词，作为所述文本摘要模型7从多个数据源中分别获取需要创建描述信息的目标对象对应的源文本集和源图片在文本摘要模型中，对来自不同数据源的源文本进行语义按照各源文本对融合后语义的影响权重，对各源文本的语义进行融合，按照各源文本对融合后语义的影响权重，对各源文本的语义进行融合，确定需要创建描述信息的实体对象关联的多个网络数据源，从所述多个网络数据源获取实体对象的文本数据集和图片数据在文本摘要模型中，对来自不同网络数据源的文本数据进按照各文本数据对融合后语义的影响权重，对各文本数据的语义进行融8从所述图片数据集中筛选与所述关键文本数据匹配的关键图根据所述关键文本数据和关键图片数据生成所述实体对象的描述从网页和第一数据平台获取需要创建描述信息的实体对象的文本数据集和图片数据在文本摘要模型中，对从网页和第一数据平台获取的文本数据集按照各文本数据对融合后语义的影响权重，对各文本数据的语义进行融从所述图片数据集中筛选与所述关键文本数据匹配的关键图根据所述关键文本数据和关键图片数据生成所述实体对基于对实体对象的搜索请求，在第二数据平台的客户端展示实体对处理方法、权利要求23所述的实体对象的处理方法或者权利要求24-28任一项所述的实体9指令被一个或多个处理器执行时，致使所述一个或多个处理器执行前述的数据处理方法、合来自多个数据源的与目标对象相关的源文本，并挖掘出目标对象对应的文本摘要信息，[0084]本实施例提供的数据处理方法，可应用于各种需要为对象创建描述内容的场景要信息中可能包含一个或多个文本摘要语句。文本摘要信息中可呈现目标对象的亮点知建界面；响应于内容创建界面中发生的对目标对象的内容创建指令，执行步骤100-步骤[0113]本实施例中，文本摘要模型可采用编码-解码（Encode-Decode）架构。Encode-Decode架构的思路通常为将输入的源序列编码到一个中间向量当中（此为编码过程这个中间向量是一个特定长度的编码，然后再通过这个中间向量还原成一个输出的目标序列摘要模型的训练文本中标注各源文本的影响权重以及对影响权重存在影响的文本属性信[0124]根据各源文本的语义，分别计算各源文本下各待取词作为t时刻语义解码字段的时刻语义解码字段的概率，进行加权求和，以获得取第一词作为t时刻模型输出字段的概加权求的一种示例性过程可表示为[0136]为了对背景知识文本的语义以及前述实施例中提及的源文本的语义进行语义融[0138]当然，源文本集及背景知识文本各自对应的融合权重也可由文本摘要模型确这需要在文本摘要模型训练过程中向文本摘要模型提供确定融合权重的知识经验。例如，可在文本摘要模型的训练文本中标注源文本集及背景知识文本各自对应的融合权重以及与背景知识文本下各待取词作为t时刻语义解码字段的第二概率之间的融合，而不再直接行编码以获得背景知识文本的语义编码；并可在解码过程中从背景知识文本的语义编码制，也可利用同一输出隐藏状态分别与背景知识文本及源文本集中的各源文本进行对齐，的权重分布，并根据权重分布直接对各源文本集背景知识文本各自确定出的各待取词在t时刻作为语义解码字段的概率进行加权求和，而获得各待取词在t时刻作为模型输出字段[0174]对于不对目标图片进行分组的情况，可对与文本摘要信[0180]图3为本申请一示例性实施例提供的一种文本摘要过程的[0189]图5为本申请一示例性实施例提供的一种语义匹配过程的逻辑示意图。如图5所[0196]根据与内容选取指令匹配的目标图片和文本摘要语句，生成目标对象的描述内[0200]对于目标对象的查询用户来说，该类用户可在其终端设选中其感兴趣的文本摘要语句以及目标图片，以使该类用户的终端设备产生内容选取指[0215]根据各源文本的语义，分别计算各源文本下各待取词作为t时刻语义解码字段的加权求的一种示例性过程可表示为源文本集及背景知识文本各自对应的融合权重以及对影响权重存在影响的文本属性信息，制，也可利用同一输出隐藏状态分别与背景知识文本及源文本集中的各源文本进行对齐，的权重分布，并根据权重分布直接对各源文本集背景知识文本各自确定出的各待取词在t时刻作为语义解码字段的概率进行加权求和，而获得各待取词在t时刻作为输出字段的概[0240]图7为本申请又一示例性实施例提供的一种实体对象的处理方法的流程示意图。[0249]图8为本申请又一示例性实施例提供的一种实体对象的提供方法的流程示意图。[0258]本实施例中，可在第一数据平台之外的第二数据平台展示实体对象的描述内[0262]需要说明的是，上述实施例所提供方法的各步骤的执行[0264]图9为本申请又一示例性实施例提供的一种计算设备的结[0284]根据各源文本的语义，分别计算各源文本下各待取词作为t时刻语义解码字段的[0296]按照源文本集及背景知识文本各自对应的融合权重，根据各待取词作为t时刻源文本语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各待取[0302]在一可选实施例中，处理器91在对源图片集中的各源图片分别进行视觉质量评[0333]根据与内容选取指令匹配的目标图片和文本摘要语句，生成目标对象的描述内算机程序被执行时能够实现上述方法实施例中可由计算[0347]根据各源文本的语义，分别计算各源文本下各待取词作为t时刻语义解码字段的[0356]在一可选实施例中，处理器101在对融合后语义以及背景知识文本的语义进行语[0359]按照源文本集及背景知识文本各自对应的融合权重，根据各待取词作为t时刻源文本语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各待取算机程序被执行时能够实现上述方法实施例中可由计算[0386]根据各文本数据的语义，分别计算各文本数据下各待取词作为t时刻语义解码字[0395]在一可选实施例中，处理器111在对文本数据集对应的融合后语义以及背景知识[0398]按照文本数据集及背景知识文本各自对应的融合权重，根据各待取词作为t时刻文本数据语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各[0401]在一可选实施例中，处理器111在从图片数据集中选择与关键文本数据语义匹配[0404]在一可选实施例中，处理器111在对图片数据集中的各图片数据分别进行视觉质片的内容理解结果，处理器111在从多个备选图片中选取内容理解结果与关键文本数据语[0418]在一可选实施例中，处理器111在根据关键文本数据与目标图片之间的语义匹配算机程序被执行时能够实现上述方法实施例中可由计算[0437]在文本摘要模型中，对从网页和第一数据平台获取的文[0439]在一可选实施例中，处理器121在对从网页和第一数据平台获取的文本数据进行[0448]根据各文本数据的语义，分别计算各文本数据下各待取词作为t时刻语义解码字[0455]在一可选实施例中，处理器121在对文本数据集对应的融合后语义以及背景知识[0458]按照文本数据集及背景知识文本各自对应的融合权重，根据各待取词作为t时刻文本数据语义融合字段的概率以及作为t时刻背景知识文本语义解码字段的概率，计算各算机程序被执行时能够实现上述方法实施例中可由计算以支持在计算平台上的操作。这些数据的示例包括用于在计算平台上操作的任何应用程序失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（SRAM电可擦除可编程只读存储器（EEPROM可擦除可编程只读存储器（EPROM可编程只读存储器信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所现。

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）

文档简介

温馨提示

最新文档

评论

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质 （阿里巴巴集团控股有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN113254631B 数据处理、实体对象的处理及提供方法、设备及存储介质（阿里巴巴集团控股有限公司）