CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通 用软件有限公司)_第1页
CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通 用软件有限公司)_第2页
CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通 用软件有限公司)_第3页
CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通 用软件有限公司)_第4页
CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通 用软件有限公司)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)国家知识产权局(12)发明专利韩华兵韩嘉懿刘振刘士朋所(普通合伙)11716专利代理师王彬一种基于知识图谱的交互式智能分析方法、设备及介质本说明书实施例公开了一种基于知识图谱进行意图检测,确定对应的意图模糊置信度,以根据意图模糊询通道,通过精准查询通道,调用预学习的查询模21.一种基于知识图谱的交互式智能分析方法,其特征在于,所述方法包括:获取用户输入的自然语言查询文本,对所述自然语言查询文本进行意图检测,确定对应的意图模糊置信度,以根据所述意图模糊置信度,匹配目标查询通道;当所述目标查询通道为引导查询通道时,通过预学习构建的业务知识图谱,对所述自然语言查询文本进行路径推导,生成个性化分析卡片序列,以获取用户触发的所述个性化分析卡片序列中的目标分析维度;在所述目标分析维度的触发下,将所述引导查询通道切换为精准查询通道,通过所述精准查询通道,调用预学习的查询模式知识库生成所述目标分析维度对应的目标查询语通过预学习构建的业务知识图谱,对所述自然语言查询文本进行路径推导,生成个性对所述自然语言查询文本进行实体提取,确定对应的至少一个业务实体;以每个所述业务实体为中心,在所述业务知识图谱中进行动态路径探索,确定实时探索路径,以获取所述实时探索路径对应的路径参数,其中,所述路径参数包括路径节点在所述业务知识图谱中的总连接边数和所述探索路径对应的边权重参数;通过所述总连接边数和所述边权重参数,动态计算所述实时探索路径对应的动态路径得分,以基于所述动态路径得分进行路径筛选,确定多个目标分析路径;获取所述用户的用户历史交互信息,基于所述用户历史交互信息,对所述多个目标分析路径进行用户维度匹配,确定每个所述目标分析路径对应的推荐指数;根据每个所述目标分析路径的推荐指数和预先获取的所述用户对应的推荐数量,生成所述个性化分析卡片序列,其中,所述个性化分析卡片序列包括多个符合预设要求的指定目标分析路径对应的分析维度。2.根据权利要求1所述的一种基于知识图谱的交互式智能分析方法,其特征在于,对所述自然语言查询文本进行意图检测,确定对应的意图模糊置信度,具体包括:对所述自然语言查询文本进行分词处理,以确定词向量特征,并对所述自然语言查询文本进行句法解析,提取句法结构特征;确定所述词向量特征对应的词向量序列,以捕获双向上下文依赖关系;利用多头注意力机制对所述双向上下文依赖关系和所述句法结构特征进行融合,并输查询文本对应的意图模糊置信度。3.根据权利要求1所述的一种基于知识图谱的交互式智能分析方法,其特征在于,通过预学习构建的业务知识图谱,对所述自然语言查询文本进行路径推导,生成个性化分析卡获取历史查询信息,并通过预设的数据库元数据接口自动抽取全量业务数据表,其中,所述全量业务数据表包括表信息、字段信息和数据类型;通过预先设置的预学习框架,根据所述全量业务数据表和所述历史查询信息,构建多层级知识库,其中,所述多层级知识库包括业务知识图谱、业务字段语义知识库和查询模式知识库。4.根据权利要求1所述的一种基于知识图谱的交互式智能分析方法,其特征在于,基于3所述用户历史交互信息,对所述多个目标分析路径进行用户维度匹配,确定每个所述目标分析路径对应的推荐指数,具体包括:统计所述用户历史交互信息对应的历史查询维度,以基于所述历史查询维度,构建所述用户的用户画像特征向量,并确定用户对应的交互偏好类型,其中,所述交互偏好类型包括探索型用户和保守型用户;根据每个所述目标分析路径对应的分析维度,确定所述分析维度对应知识节点的嵌入向量和所述用户画像特征向量,对所述目标分析路径进行个性化匹配,确定每个所述目标分析路径对应的个性化匹配指标;统计所述用户历史交互信息中所述分析维度在预设历史时间周期内的被推荐次数,通过所述被推荐次数计算所述分析维度相对于所述用户的曝光频率,以确定每个所述目标分析路径对应的新颖性匹配指标;统计所述分析维度在所述预设历史时间周期内的累计查询次数,以通过所述累计查询次数计算所述分析维度对应的热度指标;通过所述用户对应的交互偏好类型,匹配对应的权重参数组合,以基于所述权重参数组合,对所述个性化匹配指标、所述新颖性匹配指标和所述热度指标进行加权,确定每个所述目标分析路径对应的推荐指数。5.根据权利要求1所述的一种基于知识图谱的交互式智能分析方法,其特征在于,根据每个所述目标分析路径的推荐指数和预先获取的所述用户对应的推荐数量,生成所述个性化分析卡片序列之前,所述方法还包括:获取引导查询通道对应的历史推荐数据;对所述历史推荐数据进行统计分析,确定所述引导查询通道在每次交互过程中对应的历史推荐维度数量,通过所述历史推荐维度数量和历史交互次数,确定推荐数量均值;获取所述用户历史交互信息中的历史推荐维度信息和历史选择维度信息,根据所述历史选择维度信息中的选择维度顺序标识和所述历史推荐维度信息中的历史推荐数量的比通过所述个性化选择推荐比例,对所述推荐数量均值进行修正,确定所述用户对应的推荐数量。6.根据权利要求1所述的一种基于知识图谱的交互式智能分析方法,其特征在于,通过所述精准查询通道,调用预学习的查询模式知识库生成所述目标分析维度对应的目标查询对所述目标分析维度进行意图识别,提取所述目标分析维度中的业务实体和意图识别结果,以将所述业务实体在预学习构建的业务字段语义知识库中进行映射,确定实体链接通过所述查询模式知识库,根据所述意图识别结果和所述实体链接结果,确定查询语对所述查询语句模板进行语法优化,以确定所述目标分析维度对应的目标查询语句。7.根据权利要求3所述的一种基于知识图谱的交互式智能分析方法,其特征在于,通过预先设置的预学习框架,根据所述全量业务数据表和所述历史查询信息,构建多层级知识4根据所述全量业务数据表,构建初始模式图数据,根据所述历史查询信息中的历史查询频率,对所述初始模式图进行边权重分配,确定业务模式图数据;根据预先训练的深度图学习模型和所述业务模式图数据,确定表级数据结构的业务知识图谱;通过字段级语义建模层,提取所述全量业务数据表中字段的多模态语义特征,基于所述多模态语义特征,构建多维相似度矩阵,其中,所述多维相似度矩阵包括字段名称相似根据预先获取所述全量业务数据表中的字段特征描述符和所述多维相似度矩阵,利用注意力增强的自编码器,确定字段语义向量,以构建业务字段语义知识库;在所述历史查询信息中,获取高频查询模式数据,以对所述高频查询模式数据中的查通过预设的语义编码器,对所述语句语法树进行语义转换,确定所述查询语句的查询语义信息,以根据所述查询语义信息和所述字段语义向量,构建查询模式知识库,其中,所述查询模式知识库包括多个查询语句模板和每个所述查询语句模板对应的查询语义信息;根据所述表级数据结构的业务知识图谱、所述业务字段语义知识库和所述查询模式知8.一种基于知识图谱的交互式智能分析设备,其特征在于,所述设备包括:与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-7任一所述的方法。9.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:执行如权利要求1-7任一所述的方法。5一种基于知识图谱的交互式智能分析方法、设备及介质技术领域[0001]本说明书涉及数据处理技术领域,尤其涉及一种基于知识图谱的交互式智能分析背景技术[0002]当前商业智能领域存在用户认知与系统能力之间的显著鸿沟。传统商业智能BI工具依赖用户预先构建完整分析思路,要求掌握SQL等专业查询语言,导致非技术人员使用门槛过高。现有交互式分析工具呈现两极分化态势,基础问答系统仅支持简单指令(如“查询销售额”),无法处理复杂对话;而具备高阶分析能力的系统需强制用户分步确认分析维度、过滤条件等参数,将自然语义拆解为离散输入序列,破坏交互流畅性,导致人机协同效率低下,也进一步增加了使用门槛。传统系统缺乏主动分析路径推导能力。当用户提出模糊请求时,需依赖人工经验逐步探索,导致分析效率低下。综上可知,传统的交互式的智能分析过程对用户交互过程中的输入内容要求较高,针对模糊输入的场景无法基于业务逻辑推荐关发明内容[0003]本说明书一个或多个实施例提供了一种基于知识图谱的交互式智能分析方法、设备及介质,用于解决如下技术问题:传统的交互式的智能分析过程对用户交互过程中的输入内容要求较高,针对模糊输入的场景无法基于业务逻辑推荐关联分析维度,导致分析效率低下。[0004]本说明书一个或多个实施例采用下述技术方案:[0005]本说明书一个或多个实施例提供一种基于知识图谱的交互式智能分析方法,所述方法包括:获取用户输入的自然语言查询文本,对所述自然语言查询文本进行意图检测,确定对应的意图模糊置信度,以根据所述意图模糊置信度,匹配目标查询通道;当所述目标查询通道为引导查询通道时,通过预学习构建的业务知识图谱,对所述自然语言查询文本进行路径推导,生成个性化分析卡片序列,以获取用户触发的所述个性化分析卡片序列中的目标分析维度;在所述目标分析维度的触发下,将所述引导查询通道切换为精准查询通道,通过所述精准查询通道,调用预学习的查询模式知识库生成所述目标分析维度对应的目标查询语句,以通过所述目标查询语句,确定对应的可视化分析结果。[0006]本说明书一个或多个实施例提供一种基于知识图谱的交互式智能分析设备,包[0009]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。[0010]本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机6[0011]本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:通过本说明书实施例中的技术方案,用户无需掌握SQL等专业查询语言,只需输入自然语言查询文本,降低了非技术人员使用商业智能工具的门槛;通过对自然语言查询文本进行意图检测和模糊置信度确定,能自动匹配目标查询通道,在引导查询通道中,利用业务知识图谱进行路径推导,生成个性化分析卡片序列,无需用户分步确认分析维度、过滤条件等参数,避免了将自然语义拆解为离散输入序列,从而保持了交互的流畅性,提升了人机协同效率;在用户触发个性化分析卡片序列中的目标分析维度后,切换到精准查询通道,调用查询模式知识库生成目标查询语句,并确定可视化分析结果,从引导到精准的查询方式,既让用户在模糊需求阶段能得到引导和启发,又能在明确需求后快速获取精准的可视化分析结果,整个交互过程自然流畅,符合用户的思维习惯;基于业务知识图谱进行动态路径探索,能够主动为用户推荐关联分析维度,无需依赖人工经验逐步探索,大大提高了分析效率;当用户确定目标分析维度后,精准查询通道利用预学习的查询模式知识库生成目标查询语句,快速获取可视化分析结果,减少了用户等待时间,进一步提高了分析效率。附图说明[0012]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的[0013]图1为本说明书实施例提供的一种基于知识图谱的交互式智能分析方法的流程示[0014]图2为本说明书实施例提供的一种基于知识图谱的交互式智能分析设备的结构示具体实施方式[0015]为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。[0016]本说明书实施例提供一种基于知识图谱的交互式智能分析方法,需要说明的是,本说明书实施例中的执行主体可以是服务器,也可以是任意一种具备数据处理能力的设备。图1为本说明书实施例提供的一种基于知识图谱的交互式智能分析方法的流程示意图,[0017]步骤S101,获取用户输入的自然语言查询文本,对自然语言查询文本进行意图检[0018]对该自然语言查询文本进行意图检测,确定对应的意图模糊置信度,具体包括:对该自然语言查询文本进行分词处理,以确定词向量特征,并对该自然语言查询文件进行句7自动终止训练。虽然最大训练轮次设定为30,8[0021]步骤S102,当目标查询通道为引导查询通道时,通过预学习构建的业务知识图谱,对自然语言查询文本进行路径推导,生成个性化分析卡片序列,以获取用户触发的个性化分析卡片序列中的目标分析维度。[0022]通过预学习构建的业务知识图谱,对该自然语言查询文本进行路径推导,生成个性化分析卡片序列之前,该方法还包括:获取历史查询信息,并通过预设的数据库元数据接口自动抽取全量业务数据表,其中,该全量业务数据表包括表信息、字段信息和数据类型;通过预先设置的预学习框架,根据该全量业务数据表和该历史查询信息,构建多层级知识库,其中,该多层级知识库包括业务知识图谱、业务字段语义知识库和查询模式知识库。通过预先设置的预学习框架,根据该全量业务数据表和该历史查询信息,构建多层级知识库,具体包括:根据该全量业务数据表,构建初始模式图数据,根据该历史查询信息中的历史查询频率,对该初始模式图进行边权重分配,确定业务模式图数据;根据预先训练的深度图学习模型和该业务模式图数据,确定表级数据结构的业务知识图谱;通过字段级语义建模层,提取该全量业务数据表中字段的多模态语义特征,基于该多模态语义特征,构建多维相似度矩阵,其中,该多维相似度矩阵包括字段名称相似度、数据分布相似度和内容重叠度;根据预先获取该全量业务数据表中的字段特征描述符和该多维相似度矩阵,利用注意力增强的自编码器,确定字段语义向量,以构建业务字段语义知识库;在该历史查询信息中,获取高频查询模式数据,以对该高频查询模式数据中的查询语句进行转换,确定语句语法树;通过预设的语义编码器,对该语句语法树进行语义转换,确定该查询语句的查询语义信息,以根据该查询语义信息和该字段语义向量,构建查询模式知识库,其中,该查询模式知识库包括多个查询语句模板和每个该查询语句模板对应的查询语义信息;根据该表级数据结构的业务知识图谱、该业务字段语义知识库和该查询模式知识库,确定多层级知识库。[0023]在本说明书的一个实施例中,采用数据集预学习框架,通过深度学习与知识图谱技术的融合,实现对企业数据资产的全方位语义建模。预学习框架的底层基础是表级知识获取层,表级知识获取层采用改进的图结构学习算法对数据库模式进行建模。首先通过数构建初始的模式图(SchemaGraph),其中节点表示表或字段,边表示表间关系(如外键约表间关系分配权重值,反映其在实际业务中的重要性。需要说明的是,表级知识获取层采用了基于R-GCN(RelationalGraphConvolutionalNetwork)的深度图学习模型进行训练,输入为原始模式图,输出为每个表和字段的低维向量表示,此处的维度可以为256,训练过程采用了边预测任务作为自监督学习目标,通过最小化三元组损失函数优化模型参数。具体地对于每个已知关系(表A,关系类型,表B),模型需要预测给定(表A,关系类型)时最可能的表B。通过表级知识获取层得到表级数据结构的业务知识图谱。[0024]中间层是字段级语义建模层,用于捕获字段间的语义关联,解决术语差异与概念映射问题。首先通过采样分析各字段的实际数据内容,生成字段特征描述符。对每个字段随机抽取1000条记录,对于大表则按比例抽样,通过统计分析提取数据分布特征,包括数据类于文本类字段,还应用了TF-IDF和Wor度矩阵,采用了创新性的多模态相似度计算方法,综合考虑字段名称相似度(基于Word2Vec9嵌入)、数据分布相似度(基于分布参数的Jensen-Shannon散度)和内容重叠度(基于min-hash算法)。字段级语义建模层的核心模型采用注意力增强的自编码器(Attention-enhancedAutoencoder)架构,输入为字段特征描述符与相似度矩阵,输出为512维的字段语义向量,以构建业务字段语义知识库。训练采用重建损失与对比学习损失的加权组合,前者确保编码信息的保真度,后者确保语义相似的字段在嵌入空间中的接近性。[0025]最上层是查询模式挖掘层,查询模式挖掘层用于从历史查询数据中提取高频查询模式和业务分析范式。首先建立了一个专用的SQL解析引擎,将历史查询数据中的原始SQL语句转换为抽象语法树(AST)。解析过程采用改进的ANTLR4语法解析器实现,支持复杂SQL结构的精确提取,包括嵌套子查询、窗口函数和复杂聚合。随后,通过树编辑距离算法对语转换为768维的向量表示,捕获查询的语义意图而非仅关注语法结构。该编码器采用层次化制融合整体语义。模型训练采用对比学习框架,正样本对为语义等价的不同SQL表达,如通过SQL规范化工具生成的变体,负样本为不同语义意图的SQL。训练数据包含来自实际系统查询模式知识库。需要说明的是,在查询模式知识库中包含查询语句模板和每个查询语句模板对应的查询语义信息,此处的查询语义信息对应的即为查询语句的查询业务模式。[0026]需要说明的是,三层架构间的数据流转遵循自下而上的处理流程与信息增强机制。表级知识层首先构建基础的数据结构图谱,该图谱作为字段级语义层的输入,与字段内容特征共同指导语义向量的学习。字段语义向量进一步作为查询模式挖掘层的辅助特征,模式中提取的常用表字段组合反馈至字段层,优化字段语义相关性判断;而字段间发现的新语义关联也会更新至表层,丰富图谱结构。整个框架通过异步更新策略保持最新状态,默认配置下表层每周更新一次,字段层每三天更新一次,查询层每日更新,确保系统能够及时适应数据模式和业务需求的变化。[0027]最终预学习框架的输出是一个多层级知识图谱,以GraphQL接口形式提供服务。该接口支持三种核心查询模式,首先给定自然语言描述,返回最相关的表和字段(支持Top-K查询);其次,给定部分表字段组合,推荐语义相关的扩展字段;另外,给定分析意图描述,推荐最匹配的查询模式模板。接口层实现了高效的向量检索机制,采用分层可导航小世界(HierarchicalNavigableSmallWorld,HNSW)算法构建近似最近邻索引,平均查询延迟控制在15ms以内,满足实时交互需求。此外框架部署支持两种模式,在线学习模式和批处理模式。在线学习模式下,系统能够从交互反馈中持续学习,实时更新字段语义和查询模式;批处理模式则适用于大规模数据模式变更场景,触发全量重建。在实际应用中,两种模式通常结合使用,定期执行批量更新,日常维持增量学习,兼顾系统稳定[0028]通过上述多层级预学习架构,能够构建起企业数据资产的完整语义画像,为后续的自然语言查询理解和SQL生成提供坚实的知识基础。实际部署结果表明,预学习框架的引入使系统在处理复杂业务查询时的准确率提升了35.2个百分点,特别是在处理涉及专业术语、隐式关联和多表联合分析的场景中表现出显著优势。[0029]通过预学习构建的业务知识图谱,对该自然语言查询文本进行路径推导,生成个性化分析卡片序列,具体包括:对该自然语言查询文本进行实体提取,确定对应的至少一个业务实体;以每个该业务实体为中心,在该业务知识图谱中进行动态路径探索,确定实时探索路径,以获取该实时探索路径对应的路径参数,其中,该路径参数包括路径节点在该业务知识图谱中的总连接边数和该探索路径对应的边权重参数;通过该总连接边数和该边权重参数,动态计算该实时探索路径对应的动态路径得分,以基于该动态路径得分进行路径筛选,确定多个目标分析路径;获取该用户的用户历史交互信息,基于该用户历史交互信息,对该多个目标分析路径进行用户维度匹配,确定每个该目标分析路径对应的推荐指数;根据每个该目标分析路径的推荐指数和预先获取的该用户对应的推荐数量,生成该个性化分析卡片序列,其中,该个性化分析卡片序列包括多个符合预设要求的指定目标分析路径对应的分析维度。[0030]当目标查询通道为引导查询通道时,通过预学习构建的业务知识图谱,对该自然语言查询文本进行路径推导,生成个性化分析卡片序列。在本说明书的一个实施例中,对用户输入的自然语言查询文本进行多维度解析,利用领域实体识别模型提取核心业务实体,实体识别模型可以基于双向长短期记忆网络与条件随机场建,准确识别行业专属术语,如进行匹配,确定每个实体在图谱中的节点位置。例如,当用户输入“分析畅销产品特征”时,提取“产品”作为核心实体,并定位至知识图谱的“商品主体”节点。以每个业务实体节点为中心,采用双向广度优先搜索算法在图谱中进行多跳路径探索,最大跳数设置为三级关联。在探索过程中实时采集路径参数,包括节点度数和边权重参数。其中,节点度数用于反映当前节点在图谱中的连接密度,度数越高表示业务关联性越广泛。对于每条探索路径,动态计算路径得分,计算公式为,其中,Wrel为关系权重,di为 i节点的节点度数,综合考量边权重的正向贡献与节点度数的反向调节作用,确保高权重、低干扰的路径获得优先推荐资格。得分低于预设阈值的路径将被自动过滤,保留多条高价值候选路径。调取此用户的用户历史交互记录,基于用户历史交互信息,对该多个目标分析路径进行用户维度匹配,确定每个该目标分析路径对应的推荐指数。按照每个该目标分析路径的推荐指数由大到小的顺序对多个目标分析路径进行排序,依次获取用户对应的推荐数量个目标分析路径,生成该个性化分析卡片序列,每张卡片可以包含以下元素,首先是分析维度说明,以业务术语描述分析逻辑,如“区域销售对比:按地理层级分解销售额”;还包括参数控件和数据预览,参数控件提供交互式调节组件,如时间范围选择器、指标权重滑块;数据预览展示该维度下的样例数据分布图表。分析维度说明以业务术语描述分析逻辑,便于用户理解;参数控件提供交互式调节组件,允许用户根据自己的需求进行个性化设置;数据预览展示该维度下的样例数据分布图表,让用户在进行详细分析之前对数据有一个直观的了解,个性化的分析卡片序列能够提高用户的使用体验,帮助用户更高效地获取所需信息。[0031]通过上述技术方案,运用领域实体识别模型能精准识别自然语言查询文本中的核心业务实体,特别是行业专属术语,对提取的实体进行标准化处理并与预构建的业务知识图谱匹配,可确定实体在图谱中的节点位置,有助于将用户的自然语言查询转化为知识图谱中的具体节点和关系,以业务实体节点为中心,采用双向广度优先搜索算法在知识图谱11中进行多跳路径探索,能在合理的范围内全面探索与业务实体相关的路径,避免过度搜索或遗漏重要信息,通过多跳路径探索,可以发现业务实体之间的潜在关系和间接关联;在探索过程中实时采集路径参数,并动态计算路径得分,综合考量了边权重的正向贡献与节点度数的反向调节作用,确保高权重、低干扰的路径获得优先推荐资格,有效筛选出最有价值的路径,减少后续分析的工作量;调取用户的历史交互记录,基于用户历史交互信息对多个目标分析路径进行用户维度匹配,确定每个目标分析路径对应的推荐指数,使得推荐的分析路径能够充分考虑用户的个性化需求和偏好,提高推荐的准确性和相关性;按照推荐指数由大到小的顺序对目标分析路径进行排序,依次获取用户对应的推荐数量个目标分析路径,生成个性化分析卡片序列,通过精准的实体提取、高效的路径探索与筛选以及个性化的推荐,避免了对大量无关信息的分析,在模糊输入的场景,基于业务逻辑自动推荐关联分析维度,实现了从模糊需求到精准分析的智能引导。[0032]基于该用户历史交互信息,对该多个目标分析路径进行用户维度匹配,确定每个该目标分析路径对应的推荐指数,具体包括:统计该用户历史交互信息对应的历史查询维度,以基于该历史查询维度,构建该用户的用户画像特征向量,并确定用户对应的交互偏好类型,其中,该交互偏好类型包括探索型用户和保守型用户;根据每个该目标分析路径对应的分析维度,确定该分析维度对应知识节点的嵌入向量和该用户画像特征向量,对该目标分析路径进行个性化匹配,确定每个该目标分析路径对应的个性化匹配指标;统计该用户历史交互信息中该分析维度在预设历史时间周期内的被推荐次数,通过该被推荐次数计算该分析维度相对于该用户的曝光频率,以确定每个该目标分析路径对应的新颖性匹配指标;统计该分析维度在该预设历史时间周期内的累计查询次数,以通过该累计查询次数计算该分析维度对应的热度指标;通过该用户对应的交互偏好类型,匹配对应的权重参数组合,以基于该权重参数组合,对该个性化匹配指标、该新颖性匹配指标和该热度指标进行加权,确定每个该目标分析路径对应的推荐指数。[0033]在本说明书的一个实施例中,首先调取用户的历史交互记录,统计其在预设周期(如30天)内选择的分析维度及操作特征,包括但不限于查询维度类型、参数调整频率、结果导出次数等。基于历史查询维度的分布规律,采用特征工程方法构建用户画像特征向量,该向量综合反映用户在业务领域的关注重点与操作习惯。例如,频繁使用“区域销售对比”且常调整时间范围的用户,其特征向量在空间维度和时间维度上呈现显著权重。进一步通过度尝试频率、查询条件修正次数、结果导出多样性等,构建多维特征矩阵,采用聚类算法将用户划分为探索型与保守型两类,其中探索型用户表现为高频尝试新分析维度、主动调整复杂查询参数等行为模式,保守型用户则呈现出重复使用固定分析模板、较少修改默认设置的操作特征。[0034]针对每个候选分析路径,进行三重指标评估,将用户画像特征向量与目标分析维度对应的知识节点嵌入向量进行相似度比对,此处的相似度比对方式可以是余弦相似度。知识节点嵌入向量通过预训练的图神经网络生成,表征该维度在业务图谱中的语义位置。相似度计算反映用户历史偏好与当前分析维度的契合程度,以此得到个性化匹配指标。统计该分析维度在近期(如7天)内对当前用户的曝光次数,采用反比例函数计算新颖性值,新颖性值为历史时间周期内该维度被推荐次数。基于全平台用户在同期内对该分析维度的累计使用次数,通过归一化处理量化其流行程度,其中高热值维度反映业务场景的共性需求。根据用户所属偏好类型动态调整指标权重,针对不同偏好类型预设差异化权重模板,探索型用户采用"新颖性主导"权重组合,如新颖性权重0.5、个性化匹配0.3、热度0.2,对探索型用户,赋予新颖性指标更高权重,守型用户采用"热度优先"权重组合,如热度权重0.6、个性化匹配0.3、新颖性0.1,对保守型用户,侧重热度指标,优先推荐成熟分析方法。同时建立动态调节机制,实时监测用户近期交互数据中的行为偏移迹象,如保守型用户连续选择新维度达3次即触发类型重分类,自动调整权重模板的激活强度。并设置反馈学习回路,通过A/B测试对比不同权重组合在同类用户群体中的推荐效果,选取点击率提升超过15%的优化方案更新至权重策略库,形成持续进化的权重配置体系。将三项指标按预设权重组合加权求和,生成最终推荐指数,并依此对候选路径排序。通过深度融合用户行为特征与业务知识图谱,实现了从历史行为到个性推荐的精准映射。[0035]根据每个该目标分析路径的推荐指数和预先获取的该用户对应的推荐数量,生成该个性化分析卡片序列之前,该方法还包括:获取引导查询通道对应的历史推荐数据;对该历史推荐数据进行统计分析,确定该引导查询通道在每次交互过程中对应的历史推荐维度数量,通过该历史推荐维度数量和历史交互次数,确定推荐数量均值;获取该用户历史交互信息中的历史推荐维度信息和历史选择维度信息,根据该历史选择维度信息中的选择维度顺序标识和该历史推荐维度信息中的历史推荐数量的比值,生成个性化选择推荐比例;通过该个性化选择推荐比例,对该推荐数量均值进行修正,确定该用户对应的推荐数量。[0036]在本说明书的一个实施例中,获取引导查询通道的历史推荐数据,通过统计分析确定每次交互过程中推荐维度的数量分布特征,计算历史推荐维度数量的算术平均值作为基础推荐量。进一步提取用户历史交互记录中的推荐与选择日志,统计用户在过往推荐列表中实际选择维度的顺序位置与推荐总数的比例关系,生成个性化选择推荐比例指标。例如,某用户某次在推荐列表为6个时选择第三位,则其对应的当次选择推荐比例指标为3/6为0.5,在另一个历史交互过程中,在推荐列表为8个时,选择第5位,则对应的当次选择推荐比例指标为5/8为0.625,统计每次交互过程对应的当次选择推荐比例,计算历史交互过程中的最大选择推荐比例指标。将该比例指标与基础推荐量进行乘积之后进行向上取整,确定最终推荐数量。例如,A用户对应的最大选择推荐比例指标为0.5,B用户对应的最大选择推荐比例指标为0.625,基础推荐量为8个,则对A用户来说,需要推荐4个可满足历史交互过程中的最大比例指标,而B用户需要推荐5个。[0037]通过上述技术方案,通过分析引导查询通道的历史推荐数据,能了解到一般情况下每次交互合适的推荐维度数量。在此基础上,结合用户自身历史交互数据中的选择维度信息,计算个性化选择推荐比例,考虑到了不同用户对推荐内容的接受和选择偏好;根据用户的个性化选择推荐比例对推荐数量均值进行修正,避免了统一固定推荐数量的一刀切做法,以不同用户的最大选择推荐比例指标与基础推荐量相乘并向上取整来确定最终推荐数量,能为每个用户提供更符合其自身需求的推荐数量;使推荐数量更具个性化和动态性,既考虑了整体的历史推荐情况,又兼顾了每个用户的独特交互行为。[0038]步骤S103,在目标分析维度的触发下,将引导查询通道切换为精准查询通道,通过精准查询通道,调用预学习的查询模式知识库生成目标分析维度对应的目标查询语句,以通过目标查询语句,确定对应的可视化分析结果。[0039]在本说明书的一个实施例中,生成个性化分析卡片序列之后呈现给用户,在每个卡片中配备相应的参数调节控件,如价格区间滑块、地理层级选择器等。获取用户触发的个性化分析卡片序列中的目标分析维度,此处的用户触发操作是指用户在个性化分析卡片序列中选择的目标分析维度。[0040]在本说明书的一个实施例中,在目标分析维度的触发下,通过动态路由机制,将引导查询通道切换为精准查询通道,通过精准查询通道,调用预学习的查询模式知识库生成目标分析维度对应的目标查询语句,以通过目标查询语句,确定对应的可视化分析结果。需要说明的是,两个通道之间的切换由动态路由机制控制,该机制基于置信度阈值做出决策。例如在金融风险评估场景下,当用户输入模糊的查询意图时,系统会自动切换到引导通道,通过可视化卡片帮助用户逐步明确分析维度,待用户选定具体分析方向后,再切换到精准通道执行详细的数据查询。[0041]通过该精准查询通道,调用预学习的查询模式知识库生成该目标分析维度对应的目标查询语句,具体包括:对该目标分析维度进行意图识别,提取该目标分析维度中的业务实体和意图识别结果,以将该业务实体在预学习构建的业务字段语义知识库中进行映射,确定实体链接结果;通过该查询模式知识库,根据该意图识别结果和该实体链接结果,确定查询语句模板;对该查询语句模板进行语法优化,以确定该目标分析维度对应的目标查询[0042]在本说明书的一个实施例中,当目标查询通道为精准查询通道,或切换至精准查询通道时,生成目标查询语句的方式如下:在精准查询通道中基于预训练大规模语言模型与数据集预学习知识的深度融合,实现从自然语言到SQL的端到端转换,显著提升了系统的语义理解深度与SQL生成精度。引入上下文感知的查询理解机制和数据集特定的知识注入,解决了传统方法在处理复杂业务逻辑、多维度分析和非标准表达等场景下的瓶颈问题。大模型在进行SQL生成时,会自动检索并整合预学习阶段获取的多层级知识库,主要包括:数语义知识库,也可称为实体-关系知识,如表间关联、字段映射和业务式知识库,包含频繁查询模式、常用聚合方式和典型业务场景的查询模板。这些结构化知识通过特殊的编码方式被嵌入到模型的提示词输入序列中,使大模型能够在保持其强大语义理解能力的同时,精确把握特定业务域的数据特性和查询约束。[0043]首先是实体链接与意图识别阶段,在精准查询通道中说明用户查询需求是清楚的,模型将用户查询中的业务实体与数据模式中的表和字段进行精确映射,同时提取核心SQL精化与优化阶段,通过迭代细化初始SQL,插入适当的子查询、窗口函数和高级SQL结构,同时结合数据库优化器反馈对生成的SQL进行性能调优,确保查询的高效执行。[0044]此外,除了上述方式之外,还可以构建问答知识库的方式确定目标查询语句。针对智能问答系统中问题答案对的自动生成与模式抽象难题,通过自动标注和人工审核的有机结合,实现了高质量问答对的规模化生成和标准化管理。[0045]在自动标注阶段,基于预先建立的多层预学习架构,自动识别数据特征并生成符合业务逻辑的候选问题。首先基于大模型创建自动触发任务,当系统中导入数据集时,系统从数据字段和业务规则中提取关键信息,将这些信息转化为自然语言问题,并生成相应的SQL查询语句或结构化答案。为了提升生成问题的多样性和真实性,采用了创新的对抗训练机制。在这一机制中,生成器负责产生不同表达方式的问题变体,而判别器则负责评估这些问题的合理性和可用性。通过生成器和判别器的反复博弈训练,能够不断优化问题生成的质量和多样性。在人工审核阶段,设计可视化标注平台,支持业务专家对自动生成的问题进行系统性审核和优化。该平台提供直观的界面,使专家能够方便地对问题进行修正、合并相查询通道切换为精准查询通道时,将目标分析维度转换为对应的问题描述,通过转换后的问题描述在问答知识库中匹配对应的查询语句。通过查询语句实现分析结果的可视化展[0046]本说明书实施例以零售数据分析场景作为示例进行说明,当用户输入“分析畅销

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论