百度大规模知识图谱构建和应用_第1页
百度大规模知识图谱构建和应用_第2页
百度大规模知识图谱构建和应用_第3页
百度大规模知识图谱构建和应用_第4页
百度大规模知识图谱构建和应用_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

•百度知识图谱概览•知识图谱技术及应用•通用知识图谱•事件图谱•视频理解图谱•行业知识图谱•技术及数据开放知识图谱:让机器像人类一样理解客观世界的基石实体属性评论配图念…知识图谱基本结构实体属性评论配图念…签平台日均图检索服务量垂类领域知识图谱 通用知识图谱 平台日均图检索服务量垂类领域知识图谱 通用知识图谱 通用/行业知识图谱+多元异构 知识图谱知识图谱全流程平台化规模化落地索知识图谱 知识图谱服务规模增长千倍发布知识中台规模化行业落地•2017年获中国电子学会科技进步一等奖•2020年获第21届中国专利奖银奖知识图谱谱知识生产谱知识生产各产品线•日均响应400亿次请求201220132014201520162017201820192020用技术掘补全与扩展识表示解析识计算识推理识图谱认知解析用技术掘补全与扩展识表示解析识计算识推理识图谱认知解析识挖掘据引入识获取知识图谱识收录模型识整合建归一生产平台生产平台开放平台平台•百度知识图谱概览•知识图谱技术及应用•通用知识图谱•事件图谱•视频理解图谱•行业知识图谱•技术及数据开放图谱识图谱识••从简单实体拓展到复杂事件•描述动态、时序、空间、条件、概率等关系••开放领域海量数据图谱构建及应用••多媒体、跨媒体新的媒体形态••面向医疗、法律、金融、媒体等强专业性知识•一站式行业知识图谱构建、计算和应用平台图谱识图谱识••从简单实体拓展到复杂事件•描述动态、时序、空间、条件、概率等关系••开放领域海量数据图谱构建及应用••多媒体、跨媒体新的媒体形态••面向医疗、法律、金融、风控等强专业性知识•企业知识中台及行业知识图谱应用数据驱动的本体自动构建自底向上的知识体系自动归纳知识体系数据驱动的本体自动构建自底向上的知识体系自动归纳知识体系扩大30倍无无标签大数据开放知识挖掘基于远监督学习的训练语料构建千亿级文本开放知识抽取基基于多源数据的知识整合开放域下数十亿实体的归一融合练语料刚刚出任故宫博物院院长判定的王旭东王旭东出任故宫博物院院长…知识王文松出任常务副市长练语料刚刚出任故宫博物院院长判定的王旭东王旭东出任故宫博物院院长…知识王文松出任常务副市长分析S-职务-OS+V(出任)+O板获取料王旭东-职务-故宫博物院院长知识自学习将知识体系的自动发现与开放知识挖掘结合,从海量数据中自动学习知识,实现知识体系构建从人工Top-Down•先人工定义Schema体系,之后按照Schema建设事实数据。•Schema全人工构建,准确性、专业性、完备性较高,适合于头部垂类数据的构建尾的知识收录困难Bottom-Up•先收集大量的开放事实,自动归纳为Schema数据,同步进行事实收录•开放Schema整个构建过程,全部由算法自动化生成模知识图谱构建0Up=数据融合幻学特亲售量4.5亿本詹姆特特恩J.K.琳 类型4.5亿本者幻学特人公销售量=数据融合幻学特亲售量4.5亿本詹姆特特恩J.K.琳 类型4.5亿本者幻学特人公销售量特特詹姆特敏格兰杰亲亲特友歧者一JJ.K.琳特人公父亲友人公父亲友友敏格兰杰问题表达UGC、众包什么时候能看魔兽,问题泛化实体检索张柏芝的身高魔问题表达UGC、众包什么时候能看魔兽,问题泛化实体检索张柏芝的身高魔兽世界上映时间知识推理、计算Zippo能否带上飞机谢霆锋的儿子的妈妈的身高热门无法在线覆盖的问题无法在线覆盖的问题门魔兽啥时候出魔魔兽啥时候出魔兽哪一天公映语义解析一个b一个翅膀的是什么车端到端在线问答开开放领域问答挖掘形容不会说话的成语与美人鱼相关的电影长尾头部长尾知识图谱 (徐峥,职业,演员) (徐峥,代表作,人在囧途) 峥,学校,上海戏剧学知识图谱 (徐峥,职业,演员) (徐峥,代表作,人在囧途) 峥,学校,上海戏剧学文本和知识融合的阅读理解模型Q:人在囧途是谁的代表作?泰囧、港囧、疯狂的石头、人在囧途知识表示文本表示知识表示基于文本表示的阅读理解模型A:李卫A:徐峥知识图谱子图术:知识增强的机器阅读理解知识图谱子图①知识实体子图②①知识实体子图①知识表示②文本表示③知识融合hRichKnowledgeforMachineReadinghRichKnowledgeforMachineReadingComprehensionACL库禁止带上飞机集合库禁止带上飞机集合在中国境内乘坐民航班机禁止随身携带或…易燃、易爆物品,如火柴、打火机(气)、…体概念关系 zippoisA打火机Zippo能飞机诞节date5号今天请求实体短评实体长评知识检索知识计算DuerOS语音对话系统:助力DuerOS实现10大类目超过100类能力,覆盖40%+的信息满足需求搜索对话状态控制手机机器人手表汽车玩具实体图谱基于关注点图谱的语义理解与推荐内容语义理解来源车行路天下900实体侧面请求实体短评实体长评知识检索知识计算DuerOS语音对话系统:助力DuerOS实现10大类目超过100类能力,覆盖40%+的信息满足需求搜索对话状态控制手机机器人手表汽车玩具实体图谱基于关注点图谱的语义理解与推荐内容语义理解来源车行路天下900实体侧面保时捷内饰850实体/概念类保时捷820豪华suv790关注点图谱实体视频实体属性实体服务实体配图实体智能搜索:基于知识图谱,直接满足用户搜索需求,日均响应数十亿搜索DuerOS对话服务语音识别语音播报屏幕展示音箱电视冰箱空调语音识别语音播报屏幕展示对话管理知识图谱DuerOSBot框架分发效率的大幅提升虎揽胜端大气评测汽车产品定虎揽胜端大气评测汽车产品定价内饰instanceOf路虎保SUV产品品品牌汽车品汽车品牌时捷所属品牌豪豪华实体图谱SUV汽车豪华SUV保时捷保时捷MacaSUV汽车豪华SUV保时捷保时捷Macan保时捷评测汽车产品汽车汽车保时保时捷保保时捷卡宴与路虎揽胜关注点图谱图谱识图谱识••从简单实体拓展到复杂事件•描述动态、时序、空间、条件、概率等关系••开放领域海量数据图谱构建及应用••多媒体、跨媒体新的媒体形态••面向医疗、法律、金融、风控等强专业性知识•企业知识中台及行业知识图谱应用人类对客观世界的理解识事件子图关系:时序动作:离婚关系:时序实体子图合关系:恋人关系:前配偶事件人类对客观世界的理解事件子图关系:时序动作:离婚关系:时序实体子图合关系:恋人关系:前配偶事件动动作:举行婚礼恋2019.6关系:配偶在特定的时空下(时间、空间),由一个或多个角色(事件主体)参与的,围绕某个主题开展的一系列活动事事件图谱单位的知识网络事事件图谱vs实体图谱•实体图谱:实体属性/关系•事件图谱:客观世界的动态变化,侧重多实体间的动作一个子图•事件图谱与实体图谱间可以相互推断分钟级千万量级十几个盖4分钟级千万量级十几个盖4300+作事件图谱应用文本链接文本链接|多模链接事件图谱认知计算重要性计算|热度计算|质量计算|相似度计算事件关系推理|事件论元预测|事件演化预测掘共指|掘共指|时序|从属|因果事件图谱构建示事件本体建设事件名|事件类型|触发词|事件论元|论元角色新热事件检测|历史事件收录|事件判别库库数据用日志键技术:事件抽取-基于多轮阅读理解问答技术•把传统基于分类方法转化为基于阅读理解问答任务,更具通用性•通过多轮问答机制引入,利用论元之间潜在语义关系,提升准确率事件触发词识别事件论元抽取哪个词是触发词?事件触发词识别事件论元抽取哪个词是触发词?事件类型识别start/endspan:宋仲基stionAnsweringfindingsofEMNLP疫情脉络:覆盖中国近400省市、全球近200国家疫情脉络:覆盖中国近400省市、全球近200国家络图谱识图谱识••从简单实体拓展到复杂事件•描述动态、时序、空间、条件、概率等关系••开放领域海量数据图谱构建及应用••多媒体、跨媒体新的媒体形态••面向金融、风控、法律、医疗等强专业性知识•一站式行业知识图谱构建、计算和应用平台基于知识图谱的视频语义理解多模知识解析视觉分析语音识别文本理解乐演唱张进来乐器对象对象 苏阳拍摄对象音乐纪录电影对象对象宗富凯知识图谱关联与计算实体关联主题预测事件理解实体(剧名)实体(人物)实体(民间艺术)主题取景地 (大河唱,剧名) (马风山,花儿歌手) (刘世凯,说书人) (魏宗富,皮影班主) (苏阳,音乐人) (张进来,秦腔团团长) (秦腔) (皮影) (陕北说书) (花儿)音乐纪录电影西北民间艺术黄河沿线结构化语义理解信息流/好看视频-短带长索–视频主题页理解图谱应用信息流/好看视频-短带长索–视频主题页信息流信息流-落地页推荐图谱识图谱识••从简单实体拓展到复杂事件•描述动态、时序、空间、条件、概率等关系••开放领域海量数据图谱构建及应用••多媒体、跨媒体新的媒体形态••面向医疗、法律、金融、风控等强专业性知识•企业知识中台及行业知识图谱应用广泛亿人力成本客服行业知识密集型服务业广泛亿人力成本客服行业知识密集型服务业条金融行业利用率低人工构建eebase宗法律行业年数据爆炸医疗行业巨大通用知识图谱vs.行业知识图谱SPO三元组广域网构推荐、问答、展现业粒度细空间封闭注缺失、专家成本高件化系统集成计算、推理度表示能力表示能力架构产品矩阵核心功能基础技术知识中台产品技术视图产品矩阵核心功能基础技术赋能业务、助力企业提升运行效率和决策智能化水平场景行行业知识图谱平台智能知识库企业搜索决策引擎知知识生产知识组织知识获取知识应用知识计算助决策数据接入知识挖掘知识图谱知识推理景化推荐荐系统索引擎智能问答知识聚合知识标签知识关联知识分类业数据物质疗路术写作据写作医疗临床辅助决策服务(CDSS)病历语义病历语义索能分诊助断疗议病历质控符号推理产生式符号推理产生式规则推理与概率图推理深度学习基于图表征学习的关系推理算交互式问答知识图驱动的问题成谱••态知识体结构健品谱••态知识体结构健品疾病症状or体征检查手手术食执食执业药品药品药药企径建径诊诊断路径挖掘习结构化析机合接 权威教材|药典|病历|临床指南|问诊交互数据•拦截90%+的不合理用药,基层试点区域误诊/漏诊率大幅降低•••——高效判决、人机结合原告原告诉求案件情形争议焦点相似案例法规依据图谱智能庭审系统语义检索语义检索推理计算实体刻画书理解推荐模型行政实体法律类FAQ法令法规行业图谱行政实体法律类FAQ法令法规客观知识行业经验实案件行业主体知识抽取行业数据关联行业主体知识抽取行业数据关联类案要素抽取行业对象刻画行业语义标签挖掘法律知识图谱Ontology构建标准、精细、体系化的类案知识体系构建类案推荐准确率超过90%办案效率显著提升,结案率提高一倍以上业景体策采编发评全流程效率提升金融舆情分析与金融报告生成更多场景创作平台用层专题分析智能审校新闻线索智能写稿热点分析视频创作智能采编智能媒资语纠错势新闻线索智能写稿热点分析视频创作智能采编智能媒资语纠错势评论事件分析分析润色文本审核质量检测控检索现脉络溯源创作术作春联1k8k10k全4黑科技隐式关系隐式关系主题人工智能机器学1k8k10k全4黑科技隐式关系隐式关系主题人工智能机器学习15k6k3k6k缺性人工智能发展趋势3k15k类主题3k度智箱17k主题99k关系级关系材构建千万级主题图谱与多模素材库赋能20+省级以上媒体助力融媒落地知识中台赋能智慧医疗内容内容版权归百度知识图谱团队所有案提升结案效率裁裁判辅助纠纷系统••使用方案前:人工要素式填写,手工撰写文书自动推荐纠纷点、法条、类案,自动文书生成•百度知识图谱概览•知识图谱技术及应用•通用知识图谱•事件图谱•视频理解图谱•行业知识图谱•技术及数据开放基于真实应用场景百度百科文本&基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论