智搜信息教你如何看懂人工智能之知识图谱.docx_第1页
智搜信息教你如何看懂人工智能之知识图谱.docx_第2页
智搜信息教你如何看懂人工智能之知识图谱.docx_第3页
智搜信息教你如何看懂人工智能之知识图谱.docx_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智搜信息教你如何看懂知识图谱在社会网络中,一个著名的理论是:最多通过六个人,你就能够认识世界上任何一个陌生人。如果把每个人看作实体,找出人与人之间的联系,其中涉及的就是建设知识图谱的技术。 在知识图谱的眼里,这个世界长什么样什么是知识图谱,可能大家都还不是太清楚。简单来说,知识图谱就是一张由知识点相互连接而成的语义网络。它是一种人工智能技术,是基于现有数据的再加工、结构化,再通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的知识库。既然它是一张“网”,那么这张“网”又是怎样来描述我们这个世界呢?知识图谱包括三个要素:实体、事件和关系。而这些三种都包括有若干属性。这些属性,可以是事先根据过往资料就已经存在的,比如我们去查看工商信息,上面可能就有了公司的资本、股东、公司所在地等信息了;也可以是事件发生时才获取得到的。举个例子:“2015年8月26日,智搜信息技术有限公司(以下简称智搜)获得金沙江创投500万美元得Pre-A轮融资。”用知识图谱的三要素来分析,就有实体就是智搜和金沙江,事件就是融资,关系就是智搜获得金沙江的融资,或是金沙江投资了智搜。同时,这些概念也包括了各自的一些属性。比如智搜,从这句话中,就可以看出,三个属性:名字:智搜;主营业务:人工智能+资讯。同样,关系中也包括了三个属性:时间:2015年8月26日;内容:智搜获得金沙江的融资;融资金额:500万美元。当然,正如上面所说,有些属性是事先就已经有了,比如金沙江,主营业务是创投。这样看似复杂的描述,可以用知识图谱简洁地表现出来:知识图谱与传统的知识库的区别?国外的一些文献用4个单词做了总结:“From strings to things”,简单的来说就是从文本到实体,把从原来松散的文本结构变成有有关联的实体结构。继续拿谢霆锋相关的知识来举例,老的基于Topic的知识结构我们可能得到如下几个知识:1、 谢霆锋的出生年月是哪一年?答案:1980年8月29日2、 谢霆锋多大了?答案:37岁3、 谢霆锋的前妻是谁?答案:张柏芝4、 谢霆锋的现任女友是谁?答案:王菲当我们要处理上述问题:“谢霆锋前妻比现任女友小多少?”这个问题的时候不可避免的我们要按照老的结构再新增一个知识,带来了冗余穷举的问题。因此知识图谱相比传统知识体系优势:1、 具备知识推理的逻辑结构能力;上述举例:谢霆锋前妻比现任女友小多少?2、 实体、属性、关系能更好的理解语义范围域,提升上层应用例如搜索的准确率等;如何构建知识图谱?知识图谱自上世纪60年代从语义网络发展起来以后,分别经历了1980年代的专家系统、1990年代的贝叶斯网络、2000年代的OWL和语义WEB,以及2010年以后的谷歌的知识图谱。谷歌目前的知识图谱已经包含了数亿个条目,并广泛应用于搜索、推荐等领域。知识图谱的存储和查询语言也经历了历史的洗涤,从RDF到OWL以及SPARQL查询,都逐渐因为使用上的不便及高昂的成本,而被工业界主流所遗弃。图数据库逐步成为目前主要的知识图谱存储方式。由于大规模知识图谱的构建往往会有众多的实体和关系需要从原始数据(可以是结构化也可以是非结构化)中被抽取出来,并以图的方式进行结构化存储,而我们依赖的原始数据往往存在于多源异构的环境中,所以进行海量知识抽取和融合,就成了首要的无法回避的严峻问题。对于结构化的数据转换为图结构是比较容易和相对轻松的工程,所以建议这一步应该首先被完成。对于复杂的非结构化数据,现阶段进行知识图谱构建的主要方法有传统NLP和基于深度学习模型两类方法,而目前越来越多倾向于使用深度学习来抽取AVP(属性-值对)。有很多深度学习模型可以用来完成端到端的包括命名实体识别NER、关系抽取和关系补全等任务,从而构建和丰富知识图谱。展望分析随着大数据应用渐成趋势,未来一切数据都有可能会被纳入知识图谱与可视化分析,大幅提升决策效率。如果说大数据刚出现的头几年,人们还想“青少年谈论性”一样,对这个概念之上谈兵;现在的大数据应用已经真正渗透到了各行各业,也使得分析人员对跟高效地从中提炼结论有了迫切需求,而知识图谱技术能够解决这一痛点。未来各垂直领域的海量数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论