阿里云图数据库GDB概述_第1页
阿里云图数据库GDB概述_第2页
阿里云图数据库GDB概述_第3页
阿里云图数据库GDB概述_第4页
阿里云图数据库GDB概述_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、阿里云图数据库GDB概述技术创新,变革未来CONTENT01数据价值本质阿里云图数据库GDB典型应用场景思考&讨论:大数据的价值本质图AI图谱、图应用建模、训练大数据的价值在于关联关系、数据规律的 发掘及应用图数据库:数据关系的直观存取 有图应用有未来移动互联网大数据、数据仓库、数据湖数据的价值是什么?大数据中金矿挖掘,金矿到底是什么?5G、IoT、万物互联,未来商机和机会点是什么?关联关系 + 数据规律IoT互联网PC2010年全球数据总量达到2ZB(270字节),这个数值还在以每两年接近翻一番的 速度增长。预计2020年将达到47ZB,比2010年增长超过20倍,近两年的数据总 量相当于人

2、类有史以来所有数据量的总和。IDC调查报告显示,企业80%的数据是非结构化数据,且每年按指数增长60%。数据价值已备受重视,由先前少量孤立数据的价值挖掘,转向海量全局数据的价 值挖掘。涌现分布式数据分析、数据仓库、数据挖掘、数据湖等系列技术什么是图数据库(Graph Database)id:1 Label:person Name: WeiChen Gender:male Age:22id:3 Label:person Name:Jose Gender: female age:27id:1001 Label: Message content:hello Createdate: 2016/9/20

3、Id:2001Label:knows Createdate:2016/10/21Id:2032Label:knows Createdate:2016/10/25Id:3046Label:has_member joindate:2016/10/15Id:3027Label:has_member joindate:2016/9/25id:100 Label: forum Title:football Createdate: 2016/9/18Id:3133Label:containOf示例(真实应用场景可能存在数亿、数十亿、百亿关联数据):1、Jose与WeiChen互相认识。2、Jose、Wei

4、Chen均为同一个足球俱乐部球员。3、。Graph Database,非图片数据库,以图论为基础针对图结构设计的一种数据库。图结构:Vertex:圆圈代表节点,表示实体Edge:有方向的线条代表边,表示实体间的联系Property:顶点或者边都可以有属性适合高度互连数据集(关联关系)存储查询分析六度空间理论图无处不在:在线购物、社交、交通网络、金融保险等方方面面 据Gartner分析,商界有5个非常有价值的图:Social Graph(社交图)Intent Graph(意向图)Consumption Graph(消费图)Interest Graph(兴趣图)Mobile Graph(移动图)引

5、自: /id=2081316图数据库发展趋势大量应用驱动,图数据库已成为最近几年增长最快的数据库类别各类产品基于主要应用场景在前期形成了细分 整体呈现一定融合之势:图查询&图分析Knowledge Graph/RDFOperational Graph DatabasesAnalytic GraphsMulti-Model DatabasesStarDog属性图 & RDFRDF Graph(Triple Store)ResourcePropertyStatement不支持实体和关系拥有属性Property GraphVerticesUniqueID + set of propertiesEdg

6、esUniqueID + set of properties点和边都可以有内部属性属性图模型更为简洁、直观,在工业界广泛应用工业界学术界id:1Name: WeiChen Gender: male Age:22id:3 Name:Jose Gender: female Age:27Id:2001Createdate: 2016/10/21Id:2032Createdate: 2016/10/25PersonKnowsPersonKnowsWeiCh enPerso nis_aage22malegenderJoseage27malegenderis_aPerso nWei knows josef

7、romto2016/10/21create dateJose knows Weitofrom2016/10/25create date传统关系型数据库面临的挑战基于传统关系数据库,你可能会写出如下查询语句:select * from t as t3 where t3.uid in(select friend_uid from t as t2 where t2.uid in (select friend_uid from t as t1 where t1.uid=UserId-xxx) and =James图数据库中查询2度好友:g.V(UserId-xxx).repeat(both().sim

8、plePath().times(2).dedup().has(name, James)模型自然&直观关联查询快示例:用户UserId-xxx发起“查询自己2度好 友中名字叫James的人”这样一个查询请求。多表关联,模型复杂,查询效率低分类图数据库关系型数据库模型图结构表结构存储信息结构化/半结构化数据高度结构化数据2度查询高效低效3度查询高效低效/不支持空间占用高中两度查询平均耗时三度查询平均耗时图数据库图数据库关系型数据库关系型数据库X10X20传统关系型数据库面临的挑战业务场景若涉及多度关联关系查询处 理、复杂图算法(如图遍历、模式匹配 等),传统数据库已捉襟见肘,难以满 足业务要求。自

9、建图数据库面临的挑战运维困难,使用门槛高缺乏专业的图数据库DBA,出现 问题难定位,出现故障难维护, 内核能力演进迟缓性能差、扩展性差难以满足业务实时性要求,及业 务日益增长要求可靠性低开源版本通常无高可用保障,易 引发业务中断,难以满足生产系 统可靠性要求CONTENT01数据价值本质阿里云图数据库GDB典型应用场景图数据库GDB的发展历程Tair Service演进Tair 1.0 key-valueTair 2.0 Multi-Model子系统孵化图数据库GDBkey-Value 极致稳定 超强吞吐能力多样化 持久化专注解决高度数据关联场景系统架构支持属性图兼容Gremlin和Cyphe

10、r两大业界主流语法自研OLTP图数据库引擎查询优化,并行执行支持ACID事务自动索引HTAP管理控制高效导入数据同步File System LayerMgnt Service & ToolsGDB ServerConnection LayerAuthentication、Connection Control、Gremlin/Cypher ProtocolImport ServiceSDK for Java、Python、HTTP RESTful、.NETReplica ServiceLoad ManagerLoad RunnerScript EngineTraversal OptimizerE

11、xecution EngineGraph StructureTransactionGraph CacheStorage Engine图数据库GDB四大核心能力兼容主流图查询语言支持属性图,兼容Gremlin和Cypher两大 主流查询语言高性能、低成本相比自建Neo4j,成本节省40%;大规模 数据量查询性能优于Neo4j;即将支持扩 展只读实例,进一步提升读性能高可用实例高可用,节点故障自动切换,保障业 务连续性易用、易运维支持ACID事务;自动索引、Schema- Free;内置常用图算法;支持Go、Java、 Python等客户端;提供多种数据导入功能;提供备份恢复,监控告警等运维功能阿

12、里云提供兼容Gremlin、Cypher两大主流查询语言,高性能、高可用、低成 本、易用、免运维的图数据库产品。Cyper兼容已发布1.0版本,邀测中,即将全 线发布。兼容Gremlin及Cypher两大主流图查询语言OpenCypher最早流行的类SQL图查询语言Neo4j主力实现应用广泛SparQL用于RDF上的描述语言W3C的标准Gremlin基于属性图多个公有云厂商支持的图查询语言应用广泛OpenCypherGremlin阿里云GDBCyper兼容邀测中,即将全线发布 敬请期待用户基于Gremlin或Cypher语法开发的应用, 均可平滑迁移至阿里云图数据库GDB。计算层存储层主实例计

13、算层存储层备实例同步云盘云盘ALBAPPAPPAPP读写读写计算层存储层主实例计算层存储层备实例同步共享存储ALBAPPAPPAPPAPPAPP计算层存储层只读实例计算层存储层只读实例同步读写只读读写一主一备一写多读数据同步binlog云盘共享存储高可用节点故障自动切换演进高可用支持ACID事务通过MVCC机制和Fine-Grained Lock支持Read-Committed级别的ACID事务,降低应用开发复杂度AtomicConsistency Isolation DurabilityGraph TransactionGraph APIVertexCreateEdgeCreateVerte

14、xSetPropEdgeSetPropCommit Per Transaction TxStateLocal Lock TrackerPer Transaction TxStateLocal Lock TrackerPer Transaction TxStateLocal Lock TrackerLock LayerCommit ProcessGraph Binary LogGraph Store Engine自动索引&Schema-FreeV0age=18name=Tomgender=maleV1V2age=19name=Jerrygender=maleage=19name=Catgende

15、r=maleUserUserUsername:gender:数据索引age:自动索引和Schema-free更易于用户开发,节省大量DBA工作内置常用图算法Gremlin OLAP ProviderGremlin标准遵从HTAP(与Gremlin OLTP并存,一份数据)适合大数据集的复杂分析查询和处理内置常见图算法g = graph.traversal()g = graph.traversal().withComputer()/ OLTP/ OLAPCentralityPath findingCommunity detectionPageRankBetweenness CentralityC

16、loseness CentralityMinimum Weight Spanning TreeShortest PathSingle Source Shortest pathAll pairs shortest pathRandom WalkConnected ComponentsTriangle CountingHist。Driver/SDK支持支持开源TinkerPop 3.3.3(及以上)版本Driver,官方提供Java,Python,Go,.Net, REST兼容性保证 支持Gremlin Console数据导入OSS(csv)clientsource:xxx ramRoleArm:

17、xxx231GDBNeo4jMysqlODPSDataXDataWorksMysqlODPSNeo4j多种数据源:Neo4j,Mysql,多种数据通道:OSS,DataWorksGDB备份恢复可视化CONTENT01数据价值本质阿里云图数据库GDB典型应用场景图数据库典型场景社交网络图数据库可以轻松应对海量高度互连社交数据的实时 存储和高效查询,帮助您快速构建复杂的社交网络系 统。例如,在一个典型的社交网络中,常常会存在“谁 认识谁,谁上过什么学校,谁常住什么地方,谁喜欢 什么餐馆之类的查询”,传统关系型数据库对于超过3 度的查询往往会很低效甚至无法支持,但图数据库从 基因层面提供了解决方案,

18、轻松应对社交网络的各种 复杂存储和查询场景。欺诈检测在金融领域,图数据库经常用于欺诈检测场景。例如,通过贷款、分期消费者的联系人(或者联系人的联 系人)信用信息,对用户进行信用评分,如果评分较 低,则拒绝贷款或者提升利率;通过申请人的个人信 息(包括电话号码、家庭住址),判断申请人信息是 否属实。通常,欺诈者是通过“黑市”购买的用户信息 然后拼凑出的“个人信息”,并且这些信息会被反复使 用,使用图数据库,可以快速的发现申请人提供的个 人信息与现有的用户信息的关系。图数据库非常适合实时推荐场景。您可以将用户的购 买行为,位置,好友关系,收藏等数据实时的存储在 图数据库中,然后利用图数据库能对高度

19、互连数据提 供高效查询的特点,通过各种维度的快速查询实时进 行多维度个性化推荐。例如,在某APP中,通过用户 位置及以前的购买行为信息,当某用户A到达某商场B,APP可以向用户实时推荐附近的门店及商品等信息推荐引擎知识图谱网络/IT运营图数据库可以帮助您快速的构建知识图谱。您可以将图 谱数据存储在图数据库中,既可以通过外部输入实时更 新,也可以对图数据库内部图谱信息进行分析来不断发 现并完善图谱数据。比如, 基于图数据库,你可以快速 实现像针对足球明星这样的知识图谱应用, 帮助用户浏 览,发现感兴趣的信息。图数据库非常适合网络/IT运营相关场景。比如,您可以 将路由器,交换机,防火墙,服务器等

20、各种网络设备和 终端及其拓扑信息存储在图数据库中,当某服务器或终 端遭受恶意攻击或者受到感染时,你可以通过图数据库 快速分析并找到传播路径,然后进行相关追踪及处理。图数据库典型场景钉钉Work Graph业务价值图数据库GDB作为底层基础设施为钉钉提供了百亿量级的关系存储和查询能力,管理人与人、人与 企业、企业与企业之间的关联关系,为钉钉的同企识别、用户亲密度计算、高管预测和同事关系预测等功能提供了图数据库的核心能力。推荐加人:拉新促活:盒马鲜生知识图谱与商品推荐业务价值图数据库GDB支撑盒马鲜生构建基于商品和菜谱之间关联关系的私域知识图谱,提供了提供菜谱 推荐、人群推荐、门店推荐等功能。使用

21、范例欺诈检测场景/document_detail/112470.html?spm=a2c4g.11186623.6.573.42756c93byHJXw知识图谱场景/document_detail/112895.html?spm=a2c4g.11186623.6.574.64d27aacgIFciq网络运维场景/document_detail/112472.html?spm=a2c4g.11186623.6.575.f0d26ba94k42AH推荐场景/document_detail/112469.html?spm=a2c4g.11186623.6.576.4b1b9193aImarG社交应用

22、场景/document_detail/112468.html?spm=a2c4g.11186623.6.577.365dec05p6AwH9开发者福利,重大优惠https:/product/gdb社区技术爱好者、学习人员、新用户试用:9.9元包三月 公测用户:首次续费6折,不限规格包年85折:不限用户、不限规格、不限数量图数据库GDB社区群Gremlin实践moviegenreuseroccupationLabel:genre Name:string(Animation |Western |Drama | War | Adventure | Sci-Fi | )Label: movie Uid

23、: string year: int Name: stringLabel: occupationName: string(retired | sales | writer| scientist | student | programmer| artist | )genreratedoccupationLabel: user uid: stringGender: string(M | F) zipcode: stringage: int Name: stringLabel: rated Stars: int Time: long查看顶点总数g.V().count()查看边总数g.E().coun

24、t()查看所有顶点Labelsg.V().label().dedup()查看所有边Labelsg.E().label().dedup()数据集里一共有多少部电影g.V().hasLabel(movie).count()数据集里一共有多少用户g.V().hasLabel(user).count()数据集里一共有多少评论g.E().hasLabel(rated).count()查看uid为u1的用户详细信息g.V().has(user,uid, u1).valueMap()查看uid为u1的用户是什么职业g.V().has(user,uid, u1).out(occupation).valueMa

25、p(name)查看uid为u1的用户投票了哪些1998年及以后出产的电影g.V().has(user,uid, u1).out(rated).has(year, gte(1998).valueMap()1990年都出产了哪些科幻电影g.V().has(genre, name,Sci-Fi).in(genre).has(movie,year, 1990).valueMap()有多少人参与了电影Toy Story 2的评分g.V().has(movie,name,Toy Story 2).in(rated).count()有多少程序员参与了电影Toy Story 2的评分g.V().has(mov

26、ie,name,Toy Story 2).in(rated).filter(out(occupation). has(name,programmer).count()找出10个参与过电影Toy Story 2评分的程序员g.V().has(occupation,name,programmer).in(occupation).filter(out(rated). has(name,Toy Story 2).limit(10).valueMap()找出参与过Toy Story 2评分的最小年龄程序员g.V().has(occupation,name,programmer).in(occupatio

27、n).filter(out(rated).has(name,Toy Story 2).order().by(age).limit(1).valueMap()Gremlin实践moviegenreuseroccupationLabel:genreName:string(Animation |Western | Drama | War | Adventure | Sci-Fi | )Label: movie Uid: string year: int Name: stringLabel: occupationName: string(retired | sales | writer| scient

28、ist | student | programmer| artist | )genreratedoccupationLabel: user uid: stringGender: string(M | F) zipcode: stringage: int Name: stringLabel: rated Stars: int Time: long每个分类的电影分别有多少部g.withComputer().V().hasLabel(movie).out(genre).groupCount().by(name)各个职业的用户分别有多少g.withComputer().V().hasLabel(use

29、r).out(occupation).groupCount().by(name)什么人喜欢看科幻电影g.withComputer().V().has(genre, name, Sci-Fi).in(genre).in(rated).out(occupation).groupCount().by(name)女生喜欢看什么电影g.withComputer().V().has(user,gender, F).out(rated).out(genre).groupCount().by(name)3040岁的用户喜欢看什么电影g.withComputer().V().has(user,age, within(30.40).out(rated).out(genre).groupCount().by(name)用户平均评分最高的10部科幻电影是g.withComputer().V().has(genre, name,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论