版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
原生分布式数据库引领数据管理技术发展趋势原生分布式数据库正在成为企业核心系统升级首选原生分布式数据库引领数据管理技术发展趋势内容变化移动互联网蓬勃发展原生分布式数据库引领数据管理技术根据中国工业和信息化部发布的2021年前三季度通信业经济运行情况的数据显示,截至2021年9月末,三家基16.4亿户。其中,5G手机终端连接数达4.45亿户,与2020年末相比净增2.47亿户。发展趋势2础电信企业的移动电话用户总数达Gartner研究:如何规划最佳多云和跨云部署数据管理11关于OceanBase17与此同969万个,同比增长5.7%,比上年末净增37.7万个。其
中,4G基586万个,占比为60.4%;5G基站总数115.9万个,占移动基站总数的12%。时,中国5G网络建设步伐加快。截至9月末,移动电话基站总数达站总数为此外,三家基2.29亿户,其中应用于智能制造、智慧交通、智慧公共事业的终端用户占比分别为17.5%、16.6%、22.4%,智慧公共事业终端用户同比增长25.5%,增
势础电信企业发展蜂窝物联网终端用户13.64亿户,比上年末净增最为突出。随着移动互联网将产生诸如智慧公共事业等更加广泛的智能应用。人工智能类的非结构化数据应用(如:人脸识别等),需要强大的数据计算能力。传统于小型机的数据库技术,难以满足存储和计算这些海量数据的要求,亟需全球移动互联网的快速发展,不仅带来更多的终端数量,与此同时,基于基新一代的数据处理技术来破解困局。移动互联网的蓬勃发展不仅带来丰富的业务种类(如:手机购物、短视频、移动社交等),而且明显延长了业务服务时长(用户随时在线、随时使用),这对数据库系统的高可用提出了更加迫切的要求。OceanBase发布了原所有Gartner资料在本出版物中的使用均已获得授权。使用或者出版Gartner的调研报告并不表示Gartner认可OceanBase的产品和/或策略。未经Gartner事先书面。Gartner不对此类信息的准确性、完整性或适当性作出任何保证。并且不对此类信息中的错误、遗漏或不适当承担任何责任,也不对此类信息的任何解读承担任何责任。此处表明的观点随时可能更改,恕不另行通知。虽然Gartner调研报告可能会讨论相关的法律问题,但Gartner并不提供法律建议或法律服务,不应将其调研报告解释为或用作法律建议或法律服务。Gartner是金可能与Gartner调研报告中涉及的实体有财务利益关系。Gartner的董金的高级管理人员。Gartner调研报告是的介入或影响。如需了解Gartner调研报告的独立性和完整性的详细信息,请参阅其网站上的
“独立性和目标的指导原则”。生分布式数据库引领数据管理技术发展趋势。由蚂蚁集团提供的编辑内容与Gartner的分析结果相互独立。Gartner的所有调研报告的版权均为Gartner,
Inc.所有。©
2021Gartner,
Inc.保留所有权利。许可,不得以任何形式复制或分发本出版物。本出版物中包含的信息均取自公认的可靠来源一家上市公司,其股东拥有的公司或基事会成员可能包括这些公司或基由其调研机构独立完成的,并没有受到这些公司、基金或其管理人员22Curabitur
at
nibhConsectetuer
adipiscing
elit
tortor原lacus
nonummy
purus云计算好比是发电厂,在供电的发展历史中,最初每个企业自己使用发电机数据量爆发增长,数据挖掘需求增加5G及IOT技术的发展,以人工智能、区块链、云计算发电,不仅要随着、大数据、边缘计算购买柴油等燃料,还要维修发电机、变电站等设备,培养专门的发电人员等,成本居高不下。后来,发电厂诞生了,每个企业只需要拉根等代表的新型技术兴起,全球联网设备数呈稳定增长态势,万物互联成为电线,就可以按照使用的电量进行付费,不需要再去购买设备、购买燃料,全球网络未来发展的重要方向。更无需考虑运维成本。物联网的发展,将带动面向企业(to
B)的产业互联网的发展,进而产生类似在数据计算的市场上,也将面临类似的演变过程。企业不用直接购买服务器指数级的数据爆炸式增长。等硬件,就可以直接使用计算资源,并根据其所使用的存储和CPU等资源的量进行付费。如何存储这些数据?如何挖掘这些数据的价值前?成为摆在企业IT管理者面的一道难题。云计算不仅能够帮助企业降低计算成本,根据需求随意扩展算力,借助专业人才保障数据安全,及时更新各种工具软件,而且还能更快获得计算结果。与此同时,移动互联网的蓬勃发展带来了更多的业务种类、更长的服务时间,某电信运营商的数据仓库已经收集了超过600PB容量的数据,自2010年起这些都对数据库系统的高可用性提出了更加严峻的挑战。该运营商就展开研究和试点,将这些数据逐步迁移到云数据库平台之上。IT基础架构上云解决算力和存储问题企业数据上云,无疑是移动互联网的业务发展和数据量的飞速增长,企业的IT基未来IT架构的主要发展趋势。随着础架构面临更多挑战。不仅要存储这些海量数据,还要挖掘、计算出这些数据所包含的挑战知识和隐藏的价值。目前,在数据处理的过程中,企业正在面临诸多困境:上世纪九十年代,企业的业务种类很少,数据量更少,使用传统数据库产生报表就能完成基本的数据处理和分析工作;进入二十一世纪初,互联网等业首先,传统数据库的扩展能力在集群节点数量等方面有很大的局限性,数据量增长之后如何扩展系统能力是一大难题;其次,数据分布在不同的业务务种类开始增多,数据量逐渐攀升,开始使用数据仓库对数据进行汇聚和系统中,如何打通这些数据进行整合亦是困难重
重
;此外,传统的数据分析分析;近年来,随着企业业务与移动互联网的紧密结合,业务量和数据量迅工具价格偏高,且软件升级不及时,如何选择数据分析工具来提升数据分析猛增长,借助云计算架构解决存储和算力方面的问题成为明智之选。能力是大多数企业必须面对的问题。技术,企业的IT基传统的数据(仓)库系统已经无法满足当下数据量急速增长的处理要借助云计算础架构可以弹性伸缩地进行并行计算,在保证求。例如,某运营商曾经购买知名厂商基于小型机的数据仓库产品,单点超过10PB容量,已经达到了其在全球的传统数据仓库的最大存储容量。虽然该安全性的前提下,提供了更高的可靠性以及更低的价格。运营商大量非结构化数据方面,尤其是在深度学习算法的人工智能应用方面更是无能为力。耗费巨资,但是传统数仓的处理能力并不能保证线性增长,在处理企业数据上云成为趋势根据Gartner统计,“数据库管理系统(DBMS)市场在2020年出现了17.1%的强劲增长,主要是由云数据库平台即服务(dbPaaS)增长约50%所驱动。Gartner这意味着在2020年,超过90%的DBMS增长来自dbPaaS。”1还预测,于此可见,传统数据仓库难以满足当下企业数据处理容量不断增长的需求,“到2022年,75%的数据库将被部署或迁移到云平台,只有5%的数据库会考同时,由于这类数据仓库系统建立在小型机的基础之上,成本远高于X862虑本地部署。”机器,不具备性价比方面的优势。1Gartner
<2020年全球数据库管理系统>:
市场份额分析:2:
云数据库管理系统魔力象限Gartner
<
>3扩展能力不足
分析能力欠缺数据量增长需要相应的存储和算力支撑,因此对扩展性的要求更高。为了应
随着数据量的快速增加,数据分析能力显得越来越重要。对于传统的结构化对可预知的流量洪峰,企业的数据库系统需要具备扩展后再收缩的能力。数据而言,EXCEL报表足以满足大部分人的使用需求。随着竞争的加剧,数据挖掘等分析需求显著增长。引入非结构化数据后,会对深度学习等人工智能随着业务的不断发展,数据库系统也要法提出更高的要求。。前期企业可以采用小成本投入的方式,不必准确预估业务的未来发展规模。但后期随着业务的快速发展,势必提出更多数据库设备扩展能力方
这些数据分析需求,都会对系统的算力提出更高要求。数据分析技术从传统的需求。
的数据库,发展到数据仓库,进而发展到原生分布式数据库,数据处理能力也在逐步提升!不断扩展,及时跟上业务发展的需算要面例如:二十年前,某电信运营商容量仅有10TB,分析形式以报表为主;引入4G后,业务范围2021年10月26日,中国信通院发布的《2021-2022中国人工智能计算公业务、视频内容业务、公有云业务、物联网业务等,数据容量已超800PB。
评估报告》指出:AI与云的融合是必然趋势,预计到2025年,中国人工智能服务器公有云的占比将超过50%,预示了数据库云化的发展趋势。的业务以2G为主,业务比较单一,数据仓库扩展了政企对力发展该运营商应用的数据分析技术包括数据挖掘、深度学习算法等,分析内容覆盖
客户、产品、网络等领域的方方面面,因此,对大数据系统提出了迫切的扩展性要求。向公有云迁移困难企业在前期的信息化建设过程中,产生了很多以传统数据库为基础的各类传统的数据(仓)库系统,需要扩展小型机服务器,不仅成本高昂,系统扩展信息化系统,涉及多个业务领域。同时,很多企业或多或少地构建了自己的的瓶颈也会越发凸显,无法提供与设备和能力对应的扩展曲线。传统数据(仓)库系统。这些历史形成的数据库系统,向云数据库迁移将十分困难。数据孤岛受制于传统数据库架构扩展性不足等缺陷,为了满足业务需求,企业往往虽然云服务提供数据库服务,但是一致性,实现灵活的管理,无法使用通用数据库,只能基于云基础自建云数据库,导致投入巨大。对于多数企业而言,为了保证产品交付的需要采用多套不同类型的数据库,导致业务数据分布在众多业务系统的数据库中,彼此割裂,合并困难,形成一座座数据孤岛。数据孤岛问题,不仅意味着的数据治理成本。在数据孤岛面前,各个业务部门给出的数据定义口径差异
后期云数据库升级成本过高、工具绑定成本过高等一系列问题。巨大,导致数据分析结果常常大相径庭,因此,企业管理者常常无法得到准确的数据分析结果。数据管理困难,以及高额的维护成本,还有巨大另外,很多企业在向云数据库迁移的过程中,担心被单个云产品绑定,导致企业进行数据迁移的成本将十分巨大,不仅涉及到数据模型的重
新梳理,而且涉及业务合规性、数据安全性、系统兼容性等相关问题。某电信运营商构建数据仓库系统的初衷,就是为了整合各个业务系统的数据,形成企业级大数据中心,不仅要解决数据不一致的问题,通过数据各个从技术的角度出发,传统数据库的云迁移路线可以采用“私有云-混合云-维度整合更要发挥数据分析的显著价值。例如:财务系统计算某个宽带产品多云”的实现路径。国内的大型企业前期一般会采用私有云的模式,保障数据的安全性;中小企业后续会采用混合云(私有云资的成本;最终,大部分企业会过渡到多云的环境,从而降低自身信息化成本支出,快速适应业务领域的各种变化。+公有云)提升业务的扩展的收入,与计费系统计算该宽带产品的收入情况对不上,根本原因是两者的结果就能达成一致,降低了企业管理方面定义口径不一致。数据整合之后,口径统一,计算时段相同,其计算能力,降低系统投的数据困惑。4从战略发展的角度来看,企业现在就需要提前考虑云服务的迁移规划,而原多地域,多部署形态生分布式数据库是目前为止数据库系统理想的目标架构。原生分布式数据库可跨地域部署,同一数据库集群的节点分别部署在不同地域,每个地域就近访问数据。在提升性能的同时可满足数据的跨地域容灾某电信运营商,历经近10年时间,才完成主要数据从数据仓库到云分布式数需求,降低数据丢失的风险。据库系统的迁移工作,期间涉及数据模型重
塑、数据处理流程重
建、业务系统改造、数据治理体系调整等各类繁杂的工作。作为面向企业级的数据库产品,原生分布式数据库的安装部署不依赖特定的服务器硬件,既提升了硬件选配的灵活性,又能降低了硬件的选购成本。趋势对企业信息系统底层的基带来了新的挑战和机遇,只有更好地将底层资源池化、资源解耦的优势发挥部署。出来,才能给用户带来高可用、可拓展、弹性计算等方面的优势。混合负载础设施进行“云化”之后,给上层的数据库系统此外,原生分布式数据库支持裸金属安装、私有云部署、混合云部署和多云OLTP(On-LineTransaction基在数据处理的分类中,有面向交易处理的目前的云数据库大多是于开源软件进行二次开发,企业在遇到相关产品Processing)和面两种处理类型。市场上比较新的云数据库虽然基于云原生进行存算数据库“分库分表+中间件”的模式,在向其迁移的过程中会涉及大量的应向分析处理的OLAP(On-LineAnalysisProcessing)问题时,很难获得持续的技术支持,后期的运维成本很高。分离,但仍属于集中式受制于数据库技术的革新未能跟上大数据分析的发展需要,交易型系统和用软件修改工作,而且同样面临着被云数据库厂商绑定的风险。分析型系统走向了两个不同的方向。目前,多数客户使用两套系统分别支撑交易系统与分析系统,不仅造成了大量的数据冗余,同而原生分布式数据库基于分布式理论设计,在构架之初就假定整个服务需要杂度和运维难度。原生分布式数据库使得两者的融合成为可能,在同一套多个节点共同配合完成,并假设任意一个节点都不可靠。因此,原生分布式系统中同时支持两种业务负载成为原生分布式数据库的重
发展方向。数据库运行在多个数据节点之上,可配置多个数据副本,它采用一致性协议时增加了系统的复要保证了全局事务的一致性,是适应云环境的新一代数据库产品,为企业核心面向混合负载的应用场景,原生分布式构架从以下几个方面入手:系统升级提供了更好的选择。•大集群可扩展:原生分布式架构可以灵活拓展,动态分配资源,按需扩展从市场反馈来看,原生分布式数据库正在成为企业核心系统升级的首选。集群的规模。集群的计算资源可以进行动态分布,从而改善整个分布式数据库系统的负载情况。高可用,可扩展原生分布式数据库继承了云计算的特点,具有多个数据副本,采用了share-
•多样的存储形态:数据管理系统中始终存在数据的“行存”与“列存”nothing的技术架构,因此具有很好的异地容灾能力。通过配置数据副本的存储位置,实现机架级容灾、机房级容灾、以及城市级容灾。针对金融监管求的“两地三中心”容灾方案,利用原生分布式数据库的架构优势能够轻松应对,并且做到数据无损失。“
”之争,即数据是副本的特点,可以将一份数据同时进行“行存”和“列存”,或者呈行列中间态存储,后续根据数据操作的特点进行匹配,提升性能。按照“行”进行存储还是按照
列
进行存储。借助其多数据要•借助向量化执行引擎:向量化执行引擎本质上是一种批处理模型。在高增加和删除节点是生分布式数据库的常规操作,只需要原一条命令即可对并发场景中,可以把大量的请求合并,改为调用批量接口。这种批处理生分布式数据库支减少了CPU的中断次数,可以更加合理地利用资源数据库集群的规模进行修改,满足不同的负载需求。原。持按需增加节点,且无数量限制。得益于各个节点的对等性,数据库集群的读写性能随节点数量的增加几乎呈线性增长。•资源隔离:交易操作的实时性要用其节点间的资源隔离,以及进程间的资源隔离技术,有效解决了两种负载的冲突问题。求往往大于分析操作,分布式数据库利5多租户在互联网和大数据的双重
推动下,业务系统变得更加多样和复杂,无论是种类还是数量与从前相比都有显著提升,这就需要大量的数据库实例进
业务系统。凭借数据库的透明兼容能力,原有业务系统只需进行小幅修改,行支撑。实例数量的增加意味着管理难度更高,随之而来的是管理成本的
甚至无需修改,就可以运行在目标数据库上。其透明兼容能力主要体现在升。
以下几个方面:数据库语法兼容,透明的分布式能力,以及透明的扩缩容能力。“云”时代基础构架的显著特征之一是资源池化,从大的资源可用服务,按需扩展和收缩,才能满足灵活的业务需求。资源池化能够降低
传统的企业级数据库产品提供了强大的能力,协助开发者更加便捷地构建所管理的实体数量,同时增加服务的灵活性。
应用程序,但同时也导致应用设计过度依赖数据库功能的问题。应用程序若要适配新的数据库产品,必须对应用代码进行大量修改,将原数据库语多租户是数据库池化的有效解决方案。原法转换成新语法。作为新一代数据库,原生分布式数据库尽可能兼容当下流行的数据库产品透明兼容性大部分行业经过企业信息化的长期积累与革新,在企业内部积累了大量的攀池中快速创建生分布式数据库能够将一个大的于传统数据库的一个实的语法和功能,包括其扩展编程能力,比如Oracle提供数据库集群按逻辑分隔成多个租户,每个租户等同例。集群管理员在创建租户的同时,指定租户能够使用的硬件资源,在运行存储过程,触发器,OCI,Pro*C等功能,MySQL也提供过程语言。有了强大过程中可以对租户使用的资源的数据访问是完全隔离的,对应用程序而言,和使用传统的单实例数据库并无差别。如此,多个业务共用一套数据库集群而互不影响,企业只需维
生分布式数据库的每个节点都提供一致的读写能力,节点数量没有上限,护少量的几个集群就能满足所有的业务需求,大大降低了管理成本和运维
整个数据库集群对外提供统一的服务,应用系统不用关注其内部结构,也无难度。
需进行分布式改造,和使用传统数据库并无区别。由于原生分布式数据库屏蔽了分布式的复杂结构,能够实现透明的扩缩容能力,因此使应用不受云时代,多租户特性是影响。在线扩展和收缩,达到动态调节的目的。租户的数据库兼容能力,既有应用系统的数据库代码无需要修改就能轻松适配。间原大型数据管理系统最重要的能力之一。具备数据库语法兼容、透明分布式和透明扩缩容能力的原生分布式数据库,把复杂结构留在了数据库内部,为应用提供了极大的便利。6以来第一次基于混合云模式构建核心保险业务系统。中华财险后续还将在案例农险、理赔等多个业务上线
OceanBase。案例1-中国工商银行股份有限公司2020年9月,中国工商借助蚂蚁集团分布式架构SOFAStack
+
mPaaS
+
OceanBase的保险成从大型主机到分布式架构改造,顺畅运行在企业级原生分布式数据库银行的重要业务系统IT基础设
施
支
撑能力,并实现OceanBase之上。对公(法人)理财系统是工商要业务系统,支撑银行的重业务整体解决
方案,中华财险
全面提
升RPO(Recovery
Point
Objective,复原点目标)=0,RTO(Recovery
Time着企业客户万亿级资产,此前一直运行在大型主机的架构之上。时间Objective,复原目标)<30秒的机房级别容灾能力。OceanBase为工商银行搭建了横跨“两地三中心”的分布式集群,以“五副在迁移过程中,依托OceanBase的OMS(OceanBaseMigration
Service,本+主备模式”提升系统的高可用水平,为业务连续性提供强力保障,并且OceanBase迁移服务)数据迁移服务,中华财险业务系统的SQL程序几乎在保证系统性能和稳定性的前提下有效降低了投入成本。无需改造,在保证“服务不停,数据不丢”的同时,最大化地降低了数据迁移的时间理如下图所示。和成本,提升运行效率。其OMS迁移服务原案例2-中华联合财产保险股份有限公司2021年初,中华财险车险系统在全国27个省市区上线国产原库OceanBase。此次系统转型升级,涉及交易、运营和后台等多个方面及7个险种、100多个业务系统(包括25个核心业务)的重
构,是生分布式数据,涉保险行业有史图1:“两地三中心”架构资料来源:OceanBase7图2:中华财险系统架构资料来源:OceanBase案例3-中国移动通信集团山东有限公司从实施效果来看,OceanBase基于Paxos协议和分区等技术整合多套分散系统,对多机房部署实现高可用和容灾,因此业务迁移后不再需要搭建灾备中国移动山东分公司是要应用客户之一,是第一个在OceanBase的重系统。通过OceanBase性能无损的数据高压缩比,分区、读写分离、LSM等核心计费系统中全部使用国内企业级数据库解决方案的运营商,其基于技术提升了OLTP事务效率;通过高兼容性和OMS迁移服务,保障了多个核心OceanBase原生分布式数据库的核心计费业务系统已于2021年5月正式业务系统的平滑迁移,核心数据库源系统数据类型、对象、存储过程只需经上线,是蚂蚁集团自研数据库在非金融领域的重要合作伙伴。过少量修改便完成了从原有数据库系统到能达成应用适配,仅在1小时内便OceanBase原以OceanBase为代表的新一代原生分布式数据库无单点瓶颈,可线性、在线生分布式数据库系统的切换,真正实现了一站式数据库无损切割。扩展和收缩,可以更好地解决业务扩展性难题。为进一步节约成本,OceanBase数据库使用普通PC服务器替代线下小型机+集中式存储等传统架构,相比原从主要项目的业务指标来看,自该系统上线后,山东移动计费系统处理效率明显提升,详单处理时长从7分钟缩短至5分钟,处理效率提升了30%;数据有的架构帮助山东移动大幅降低了硬件有的7T压缩为0.7T,不仅降低了存储投成本。由原入成本,整体硬件和维保成本也大幅下降。通过在三个不同的物理数据中心分布式部署OceanBase的服务节点,组成了一个跨越多数据中心的分布式数据库集群,实现RPO=0的机房级容灾,从而具备了任一机房损毁而数据不丢失、数据库服务不间断的原生容灾能力。8图3:山东移动系统架构资料来源:OceanBaseOceanBase简介202161100%自主研发
的
原年月日消息,蚂
蚁
集
团OceanBase正式对外宣,并成立OceanBase开源步上
线,300万行核心代码向社区开放。开源生
分布
式
数
据
库OceanBase100%自主研发,连续8年稳定支撑双11,创新推出“三地五中心”布开源社区,社区官网全球唯一在TPC-C和TPC-H测试上都刷新世界纪录的同城市级容灾新标准,是是基础软件走向成熟和通用的最佳途径,同时也将创造更开放、更有活力的基础软件开发环境和人才国产原生分布式数据库,具备高可用、高扩展、高兼容、易管理、部署灵活、高性价比等特点,已助力400余家行业客户实现核心系统升级。OceanBase培养环境,实现企业和开发人员的双赢。自创立至今,经过十一年的技术沉淀和打磨,蚂蚁集团通过开源打造了一款大家都可以用的分布式数据库,数据库可应用于关系国计民生的金融、政府、电信和能源等主要行业的核心从而普惠
更多的企业和个人开发者。业务系统。从企业应用角度出发,
点值得特别关注:OceanBase的五大典型特2020年10月2日,据权威机构国际事务处理性能委员会(TPC,TransactionProcessingPerformanceCouncil)官网披露,中国蚂蚁集团自主研发的原•作为新一代原生分布式数据库,较传统数据库产品更具“跨代”优势;生分布式关系数据库OceanBase,在被誉为“数据库领域世界杯”的TPC-C基准测试中,打破了由美国公司Oracle(甲骨文)保持了9年之久的世界纪录,•成为首个登顶该榜单的中国数据库产品具有可靠性/安全性/一致性等显著特点:提供跨域多个副本,借助Paxos。协议保证了事务的一致性,实现跨地域无损容灾,并在银行和电信等行业拥有部署案例;通过开源其源代码,降低了客户的安全疑虑。9•••具有OLTP与OLAP融合的数据库优势:通过大集群、高并发、向量化、资源隔离等技术,提供混合负载解决方案。支持多租户构架:可将当前多个数据库实例,并入一套数据库集群的多个租户中,降低管理难度。透明高兼容:提供Oracle和MySQL两种兼容模式;应用无需进行分布式改造;集群能够在线扩缩容,不影响业务应用。在人工智能等技术突飞猛进、数据量飞速增长的大背未来数据处理的发展趋势,而OceanBase为企业级客户提供了这样一。目前,越来越多的企业选择OceanBase景下,原生分布式数据库是种经过行业市场实践验证的产品作为核心系统升级的首选。资料来源:OceanBbase1011Gartner研究:如何规划最佳多云和跨云部署数据管理许多公司越来越多地使用多个云服务提供商•,根据用例的具体优化需求,选择您的跨云或前言多云和跨云数据管理部署很普遍:Gartner于最因此不应再将云基础设施选择作为事后补救措
多云部署层。这通常需要在优化与灵活性之间2020年7月和8月开展的云部署调查发现,施。数据和分析领导者可利用本调研报告规划进行权衡。近的在企业机构使用公有云的受访者中,76%表示其多云和跨云部署,确保云资源得到最佳利用。•如果您正在考虑跨多个云主动集成数据,可以CSP1公司正在使用多个。使用多个云部署选项会评估一下ISV产品扩展了CSP本身所,这些产品概述在性价比优化、资源分配、数据治理、元数据管提供产品。在评估中,不要忽视的广度和范围CSP的能力。理和数据集成方面面临挑战。主要发现•
Gartner最近的一项调查显示,在使用公有云新兴跨云的受访者中,76%使用了多个云服务提供商区分“多云”和“跨云”的概念很重要,前者是指(CSP)。战略规划设想使用多个云环境,后者涉及主动在各个云之间开到2023年,对数据管理的云偏好将减少厂商的展数据管理、实时数据访问、元数据访问和数据传输(见图1)。有关云部署场景的进一步说明和通过使用可能不符合公司主要••云战略的其他规模,而多云的增长将增加数据治理和集成的复杂性。厂商完整分类,请参见注释1以及了解云数据管理架,通常即会系统性地出现多云架构。构:混合云、多云和跨云。到2023年,云数据库管理系统(DBMS)的收入将在云端监控使用情况和成本可能很困难,当占DBMS市场总收入的50%。使用多个CSP时,此类挑战会进一步加剧。随着公司使用的云服务提供商数量增加,管理这些提供商的复杂性也随之增加。这可能会带来负•
CSP产品的生态系统成熟度各有不同,需要类面影响,例如与数据延迟有关的性能问题、计划外到2025年,50%的独立DBMS厂商将停止运营,致使客户调整战略并迁移回其战略性DBMS供成本超支或数据输出费用,以及数据集成难度。似于本地平台的集成工作。在多云和跨云场景中使用时,还需考虑网络延迟、数据传输问题和性价比优化的复杂性。公司如何克服这些挑战?应商。•独立软件厂商(ISV)通常可提供云不可知解决方案,这对独立的CSP服务构成了挑战。建议图
:1对于计划使用多个CSP的数据和分析领导者:多云与跨云••谨慎
部署多云和跨云架构。不要使用。制定云使用和部署政策,以防止使用非战略性云产品和出现不受控制的支出。限制多云的使用云监控和优化工具(用于预算分配和延迟控制)追踪不同云的使用情况,以避免不受控制的支出,并确定可能需要其采取补救措施的架构痛
点。制定、资源对11虽然许多公司采用单一云提供商其他CSP的单点解决方案通常具有特的战略,但鉴于以下因素,这些公司几乎不可能严格遵循这一战略:•定的优我们建议采取以下三点对策:势或功能。•••制定深思熟虑的云部署战略•公司可能会决定使用一个由CSP提供的开发•追踪所有云提供商许多公司都在使用SaaS产品,并借此创造了础设施和数据持久层的或可视化工具,而数据则来源于或驻留在另的使用情况(包括支出)另一个具有独立云基一个CSP中。同时考虑以CSP为中心和以ISV为中心的方法封闭式云环境。随着环境便会应运而生。这些公司可能还需要处理跨云数据管理问题,同时还存在一些关于跨云数据集成需求的具体问题。这些问题包括性能和延公司的任意部门开始使用次级CSP后,多云•云服务易于部署,可由业务部门而非集中的IT部门加以实施,我们通常将这种部门称为“影子IT”。分析精心规划您的云架构与采用“统一战略”进行部署的理念不同,多云和迟、数据治理(包括安全、加密和数据主权)以及跨云架构正在系统性地逐渐成形,而这种现象越•随着并购活动的发生,公司会继承现有的基础财务治理问题。在跨云环境中,不仅财务治理更来越常见。根据Gartner最近的一项云部署调查显示,63%的公司会使用由一个主要设施,从而导致不经意间CSP提供的使用多个云。具挑战性,而且肯定会产生数据传输费用。服务,同时也会使用其他云提供商提供的服务;13%的公司会使用多个提供商发现自己身处多云环境,并根据具体情况寻求方法有主要提供商统一环境时,跨云数据管理可能会变得愈发普遍。用多个云提供商即是出于监管方面的考虑而使用跨云的提供的服务并且没。调查结果得出,76%的公司会使提供的服务(见图2)。跨云数据管理尚处于起步阶段,但随着众多公司WeLab一个早期例子,这是中国香港的一家数字银行,图2:其使用Temenos
Transact和NuoDB在亚马逊云科技和GoogleCloud平台上部署了核心银行业务多云基础设施的使用情况2解决方案。
关于跨云数据管理普及程度究竟会发展到哪个阶段,目前尚不明确。数据和分析领导者必须接受这一新现实,并制定政策以降低风险和复杂性。对于大多数公司而言,问题在于何时使用多个CSP,而非是存在这些难题,但多云数据管理可确保可靠性、成本效益和地理定位,并可降低因厂商锁定而产生的风险。否使用。尽管当效益大于复杂度时,公司便应采用多云部署。务必要注意,多云并不应是单独存在的战略,而应该成为公司整体云战略的一部分。如果您公司CSP不支持您所需的数据管理功能,您可以使用次级CSP提供的服务,并考虑使用ISV,管CSP之间的工作负载。如果使用次级CSP的主要理不同提供的服务所带来的效益不明朗,领导者应注意优先使用主要CSP。默认情况下,任何新计划都应1213CSP提供的服务。如果使用非主要CSP侧重
于在原生CSP环境中管理数据,但其近使用主要CSP此外,数据流与业务流程、数据创建速度、数据的内采取这些使用/重
复使用方式,甚至地理区域都有内在联提供的服务,您应在自己的预算范围期在推动更多地纳入本地基础设施,并对将数据管计划,并自行承担风险,而且可能得不到公司的系。监控不同云的使用情况有可能会发现效率低
理功能扩展到其他云的兴趣与日俱增。基于容器的方法均采用混合云和多云方法,例如Amazon全面EKSAnywhere、Microsoft
Azure
Arc、GoogleCloudAnthos和IBMCloudPak
forData,使企业机构能够将本地数据连接到其CSP,并管理本支持。领导者应该宣传这种做法。下的问题,您应该循序渐进地修复这些问题。这也是关注元数据的好机会,因为其可助您深入了解数据资产之间的关系以及数据在整个公司中的对数据和分析领导者的建议:使用情况。•限制多云的使用。恰恰相反,应根据云使用和部署情况制定政策,确保经过深思熟虑后再做选择。地或其他云中的数据基础设施,甚至可以访问其不要对数据和分析领导者的建议:他云中的数据。•制定有关追踪多个云的支出和使用情况的政策。此举将有助于了解云资源借助这些服务,公司能够在同一地方管理其所有•遵循首选的主要云提供商战略,并要求提供的使用情况、不数据,包括常见的安全和治理政策、监控、弹性伸缩和现代化的持续集成/持续交付(CI/CD)工受控制的支出情况以及非战略性云产品的使用使用非战略性云资产的合理依据。设置新项目情况。作流。CSP提供的云服务可扩展到本地环境中,的默认标准,确保使用主要云提供商。从而打造统一的现代数据管理平台,而无需再管•消耗情况,理单独的本地环境和云环境。通常由数据集成厂实施监控工具以管理多个云的资源使用工具追踪不同云的使用情况商提供的数据虚拟化工具是数据源和应用在不同云提供商之间访问、集成和共享数据的另一种方式。公司实现跨云架构减少成本超支。分布得越多,对监控的需求就越大。数据和分析领导者应追踪•使用单一管理平台监控工具,确保遵循数据数据在数量和方向上的流动情况,因为这会影响此外,许多CSP也在以云数据生态系统的形式延迟时间和性能。如果不积极主动地监控公司云治理和安全政策。提
供
更
加
统
一
的
数
据
管
理
体
验
。这
些
举
措旨资源的使用情况,则很容易造成超支。将先前在CSP提供的众多单点解决方案,在统一大多数本地运行的工作负载改为在云中运行后,可能会导致成本激增。云服务的成本模型与本地服务的使用CSP产品作为您的数据管理平台CSP基础设施及在其上运行的服务是全新的数据将“需自行组装”体验转变为统一的单一产品体验。云数据生态系统的早期相关示例包括:MicrosoftAzureSynapseAnalytics、IBMCloudPakforData、Oracle
Cloud
Infrastructure不同,前者将进一步加强了对强有力监控的需求。管理平台。这些平台由以下部分组成:•础设施即服务(IaaS)计划的一般基随着更多的云提供商支持基础参与进来,各个云的复杂性的Autonomous
Database和Google
Cloud迅速增加,而可见性则急剧下降。了解如何使用设施。Dataple。多个云提供商提供的服务非常重要,一些工具可•公共
服
务层,例如可用于实
施
数
据管
理
的云对象存储,管理对象则为诸如平台即服务PaaS帮助您直观地感受这些云的性能和成本。相关云监控和优化示例工具包括:ApptioCloudability、Datadog、Densify、Novetta
CloudTracker和当集成位于多个云中的数据管理环境时,集成的客户端终结点将归入数据管理堆栈内的三个组件3)()的跨云服务。VMwareCloudHealth。数据洞察示例工具包括:Unravel和Acceldata。理想情况下,您需要决方案,例如数据库平台即服务(dbPaaS)。中(见图•为满足特定需求而设计的原生CSP孤立点解监控不同云的支出和使用情况。•在云基础设施上运行的第三方ISV单点解决方案。13在数据管理堆栈中,这些层分别为:•DBMS层
—
利用分布式DBMS(可创建分布•在应用层执行跨云数据管理的最大问题可能是数据延迟和性能问题。由于此原因,在云间的逻辑集群)提供额外的优化。然而,•对象存储层
—
这是最为大众所了解的与数据由于使用单一厂商可能无法处理所有用例,
针对此层,大部分情况下会在此部署某种相关的层
每个云中的每项数据服务都可对本因此该层缺少灵活性。DBMS层包含可跨多个缓存层。对于这种方法最准确的描述为将地云对象存储作读写数据操作,无论其为原生云,按地理位置不同实施分布式集群的数据
数据集成推迟至用户使用时。还是:CSP产品第三方ISV产品管理平台:•这
方面的示
例
包
括
数
据
虚
拟
化
工具•••如果数据能在这一层有效地分布,则几乎可以根据用例选择任意云服务以交付此类数据。因此,使用云对象存储可极大地提高灵活性。•Denodo)或
商由于实体数据中心之间DBMS层执行跨云数据管
Microsoft
Power
BI)。而另一个示例便理的主要问题可能是的距离,对于跨多(如业智能查询引擎(如个云的数据,在延迟和一致性问题。是SAP,其业务流程分布在不同的云中并不过,这些架构可同时支持局部读
通
过
应
用实
施
互
操
作
。例
如,在
中
国,/写功能与全局读取功能,并强制执行数据主权政策。其供应链在阿里云上运行,在北美则是在亚马逊云科技(AWS)上运行。理想情况下,这些解决方案应能够管理复制哪些数据以及复制到何处,并通过仅移动已更改的数据执行优化措施,以避免不•包括:ApacheCassandra/相关示例厂商对数据和分析领导者的建议:DataStax、CockroachDB、MongoDB、必要的输出成本。NuoDB和YugabyteDB。•CSP提供的服务,如MicrosoftAzure考虑使用包
括:Equalum、HPEEzmeral和WANdisco。Arc
Cloud
Anthos
IBM
Cloud
Pak、
、相
关
示
例
厂
商•应用层—包括跨云查询数据或访问数据所需和forData
AmazonAWS
Outposts,促
进的组件:公司以现代化方式管理本地基础设施。图3:跨云部署选项1415•选择跨云部署层时,在优化与灵活性之间将变得越来越困难。CSP能够利础设施紧密集成的优势,而ISV产品不具备这一特产品的功能或范围进行随着原对数据和分析领导者的建议:生CSP产品日趋成熟,对ISV而言,保持差权衡,并考虑个别用例的具体需求。将云对象异化的核心产品•如果ISV产品生CSP提供的功能或范围超出原存储扩展到多个云作为默认跨云部署层的解决用与底层基则方案,可提供最大程度的灵活性。使用应用或点。ISV可能难以支持不断变化的,或者多云/跨云需求非常DBMS层可能更适合于满足特CSP平台,这需要ISV要,则应使用
产品。定的需求。大量的开发工作并精心制定战略。虽然CSP对ISV构成巨大的挑战,但ISV目前重•不要可在各种领域提供更为成熟的数据管理解决方生生态低估运行多个云环境带来的额外复杂性。•ISV
CSPCSP原在使用结合和产品为更复杂的集成做好规划。这必然会增加集成、治理和财务治理的复杂性可在数据集成方
面及支出。的半可能需要使用不同的功能和工具多次实施同案,包括数据集成、主数据管理和元数据管理。系统时,需要一组策略。作为
示例I
S
V
的包括
:Informatica
Cloud和Talend
Data
Fabric,这使用ISV提供的云不可知解决方案,但能认识到其正面依据临CSP的挑战些ISV可替代AWS
Glue和Microsoft
Azure数据工厂等CSP产品与历来一直关注管理CSP原生数据的CSP不同开展的“
年云终端用户购买行为。又
如,Collibra和Alation等元1GartnerISV可与AWS
Glue和Microsoft
Azure2020,ISV侧重
于云不可知解决方案。ISV将CSP视为目标研究”旨在了解技术领导者如何处理购买、续订数据管理Purview等CSP解决方案展开竞争。在近期和或数据源,并且大多数ISV可成功支持多种平台。2020年中期,由于这些ISV单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 写出人物的精神教学反思
- 端午放假时间管理
- 光伏厂管理规定
- 预防医学科流感预防控制策略
- 骨髓疾病的护理与治疗方案
- 2026中国科学院广州地球化学研究所科研助理招聘2人备考题库(应用矿物学学科组)及答案详解【夺冠系列】
- 2026山东济南市中心医院招聘博士研究生(控制总量)70人备考题库含答案详解(满分必刷)
- 2026内蒙古康远工程建设监理有限责任公司成熟电力工程监理人才招聘67人备考题库附答案详解(突破训练)
- 2026黑龙江五大连池市乡镇卫生院招聘医学相关专业毕业生1人备考题库及参考答案详解(能力提升)
- 2026湖南湘江研究院有限责任公司招聘7人备考题库附参考答案详解(综合卷)
- GB/T 44260-2024虚拟电厂资源配置与评估技术规范
- DL∕T 1733-2017 电力通信光缆安装技术要求
- JTGT B06-02-2007 公路工程预算定额
- 工程经济学概论(第4版)课件 邵颖红 第9-11章 投资风险分析、资产更新分析、价值工程
- 开封大学单招职业技能测试参考试题库(含答案)
- 关于汉字字谜研究报告
- 采购管理制度及流程采购管理制度及流程
- 水工隧洞的维护-水工隧洞的检查与养护
- 惠州市惠城区2022-2023学年数学六年级第二学期期末综合测试试题含解析
- 2023年江苏对口单招财会高考试卷
- 实验动物课件 实验动物的营养控制-研究生2018
评论
0/150
提交评论