银行新核心全闪存储选型应用实践_第1页
银行新核心全闪存储选型应用实践_第2页
银行新核心全闪存储选型应用实践_第3页
银行新核心全闪存储选型应用实践_第4页
银行新核心全闪存储选型应用实践_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 银行新核心全闪存储选型应用实践目 录 TOC o 1-3 h z u HYPERLINK l _Toc13087308 一、存储阵列的发展历程 PAGEREF _Toc13087308 h 3 HYPERLINK l _Toc13087309 (一)存储阵列的出现 PAGEREF _Toc13087309 h 3 HYPERLINK l _Toc13087310 (二)中端存储的崛起 PAGEREF _Toc13087310 h 3 HYPERLINK l _Toc13087311 (三)全闪存存储的分类 PAGEREF _Toc13087311 h 4 HYPERLINK l _Toc13

2、087312 二、新核心存储选型经验及应用成效 PAGEREF _Toc13087312 h 4 HYPERLINK l _Toc13087313 (一)选型原则 PAGEREF _Toc13087313 h 5 HYPERLINK l _Toc13087314 (二)新核心存储选型考虑的主要因素 PAGEREF _Toc13087314 h 5 HYPERLINK l _Toc13087315 (三)核心存储平台投产方案 PAGEREF _Toc13087315 h 6 HYPERLINK l _Toc13087316 (四)投产后成效 PAGEREF _Toc13087316 h 7 HY

3、PERLINK l _Toc13087317 三、投产后出现的难点问题如何解决 PAGEREF _Toc13087317 h 8 HYPERLINK l _Toc13087318 (一)批处理资源的调配问题 PAGEREF _Toc13087318 h 8 HYPERLINK l _Toc13087319 (二)同城容灾设备的匹配问题 PAGEREF _Toc13087319 h 8 HYPERLINK l _Toc13087320 四、总结及建议 PAGEREF _Toc13087320 h 9【摘要】近些年,随着闪存技术的逐步成熟以及介质价格的下降,闪存存储已广泛应用于银行业,成为支撑核心

4、交易的关键设备。本文从全闪存存储发展历程入手,结合某银行核心存储的选型经验,重点介绍全闪存存储的技术特点以及应用场景,希望能给各位读者后续的使用带来帮助。一、存储阵列的发展历程介绍闪存存储之前,有必要先普及一下存储的发展历程,所谓“究天人之际,通古今之变”,观察历史是认识今天的一个非常重要的视角。(一)存储阵列的出现天下武功唯快不破,存储设备更是这样。计算机设备出现后很长一段时间里,存储数据主要依赖于单个硬盘、软盘等介质,为了提供磁盘介质的可靠性和性能,某公司就把硬盘做的很大、可靠性很高。自然也十分昂贵。但是存储阵列的出现彻底打破了数据存储对单个硬盘可靠性和性能的依赖,一方面使用RAID技术,

5、用多个普通硬盘同时工作来实现数据的冗余,避免了单块硬盘的局限和瓶颈;另一方面使用缓存技术提升了IO效率、部分缓解了机械硬盘性能的瓶颈。存储阵列替换单个硬盘介质的过程,与现在分布式替换集中式架构的过程十分类似,通过软件加廉价硬件改变过去对单个高可靠设备的依赖,从而达到提高灵活性、降低成本的目标。(二)中端存储的崛起存储阵列从可靠性、扩展性,单位容量的平均价格等指标,又可以分为高端、中端以及低端存储。机械硬盘时代,由于单块硬盘的容量和性能有限,对于大规模集中式存储的场景,难以避免的需求大量的磁盘介质,这就造成对存储设备整体的扩展性要求较高,高端存储设备几乎成为关键业务的标配,总体拥有成本也相对较高

6、。而固态硬盘的出现,颠覆性地打破了传统机械硬盘的瓶颈,其单盘性能是一般SAS硬盘的数倍以上,容量达到几倍甚至几十倍,最为重要的固态硬盘相比于机械硬盘,在对于上层应用最敏感的延迟方面表现要好得多。随着主要存储厂商打通中高端存储微码以及SSD硬盘介质的发展,多数客户的大部分应用场景已经不再需要成百上千块硬盘的堆叠,中端存储的性价比优势凸显,逐渐成为市场主流。(三)全闪存存储的分类全闪存存储从架构来看有集中式和分布式两种,本文主要探讨集中式架构的全闪存存储。集中式全闪存存储从产品类型上分为全新性和传统型两种。第一种是基于全新架构,如DELLEMC XtremIO和华为的Dorado,这类产品提供默认

7、的在线压缩和去重功能、经济性更好,基于智能芯片及算法、存储延迟也控制的更低,比较适合用于创新业务和VDI场景;另一类是在传统高端存储的基础上,将机械硬盘换为固态硬盘,并对微码进行部分优化,这类产品属于在可靠性和性能之间进行了平衡,既继承了上一代存储微码的稳定性,延续了存储的容灾复制技术以及两地三中心的架构,同时性能也有较大提升,更适合关键业务场景,是传统存储的升级。业内普遍认为,2016年是闪存市场的元年,原因是一方面随着出货量的增加和制造成本的逐年下降,固态硬盘的单TB售价已与机械硬盘基本持平,另一方面,技术升级和解决方案的不断优化,固态硬盘技术也日趋成熟逐渐被用户所接受。目前固态硬盘已广泛

8、应用于桌面端以及数据中心领域,基于固态硬盘的集中式或分布式存储是当前金融行业关键业务的最佳选择。二、新核心存储选型经验及应用成效在某行新核心项目启动建设之后,主要硬件设备平台选型是项目前期工作的重点之一。(一)选型原则选择一个适合自己的技术,比一味地选择新技术要重要的多,尤其是在关键设备选型时,选型者不能盲目的听从厂商销售,要多交流、多思考,分析对比不同产品的利弊;不能简单照搬同业的解决方案,要结合自身情况进行优化和适配,结合同业和厂商的最佳实践、取长补短。生产设备选型建议遵循两个基本原则:一是稳定性和可靠性能够满足生产环境要求,二是不大量增加运维负担。从外部环境来看,银行业的强监管是一直延续

9、的,不出现系统性风险是银行科技工作的基本要求。从近些年同业出现的比较严重的业务中断事件原因来看,基本都是因为基础设施或存储设备故障导致的。存储设备承载的是数据,而数据又是银行信息化建设的血液、是生产资料,存储服务中断或数据丢失造成的影响,随着信息化建设进程的深入,变得越发重大。对于中小型银行来说,评估产品稳定性最好的方法是看该产品是否有多个同等或高于自己规模企业的案例。此外,软件生命周期的百分之七十都是在运维,硬件设备更多,一个不考虑后期运维的选型是极其不负责任的。银行自身运维人员的数量、掌握能力,新技术学习的难易程度,原厂商本地化的支持能力等都是需要考虑的问题。(二)新核心存储选型考虑的主要

10、因素技术从某种意义上来说是一种工具,工具的价值主要体现在使用者如何使用,再好的工具使用错误,往往也会适得其反。产品也是一样,没有一种包打天下、适合所有应用场景的产品,在产品选型之前,一定要仔细分析利弊,权衡创新和稳定,才能够选择到合适产品,给后期运行维护减轻负担。某行的核心存储选型主要考虑了如下几个方面:1. 核心是银行系统的心脏,核心系统一旦出现问题几乎会影响到所有的对外交易服务。所以对于核心系统数据存储设备的选型,稳定性是需要放在第一位的。2. 一般银行高端硬件设备使用的生命周期在五年以上,设备选型需要考虑产品技术的先进性以及原厂支持服务时间,选择设备应至少能够满足未来三到五年业务的发展需

11、要。3. 共享文件是目前多数使用负载均衡应用的通用需求,在核心系统选型方面是使用存储端的NAS解决方案,还是选择操作系统层面的共享文件系统如GPFS。此外,规划选择两地三中心解决方案、保护现有容灾端设备投资等等都是选型需要考虑的问题。(三)核心存储平台投产方案经过前期调研、测试,某行最终选择的方案如下:1产品架构方面选择的还是集中式数据存储,没有考虑分布式存储。集中式存储最大的优势在于架构简单、维护相对容易,已有的运维经验能够延续,同时传统存储厂商在非一线城市的本地化支持能力相对较强,对于中小型银行来说,互联网业务的增长规模比较大行有一定的局限性,而且未来可以通过拆分互联网核心以解决,综合分析

12、来看集中式存储是当前传统核心的最佳选择。分布式存储目前主要还存在一些问题:一是产品稳定性有待进一步增强,集中式存储多诞生于上世纪80-90年代,而分布式存储出现时间才刚刚几年,软件的可靠性是需要经历长时间、大量客户的验证以及锤炼的,Oracle数据库软件在出现的早几年也是存在很多问题;二是价格优势不明显,分布式存储厂商经常会用价格作为重要武器去攻击集中式存储,但是在用户真正采购时发现,虽然其使用的廉价X86平台硬件成本比集中式要低,但是如果加上不菲的软件授权以及后续支持服务费用,总体成本对比集中式的中端存储往往会更高。综上所述,我们认为分布式存储目前还不适合银行传统的核心业务,可以在一些创新业

13、务、互联网场景业务中进行试用,使用前做好数据容灾及备份方案,以防对生产系统稳定运行造成影响。2产品型号方面选择的是DELL EMC VMAX250F全闪存存储,主要考虑的因素是固态硬盘比较于机械硬盘优势明显,虽然目前还存在一些问题,但是存储设备的可靠性主要依赖于微码,单个硬件设备(如控制器、硬盘)的故障或缺陷对存储设备持续运行影响有限。3共享文件存储选择了使用高端存储自带的NAS功能,目的在于尽可能简化架构,减少故障点。4“两地三中心”架构延续使用了高端存储的底层复制技术,其中同城为同步、异地为异步复制,同时核心数据库在同城机房使用Oracle ADG技术额外增加了一层数据保护,防止逻辑错误。

14、(四)投产后成效新核心存储投产上线以后,目前已稳定运行了一年多,对比与老核心,最大的提升在存储性能。对于日间交易来说,一些低效SQL因为存储性能的提升而有所缓解,降低直接或间接阻塞交易的概率,给运维处置留有一定的缓冲时间;夜间批处理效率提升更为明显,因为存储吞吐量的提升以及延时的降低,将批处理时间缩短了近三分之二,给后续数仓及下游系统报表批量空出了更多的时间。三、投产后出现的难点问题如何解决某行使用的全闪存存储实际上是老核心存储的升级,总体架构和技术更新上没有本质的变化,总体来说升级后性能比较稳定,出现的问题主要还是在与其他软硬件产品的匹配上。(一)批处理资源的调配问题批处理时间的缩短,可以通

15、过应用程序的高并发实现对硬件性能的极度压榨来实现。在实际运行中,计算资源(CPU)和存储性能往往是相互制约、相互影响的关系,当计算资源相对紧张时,应用程序因无法获得更多的CPU而阻塞,存储资源无法得到充分的利用;同样存储因为性能不够,导致延时大幅度上涨时,操作系统端IO WAIT过高,计算资源的利用率也会相对较低。从另一方面来看,如果主机到存储的带宽足够大、以及存储性能的足够好,一直增大应用程序的并发,计算资源是一定会被耗尽的。对于银行来说,夜间批处理的时间段还并行着业务交易,从成本上考虑批处理服务器往往也同时运行着应用服务,当批处理主机计算资源被耗尽后,分配到该主机的交易会因为延时大幅度增长

16、而影响客户体验。所以,批处理程序不能一味地压榨硬件设备的性能,需要平衡批量时间以及硬件资源利用率之间的关系,通过测试选择合适的并发度,将存储延时和主机CPU利用率控制在适当的范围之内。(二)同城容灾设备的匹配问题银行的核心系统遵照监管要求,是需要采用“两地三中心”架构部署的。而多数“两地三中心”解决方案中,同城机房一般会采用同步或双活方式进行部署,也就是一个IO从生产端存储写入,需要等容灾端存储同样写完成后才能够提交。一旦生产端选择使用全闪存存储,容灾端的最佳实践是使用同型号、同配置的全闪存存储,如果因为设备利旧或预算等其他原因无法采购时,容灾端至少应使用混闪存储,且存储的CPU核数、缓存配置

17、应尽可能贴近生产存储,以防容灾端拖累生产端存储性能,而失去主存储的性能优势。此外,生产与容灾之间的光纤链路也有可能成为存储性能的瓶颈,配置时应根据生产端存储峰值的吞吐量,对中间波分链路带宽进行扩容,绑定合适数量的存储交换机端口以扩大BBcredit值。总之,使用全闪存存储最大的优势在于性能,而性能的提升往往不是一蹴而就、单纯换个设备这么简单,需要应用软件、系统软件、网络、周边硬件设备的配合,特别针对有批处理的重要系统,建议投产前多进行测试,一是对配合存储的软硬件设备进行调优,充分发挥存储性能的优势;二是过程中要密切监控硬件设备资源、链路带宽的利用率,将其控制在合理的范围之内,以防对其他系统的运行造成影响。四、总结及建议全闪存存储到目前为止已经十分成熟,适用于中小银行数据中心绝大部分应用场景。随着技术的发展,闪存存储下一步技术发展

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论