《科学数据 云存储环境运维流程与服务要求》(征求意见稿)_第1页
《科学数据 云存储环境运维流程与服务要求》(征求意见稿)_第2页
《科学数据 云存储环境运维流程与服务要求》(征求意见稿)_第3页
《科学数据 云存储环境运维流程与服务要求》(征求意见稿)_第4页
《科学数据 云存储环境运维流程与服务要求》(征求意见稿)_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS点击此处添加ICS号

CCS点击此处添加CCS号

团体标准

T/XXXXXXX—XXXX

科学数据云存储环境运维流程与服务要求

Scientificdata-Operationandmaintenanceprocessandservicestandardsofcloud

storageenvironment

(征求意见稿)

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

版权所有归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节

不得以其他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络

等。使用许可可于发布机构获取。

XXXX-XX-XX发布XXXX-XX-XX实施

中国信息协会发布

T/XXXXXXX—XXXX

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由中国信息协会提出并归口。

本文件起草单位:

本文件主要起草人:

II

T/XXXXXXX—XXXX

科学数据云存储环境运维流程与服务要求

1范围

本文件规定了科学数据云存储环境在线存储、云归档、云灾备等重点环境的运维流程与服务要求。

本文件适用于科学数据云存储环境相关运维人员开展平台在线存储、云归档、云灾备等环境的运行

维护与支持服务。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

主系统primarysystem

生产系统productionsystem

正常情况下支持组织日常运作的信息系统。

注:包括主数据、主数据处理系统和主网络。

[来源:GB/T20988-2007,3.16,有修改]

科学数据中心sharingcenterofscientificdata

利用信息、网络等现代技术,对科学数据进行搜集、加工、汇交、整合、安全存储和管理,并向社

会各界提供科学数据开放共享服务的专业化机构。

[来源:GB/T31075-2014,]

云存储cloudstorage

按照制定的具有可扩展性的服务水平,通过网络将虚拟的存储和数据服务以按需使用、按量计费的

方式提供的服务交付方式。该交付方式无需配置或以自服务方式配置。

[来源:GB/T31916.1-2015,3.1.1]

在线存储onlinestorage

存储设备安装在系统中,系统可直接访问数据的存储技术。

注:在线存储设备主要是磁盘、磁盘阵列,可满足对高利用率数据的频繁、高速操作的要求。

[来源:DA/T58-2014,5.4]

分布式文件存储distributedfilesystem

一种作为应用安装在操作系统之上的文件系统,其存储资源分布在不同的计算机节点上,并通过计

算机网络相连。

[来源:GB/T31916.3-2018,4.1.1]

云归档cloudarchive

一种存储获得模式,通过云存储服务提供商远程地维护和备份不再需要被常规访问的数据。

应急预案contingencyplan

1

T/XXXXXXX—XXXX

一种关于备份、应急响应和灾后恢复的计划。

[来源:GB/T25069—2010,]

云灾备clouddisasterpreparedness

灾备业务的云端实现形式。

注:主要包括灾难备份(3.10)和灾难恢复服务(3.9)。

灾难恢复服务disasterandrecoveryservices

为了将信息系统从灾难造成的故障或瘫痪恢复到可正常运行的状态、并将其支持的业务功能从灾

难造成的不正常状态恢复到可接受状态而进行的分析、设计、实施、运行、维护及组织管理等活动和流

程。

[来源:GB/T36957-2018,3.2]

灾难备份backupfordisasterrecovery

为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行

备份的过程。

[来源:GB/T20988-2007,3.2]

4云存储环境运维参与人员

概述

云存储环境运维参与人员主要包括运维平台值班组、系统管理员、存储管理员和网络管理员4种类

型。

运维平台值班组

运维平台值班组负责对接外部用户服务;负责生产系统的运维服务及管理;负责值班期间的用户工

单处理及故障处理;负责编制运维服务报告。

系统管理员

系统管理员负责生产系统云存储环境的账号、角色、租户及权限的分配与管理;负责云存储环境的

配置管理、变更管理和故障管理;负责云计算平台的运维及服务;负责大数据底层平台运维及服务;负

责服务器的调试、维护、监控和故障处理等日常工作,保证服务器的稳定运行;负责系统平台的调整结

构满足应用服务的需要;负责监控平台的运维,对硬件、服务、流量做监控,以便出现问题时能第一时

间知道并解决。

存储管理员

存储管理员负责生产系统云存储环境的管理及运维;负责云归档备份环境的管理及运维;负责存储

区域网络(SAN)的建设、规划、管理及运维;负责存储环境的故障处理、性能调优。

注:网络规划建议由网络管理员负责,而且不应该限定存储区域网络(SAN)。

网络及安全管理员

网络及安全管理员负责云环境内部云网络及安全设备日常维护、配置及管理工作,根据系统运行状

况,及时对虚拟化云网络环境进行优化调整及安全防护,保障整个环境顺畅运行;负责云环境内部云网

络的网络规划、实施与安全运行维护;负责网络故障排查、日志及网络流量分析。

5云存储环境资源申请、用户服务流程与要求

资源申请运维流程

2

T/XXXXXXX—XXXX

云存储环境资源用户申请云存储资源流程见图1。

云存储环境部署于科学数据中心总中心以及各地区域中心内,并由其进行运维管理。用户可通过该

流程申请其云存储环境资源。

图1云存储环境资源申请运维流程图

用户服务流程与要求

5.2.1用户服务流程

云存储运行环境用于服务流程见图2。

用户可通过该流程申请科学数据中心总中心以及各地区域中心的云存储环境的运维服务。

3

T/XXXXXXX—XXXX

图2云存储环境运维流程图

5.2.2用户服务要求

服务处理时长不应超过2个工作日,特殊问题应及时反馈并上报。

6云存储环境运维管理流程与要求

在线存储运维流程与要求

6.1.1在线存储运维流程

云存储环境在线存储运维流程见图3。

4

T/XXXXXXX—XXXX

图3云存储环境在线存储运维流程图

a)在线存储方式:主要包括分布式文件存储、存储区域网络(SAN)存储等在线存储类型。

b)在线存储地点:科学数据中心总中心及区域中心。

6.1.2在线存储运维要求

云存储环境在线存储运维应符合以下要求。

a)分布式文件存储应通过文件传输协议(FTP)或网络文件系统(NFS)等方式提供存储空间。

b)存储区域网络(SAN)存储通过传统存储区域网络(SAN)高端盘阵提供块存储服务。应通过闪

盘(SSD)、高性能磁盘以及低性能磁盘提供存储空间。

c)在线存储运维处理时长不应超过2个工作日,特殊问题应及时反馈并上报。

云归档运维流程与要求

6.2.1云归档运维流程

5

T/XXXXXXX—XXXX

云存储环境云归档运维流程见图4。

图4云存储环境云归档运维流程图

a)归档方式:高性能磁盘归档、低性能磁带归档以及多重保护(磁盘+磁带)归档可以根据用户

需求进行个性化服务。

b)归档地点:科学数据中心归档中心。

6.2.2云归档运维要求

云归档运维处理时长不应超过5个工作日,特殊问题应及时反馈并上报。

云灾备建设运维流程与要求

云存储环境云灾备建设运维流程见图5。

6

T/XXXXXXX—XXXX

图5云存储环境云灾备建设运维流程图

a)灾备地点:科学数据中心总中心及灾备区域中心,一般为支持电子信息系统(机房)G5级的高

等级容灾能力的灾备环境。

[来源:T/CCUA001-2019]

b)灾备演练:可根据用户需求进行个性化服务,灾备恢复演练正常情况下为1年1次。

云灾备恢复流程

云存储环境云灾备恢复流程见图6。

7

T/XXXXXXX—XXXX

图6云存储环境云灾备恢复运维流程图

监控运维流程与要求

6.5.1监控运维流程

云存储环境监控运维流程见图7。

8

T/XXXXXXX—XXXX

图7云存储环境监控运维流程图

6.5.2监控运维要求

云存储环境监控运维应符合以下要求:

a)应将总中心与各地区域中心云存储环境服务器纳入监控范围内。

b)应在云存储环境部署系统监控管理系统,并安排专人对服务器、应用系统等进行及时有效监控

管理,对发生的故障或安全事件应第一时间发动邮件和短信报警,运维人员应第一时间处理。

c)系统管理员负责进行安全巡检,将需要监控的系统环境纳入监控平台进行实施监控。

d)主机系统的日志记录应集中保存在专业的日志服务器上,并且对设备的日志记录进行定期的

审计分析管理。

e)平台环境中应部署统一的网络时间协议(NTP)时钟系统,并且保证时钟的精确程度,主机系

统的时钟应统一为NTP时钟,以确保主机系统的时钟同步。

f)对所有的主机系统的安全监控记录和日志记录信息应进行妥善保存,至少保存半年以上。

系统补丁运维流程与要求

6.6.1系统补丁运维流程

云存储环境系统补丁运维流程见图8。

9

T/XXXXXXX—XXXX

图8云存储环境系统补丁运维流程图

6.6.2系统补丁运维要求

云存储系统补丁运维应符合以下要求。

a)运云存储环境操作系统、数据库或中间件应根据官方公布的漏洞及版本更新信息及时安装最

新补丁程序。

b)补丁更新前应制定补丁更新测试方案,明确测试参与人员、测试内容和测试流程等,在系统测

试环境中进行补丁更新测试工作。

c)正式的补丁更新之前,应制定详细的回退方案,对系统重要文件数据资源进行备份。

d)系统补丁更新完成后,应跟踪观察系统的运行状况至少一周时间,确认无异常后完成补丁更新

工作。

故障处理运维流程与要求

6.7.1故障处理运维流程

10

T/XXXXXXX—XXXX

云存储环境故障处理运维流程见图9。

图9云存储环境故障处理运维流程图

6.7.2故障处理运维要求

云存储环境故障处理运维应符合以下要求。

a)一旦发现故障,应第一时间进行处理,最长不可超过一个工作日。

b)针对重大硬件故障,需要进行服务器替换的,如中心有备用服务器则应确保在1小时内完成服

务器的替换工作,如中心没有,则应在1个工作日在完成服务器的替换工作。

c)在解决故障的过程中,应依据系统和应用故障处理要求进行。

d)在问题解决、系统恢复正常之后,应根据“故障分级表”(见附录A)对故障进行分级,对于

故障级别在三级及以上的应填写故障处理报告。同时分析故障发生的原因,提出预防及应急处

理方案。

e)在故障处理的过程中,对于服务器或应用软硬件配置发生变化,应及时更新服务器档案。

f)对于无法处理的故障情况,应及时上报,并请求技术专家支持协助。

备份及恢复运维流程与要求

6.8.1备份及恢复运维流程

云存储环境备份及恢复运维流程见图10。

11

T/XXXXXXX—XXXX

图10云存储环境备份及恢复运维流程图

6.8.2备份及恢复运维要求

云存储环境备份及恢复运维应符合以下要求。

a)针对云存储平台环境备份,应做到双活增量备份。

b)针对云存储环境不同级别的数据应制定相应存储备份策略,明确数据信息的备份频率、备份介

质、备份方式和归档策略等。

c)应确保存储网络的光纤交换机、通信线路和数据处理系统的冗余配置,实现数据存储网络的高

可靠性和高可用性。

d)针对云存储环境不同级别的数据应制定相应的定期恢复测试策略,确保备份数据安全有效。

应急预案运维流程与要求

6.9.1应急预案运维流程

云存储环境应急预案运维流程见图11。

12

T/XXXXXXX—XXXX

图11云存储环境应急预案运维流程图

6.9.2应急预案运维要求

云存储环境应急预案运维应符合以下要求。

a)做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪

该事件直至其结束。

b)对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展

情况,并做好登记工作上报领导。

c)正常情况下,值班人员应在10分钟内进行事件确认。若属于一般事件则应按照事件流程进行

分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应

急处置,及时汇报上级领导,掌握实时处理情况。

d)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快

联系技术工程师或厂家技术支持赶赴现场援助处理。

13

T/XXXXXXX—XXXX

变更管理运维流程与要求

6.10.1变更管理运维流程

云存储环境变更管理运维流程见图12。

图12云存储环境变更管理运维流程图

6.10.2云存储环境变更管理运维要求

云存储环境变更管理运维应符合以下要求。

a)环境应变更为常规性升级、扩容等。

14

T/XXXXXXX—XXXX

b)根据云存储环境变更所涉及的信息资产的安全等级,应对变更进行分级,并且根据变更级别的

不同,制订相应的变更审批管理程序,审批管理程序应主要包括:变更申请、变更受理、变更

审批的部门、审批步骤、审批的权限等内容。

c)变更计划中应包括变更的风险、对系统的影响、变更的测试内容、变更实施步骤、资源要求、

变更的时间安排及回退方案等内容。

d)应明确变更实施的组织和职责、变更实施的资源要求以及变更实施的时间要求。

e)应定期对一定时间段内的所有变更实施结果进行统计分析,至少每三个月一次。

区域中心管理运维流程与要求

6.11.1区域中心管理运维流程

云存储运行环境区域中心管理运维流程见图13。

图13云存储环境区域中心管理运维流程图

6.11.2区域中心管理运维要求

云存储环境区域中心管理运维应符合以下要求。

a)区域中心管理人员应依据本文件对云存储环境进行运维服务。

b)一旦发现故障,应第一时间进行处理,最长不可超过一个工作日。

c)业务系统发生故障后,需要在不对系统造成损失的前提下,应记录事件截图,保留网络设备、

服务器系统及业务系统日志以备后续分析。

15

T/XXXXXXX—XXXX

d)对于无法处理的故障及问题,总中心应视情况派遣相关工程师以及厂商技术人员实地进行故

障处理。

数据删除管理

数据删除管理主要包括以下几个方面。

a)针对即将过期的在线数据空间、归档数据及灾备数据,系统运行室应提前提示用户是否需要继

续使用。

b)如果不再使用,该空间将不再处于受保护状态,新数据即会覆盖该数据或通过存储管理员进行

手动删除操作。

c)若仍需保留,应续签合同或协议或,待审批通过后,存储管理员方可对该批数据进行延期操作。

d)针对尚未过期的数据,如用户不再需要灾备,可向运维平台值班组提出删除申请,由存储管理

员手动删除该数据即可。

主机设备管理

主机设备管理主要包括以下几方面。

a)按照中心规定对云存储环境的固定资产进行管理,粘贴资产标签并配合资产处盘点。对于因故

障离线的设备应进行及时报备。

b)应定期对云存储平台设备冗余配置进行切换测试,测试内容主要包括:冗余链路、冗余端口或

冗余设备等,至少每一年进行一次。

账号管理

账号管理主要包括以下几方面。

a)云存储环境系统不同权限的用户应分配不同的账号,严禁不同的用户间共享账号。

b)应定期检查系统账号文件,以发现可疑的用户账号或无用的用户账号。

c)应删除或锁定系统运行业务室可疑的用户账号或与设备运行维护等与工作无关的用户账号。

d)应更改系统运行业务室主机存储管理员账号的缺省名称,严禁使用管理员账号进行日常维护。

e)应制定严格规范的系统账号口令策略,即主机系统的口令应满足复杂性要求(至少8位,包含

数字、字母、符号),且至少90天更新一次。

f)应制定严格规范的系统账号登录锁定策略,即在用户连续登陆失败3次后应锁定其账号10min。

存储资源管理

存储资源管理主要包括以下几方面。

a)对云存储环境的存储介质(磁盘、磁带和阵列等)的采购、入库、存放环境、使用、维护和销

毁等应进行规范化管理。

b)根据所承载数据的重要程度对存储介质进行分类和标识,对于敏感数据应指定专门存储区域

进行存储并加强对其访问的控制。

c)对存储介质的归档和查询等应进行登记记录,并根据存储介质目录清单定期进行盘点。

d)对转用或销毁的存储介质应先对其中的敏感数据进行不可恢复性清除,对保密性较高的存储

介质未经批准不得自行销毁。

e)对送外维修的存储介质应对其中的敏感数据进行不可恢复性清除,若存储介质是送外进行数

据修复,应在第三方服务水平协议中明确第三方的保密义务或单独签订保密协议。

16

T/XXXXXXX—XXXX

A

A

附录A

(资料性)

故障分级表

故障分级表见A.1。

表A.1故障分级表

故障分类等级业务故障描述

一级故障业务中断8小时以上。

二级故障业务中断2-8小时。

业务可用类三级故障业务中断1-2小时,业务核心功能无法使用。

四级故障业务中断1小时以下,业务核心功能受到影响。

五级故障业务中断1小时以下,业务次要功能无法使用。

系统入侵:核心业务受到入侵,核心用户数据等受到入侵,或者系统文件给恶意窜

改,容易引发入侵扩散。

一级故障页面窜改:门户网站首页给非法窜改内容、内容涉及危害性极大。

CGI漏洞:已经引起大面积用户讨论、传播和以之侵害公司品牌利益,或者造成直接

经济损失。

系统入侵:核心业务受到入侵,未危及重要数据,仅造成扩散隐患但是并未发现有

以外的机器系统受入侵。

二级故障

业务安全类页面窜改:业务页面给非法窜改内容、或者小恶作剧。

CGI漏洞:由外部发现但还没有造成重大危机或者造成经济利益损失。

系统入侵:核心业务存在高危端口或者系统漏洞。

三级故障CGI漏洞:由内部发现但还没有造成重大危机或者造成经济利益损失的核心系统漏

洞。

系统入侵:非核心业务存在高危端口或者系统漏洞。

四级故障CGI漏洞:由内部发现但还没有造成重大危机或者造成经济利益损失的普通系统漏

洞。

17

T/XXXXXXX—XXXX

参考文献

[1]GB/T20988-2007信息安全技术信息系统灾难恢复规范

[2]GB/T25069—2010信息安全技术术语

[3]GB/T31075—2014科技平台通用术语

[4]GB/T31916.1-2015信息技术云数据存储和管理第1部分:总则

[5]GB/T31916.3-2018信息技术云数据存储和管理第3部分:分布式文件存储应用接口

[6]GB/T36957-2018信息安全技术灾难恢复服务要求

[7]DA/T58-2014电子档案管理基本术语

[8]T/CCUA001-2019数据中心基础设施等级评价

18

T/XXXXXXX—XXXX

目次

前言..........................................................................II

1范围...............................................................................1

2规范性引用文件.....................................................................1

3术语和定义.........................................................................1

4云存储环境运维参与人员.............................................................2

概述...........................................................................2

运维平台值班组.................................................................2

系统管理员.....................................................................2

存储管理员.....................................................................2

网络及安全管理员...............................................................2

5云存储环境资源申请、用户服务流程与要求.............................................2

资源申请运维流程...............................................................2

用户服务流程与要求.............................................................3

6云存储环境运维管理流程与要求.......................................................4

在线存储运维流程与要求.........................................................4

云归档运维流程与要求...........................................................5

云灾备建设运维流程与要求.......................................................6

云灾备恢复流程.................................................................7

监控运维流程与要求.............................................................8

系统补丁运维流程与要求.........................................................9

故障处理运维流程与要求........................................................10

备份及恢复运维流程与要求......................................................11

应急预案运维流程与要求........................................................12

变更管理运维流程与要求.......................................................14

区域中心管理运维流程与要求...................................................15

数据删除管理.................................................................16

主机设备管理.................................................................16

账号管理.....................................................................16

存储资源管理.................................................................16

附录A(资料性)故障分级表....................................................17

参考文献......................................................................18

I

T/XXXXXXX—XXXX

科学数据云存储环境运维流程与服务要求

1范围

本文件规定了科学数据云存储环境在线存储、云归档、云灾备等重点环境的运维流程与服务要求。

本文件适用于科学数据云存储环境相关运维人员开展平台在线存储、云归档、云灾备等环境的运行

维护与支持服务。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

主系统primarysystem

生产系统productionsystem

正常情况下支持组织日常运作的信息系统。

注:包括主数据、主数据处理系统和主网络。

[来源:GB/T20988-2007,3.16,有修改]

科学数据中心sharingcenterofscientificdata

利用信息、网络等现代技术,对科学数据进行搜集、加工、汇交、整合、安全存储和管理,并向社

会各界提供科学数据开放共享服务的专业化机构。

[来源:GB/T31075-2014,]

云存储cloudstorage

按照制定的具有可扩展性的服务水平,通过网络将虚拟的存储和数据服务以按需使用、按量计费的

方式提供的服务交付方式。该交付方式无需配置或以自服务方式配置。

[来源:GB/T31916.1-2015,3.1.1]

在线存储onlinestorage

存储设备安装在系统中,系统可直接访问数据的存储技术。

注:在线存储设备主要是磁盘、磁盘阵列,可满足对高利用率数据的频繁、高速操作的要求。

[来源:DA/T58-2014,5.4]

分布式文件存储distributedfilesystem

一种作为应用安装在操作系统之上的文件系统,其存储资源分布在不同的计算机节点上,并通过计

算机网络相连。

[来源:GB/T31916.3-2018,4.1.1]

云归档cloudarchive

一种存储获得模式,通过云存储服务提供商远程地维护和备份不再需要被常规访问的数据。

应急预案contingencyplan

1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论