企业数据备份管理办法_第1页
企业数据备份管理办法_第2页
企业数据备份管理办法_第3页
企业数据备份管理办法_第4页
企业数据备份管理办法_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

企业数据备份管理办法第一章总则1.1目的为防范勒索病毒、逻辑错误、人为误删、机房级灾难导致的数据不可用,确保××科技股份有限公司(以下简称“公司”)在任意数据丢失场景下15分钟内定位备份、30分钟内完成本机恢复、2小时内完成异地重建,特制定本办法。1.2适用范围本办法覆盖公司总部、三大研发中心、两个云可用区、全国27个直营数据中心及全部外包运维团队,适用对象包括结构化数据(Oracle、MySQL、SQLServer、PostgreSQL、达梦)、非结构化数据(文件、图片、音视频、日志)、半结构化数据(MongoDB、ES索引、JSON日志)、SaaS数据(飞书、钉钉、企业微信、Salesforce)、虚拟机镜像(VMware、KVM、Hyper-V)、容器镜像(Harbor)、代码仓库(GitLab、Gitea、SVN)。1.3合规依据《网络安全法》第二十一条、第三十四条,《数据安全法》第二十七条,《个人信息保护法》第五十一条,GB/T22239-2019《信息安全技术网络安全等级保护基本要求》、GB/T29765-2021《数据备份与恢复技术要求》、ISO27001:2022A.12.3、SOX404条款、PCI-DSSv4.0要求3.5、欧盟GDPR第32条。第二章组织与职责2.1数据安全委员会(DSC)主任:CIO;副主任:CISO;委员:运维总监、DBA负责人、开发总监、法务代表、内审代表。DSC拥有备份策略一票否决权,每月最后一个周五14:00召开备份合规评审会。2.2备份责任人(BackupOwner,BO)每个业务系统指定唯一BO,名单在飞书多维表格“系统权责矩阵”中维护;BO对RPO、RTO、备份完整性、恢复演练成功率负直接责任,年度KPI权重30%。2.3备份运维组(BU)编制7×24值班表,使用GrafanaOncall轮班;负责备份系统日常巡检、告警响应、介质更换、恢复演练执行;每季度向DSC提交《备份运维质量报告》。2.4审计与合规组内审部每半年对备份系统进行穿透式审计,采用随机抽样10%系统、100%核心系统的方式,出具《备份合规审计报告》,发现问题24小时内录入Jira,跟踪关闭率必须100%。第三章备份策略设计3.1分级分类按数据重要性分为P0、P1、P2、P3四级:P0:交易、支付、账务、合同,RPO≤5分钟,RTO≤15分钟,保留7年;P1:客户、订单、库存,RPO≤15分钟,RTO≤30分钟,保留5年;P2:员工、报表、日志,RPO≤4小时,RTO≤2小时,保留3年;P3:市场、培训、临时文件,RPO≤24小时,RTO≤8小时,保留1年。3.2备份方式P0:存储级CDP(持续数据保护)+数据库级归档日志实时推送;P1:快照(ZFS/NetApp)+增量备份(永久增量);P2:每日全量+差异;P3:每周全量。3.3加密与密钥传输采用TLS1.3+AES256-GCM;落盘采用SM4-CBC(国密算法),密钥托管于公司FIPS140-2Level3的HSM,实行双控(MofN方案,N=5,M=3),任何单一管理员无法导出密钥。3.4介质与冗余本地保留:全闪备份池(NVMeSSD)保存最近48小时;异地保留:两个城市级数据中心,距离≥300km,延迟≤20ms,采用对象存储(S3兼容)+蓝光冷存(SonyODA);云保留:阿里云OSS深度冷归档,锁定180天不可删除;冗余度:任意两份介质同时失效,数据仍可用。第四章备份实施流程4.1前置条件a)服务器已安装备份客户端(版本号≥3.2.7),证书指纹在Ansible全局变量中校验;b)备份存储池剩余容量≥30%,否则自动触发扩容工单;c)时区统一为Asia/Shanghai,NTP偏差≤1s;d)已开通443端口及10.0.0.0/8内部网段白名单。4.2新建系统接入步骤(可直接照做)步骤1:登录飞书,进入“备份自助申请”小程序,填写系统名称、IP、数据库类型、预计数据量、RPO/RTO需求;步骤2:系统自动调用Terraform模板,在GitLab生成MR,包含:–备份客户端安装Playbook;–ZFS快照策略Cron;–监控告警规则(Prometheusalertyaml);步骤3:BO在MR中@备份运维组,值班人员30分钟内审批;步骤4:MRMerge后,GitLabCI触发AnsibleTower,自动在目标机执行安装;步骤5:安装完成,系统回写“备份拓扑图”API,生成唯一Backup_ID;步骤6:当晚00:15首次全量自动触发,BU次日10:00前出具《首次备份验证报告》。4.3日常增量Oracle:采用RMANlevel1增量,每天02:00执行,脚本中设置sectionsize64G,并行度8;MySQL:采用xtrabackup–incremental-basedir,压缩算法zstdlevel3,备份文件命名规则:{instance}_{YYYYMMDD}_{hour}_incr.xb.zst;VMware:vSphere6.7+采用ChangedBlockTracking(CBT),通过VeeamBackup&Replication11永久增量,每15分钟一次;对象存储:使用rclonesync–fast-list–checksum–transfers=64,对比MD5。4.4校验与告警每份备份完成后立即执行校验:–数据库:restorevalidatedatabase;–文件:rclonecheck+10%随机抽样md5sum;–虚拟机:MountbackuptoESXisandbox,开机自检30秒;校验失败5分钟内自动飞书语音电话告警值班经理,同时创建P1故障单。第五章恢复演练与可逆性测试5.1演练频率P0系统:每月真实演练一次;P1系统:每季度;P2、P3:每半年。5.2演练类型a)本机原地回滚:验证最近快照;b)异机重建:验证跨机房恢复;c)逻辑纠错:模拟误删1000行订单,通过binlog精确回滚;d)勒索病毒:注入WannaCry模拟器,验证CDP能否回退到加密前30秒。5.3演练流程(以P0系统“支付核心”为例)T0:审计组在Jira创建演练工单,随机选择灾备目标宿主机10.44.123.88;T0+5min:BU将生产库流量通过F5切至热备节点,确保用户无感知;T0+10min:在宿主机执行ansible-playbookrestore_paycore.yml-e“target_time=2024-05-1814:30:00”-e“validate_only=false”;T0+25min:应用组连接恢复实例,执行52条支付接口自动化用例,成功率需100%;T0+30min:审计组对比恢复前后余额,差异为0;T0+35min:出具《支付核心演练报告》,DSC主任签字归档;T0+40min:流量切回生产,演练结束。5.4失败惩罚演练失败:RTO超时1分钟扣BU当月绩效2%,连续两次失败BO降级,系统上线冻结窗口7天。第六章介质与数据生命周期管理6.1介质更换NVMe备份池:写入量达70%额定TBW前30天自动触发采购流程;蓝光光盘:ODA每12个月执行一次MediaIntegrityCheck,出现UNC错误≥3立即整盘重刻;磁带:LTO-9每36个月强制退役,退役前执行三次全读,无CRC错误方可销毁。6.2数据销毁到期数据采用“三遍覆写+物理粉碎”双轨制:–电子介质:使用GNUshred-n3-z-v,日志回传ELK;–物理介质:交由具有《国家保密局销毁资质》的第三方,现场粉碎视频保存3年;销毁过程由审计、法务、安全三方在场,任何一方缺席则流程无效。第七章权限与访问控制7.1最小权限备份系统使用OpenLDAP+RBAC,角色仅五种:–backup_view:只读备份状态;–backup_operator:触发备份、恢复;–backup_admin:修改策略、添加客户端;–security_auditor:只读日志与报表;–super_admin:break-glass,需DSC正副主任双签,限时8小时。7.2多因子所有角色登录必须企业微信扫码+Yubikey5NFC(FIDO2),密码长度≥16位,每90天强制更换,历史12次内不重复。7.3高危命令白名单rm、fdisk、mkfs、dropdatabase等47条命令加入Hash白名单,执行前需二次审批,命令与审批单绑定,审计留存7年。第八章监控、告警与报告8.1监控指标备份成功率、RPO达标率、介质健康度、密钥轮换状态、恢复演练得分、未恢复告警时长、备份存储池使用率、重复数据删除率。8.2告警分级P0:备份失败、RPO超标、密钥即将过期<24h;P1:介质健康度<70%、演练失败;P2:存储池使用率>85%、连续3次增量延迟;P3:蓝光光盘剩余容量<10%。8.3报告日报:飞书群机器人08:30推送昨日核心指标;周报:BU每周一12:00前邮件发送给BO、DSC委员;月报:包含趋势图、TOP10风险、改进计划,DSC会议评审;年报:提交董事会、外部审计,作为SOC1/SOC2类型II证据。第九章灾备切换预案9.1触发条件a)生产库主节点故障≥5分钟且无法重启;b)数据中心级灾难(地震、火灾、电力中断≥30分钟);c)勒索病毒加密文件≥30%且蔓延趋势无法控制。9.2决策流程值班经理→10分钟内确认→上报DSC主任→15分钟内召开Zoom应急会→参会人数≥5且含主任/副主任→投票通过≥2/3→宣布启动灾备切换。9.3切换步骤(以OracleRAC为例)1)冻结中间件流量(Kubernetes执行kubectlpatchdeploy-p'{"spec":{"replicas":0}}');2)确认最后一条归档日志已传到灾备;3)灾备执行recoverdatabaseuntilsequencexxx;4)打开数据库alterdatabaseopenresetlogs;5)修改DNSCNAME指向灾备SCANIP;6)启动中间件Pod;7)业务验证用例100%通过;8)通知客服发布公告。9.4回切生产端修复后,采用DataGuard反向同步,确保数据零丢失,回切窗口安排在业务低峰02:00-04:00,全程录像。第十章供应商与外包管理10.1准入评估备份软硬件供应商须通过公司《信息安全尽调清单》128项,提供近3年无重大安全事故证明、源代码托管协议、后门免责条款。10.2合同条款必须包含:RPO/RTO违约责任、安全事件24小时通知、审计权、源代码escrow、退出协助期≥180天。10.3外包驻场外包工程师接入公司跳板机,使用短期证书(有效期≤7天),操作全程录屏;禁止携带具有存储功能的私人设备进入机房,违反者列入黑名单并赔偿100万元。第十一章培训与意识11.1新员工入职1周内完成《备份安全基础》线上课程(时长45分钟),考试≥90分方可申请生产权限。11.2年度实战每年11月9日“数据安全日”举行全员钓鱼邮件+勒索病毒演练,备份运维组需在30分钟内完成恢复,向全员直播。11.3技能认证BU工程师须取得VeeamVMCE、OracleOCP、MySQLOCP至少一项,公司报销80%费用;未通过者次年调岗或淘汰。第十二章审计、合规与处罚12.1审计抽样内审部使用ACL数据分析工具,对备份日志进行100%全量扫描,重点检查:–未授权恢复;–策略被临时关闭;–密钥未按期轮换;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论