版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品广西区质量技术监督局数据库维保服务方案南宁秦唐科技有限公司2016 年 8 月目录广西区质量技术监督局数据库 1.维保服务方案 1.1 项目背景及目标 5.1.1 项目背景 5.1.2 项目目标 5.2 需求分析 6.感谢下载载3 维保范围 7.4 数据库维保方案 8.4.1 系统健康状态检查 Oracle 数据库运维主要核查项 Mysql 数据库运维主要检查项 154.1.3 SqlServer 数据库运维主机检查项 164.2 数据库性能分析与优化调整 174.3 数据库备份以及恢复服务 184.4 数据库补丁分析与安装 184.5 7*24 小时数据库
2、救援服务 185 技术支持以及服务体系 195.1 故障处理要求 195.2 重大活动现场护航 205.3 维护作业计划 205.4 信息安全保障 205.5 第三方协助服务 215.6 服务质量分析 216 项目实施以及管理 216.1 项目实施策略 216.2 项目实施计划 226.3 项目交付文档 226.4 交付要求 226.5 提交文件资料23项目背景及目标1.1项目背景广西区质量技术监督局信息化建设经过多年的发展和完善, 已经建立成熟的网络环境及生产经 营管理的各类应用系统, 目前质监局拥有多套不同类型的数据库 (多种操作系统) 混合使用( Oracle , Mysql , Sql
3、Server ),共十几个节点,其中最大的 oracle 生产数据库已高达 3TB ;随着质监工作 的业务发展,各系统数据量逐年增加 ,作为业务核心的数据库,安全性,可靠性的要求也变得越 来越高 , 需要更加专业细致地对数据库维护,以便更好地为全区质监工作提供 IT 服务。1.2通过建立规范的维护作业体系,及时发现数据库运行中的风险问题,防患于未然,保障数据库 运行健康持续。对数据库运行性能进行监测分析, 及时发现瓶颈, 通过外部资源调优、 行的重新安排调优、 SQL 性能调优、表格和索引存储参数设置调优等方式,及时对性能问题进行处理,保障数据库稳定高效 工作;对各个系统数据库进行补丁升级服务
4、, 安装补丁前需要对补丁的可行性及风险性进行分析, 并 制定升级计划和应急回退计划。同时要做好系统备份准备及详细的测试工作,确保系统的稳定性、 安全性,保障系统业务数据的安全;2 需求分析广西区质量技术监督局项目现场多种数据库共存,相互为多个应用系统服务。为保证数据库系统的稳定、安全、合理和高效,减低故障对生产的影响,消除生产故障的薄弱环节,现需购买对以下数据库的保修和维护服务。ID数据库节点数据库类型应用说明保障级别1oracle rac 双节点(HP主机)oracle10g金质工程核心数据库重要2oracle rac 双节点(Linux)oracle10g金质工程核心数据库重要3Oracl
5、e 单节点Oracle 10g边界交换数据库重要4Oracle 单节点Oracle 10g云平台数据库(内网)重要5Oracle 单节点Oracle 10g云平台数据库(外网)重要6SQL SERVERMSCS1mssql server2008外部门户数据库重要7SQL SERVERMSCS2mssql server2008外部门户数据库重要8SQL SERVERMSCS3mssql server2008OA考核重要10SQL SERVERMSCS4mssql server2008重要1mysql 集群1普通112mysql集群2普通3 维保范围1)提供常态化服务和技术支持,并配备资深工程师,
6、工程师熟悉oracle/sqlserver/mysql 等各种主流数据库技术,保证能快速、有效的解决各类故障。2)配置和优化系统安全、加固,故障的诊断与排除等。3)数据库系统恢复服务,确保系统崩溃后的快速恢复。4)为客户提供各个版本数据库系统运行和维护的合理建议。5)数据库系统软件升级(用户要求)和不限次(或配合用户)安装。6)对数据库系统本身存在的安全隐患和安全问题,进行修复;对系统配置和数据定期备份7)提供系统维修及维护报告。4 数据库维保方案数据库维保工作主要包括: 数据库健康状态检查、 数据库性能分析与调整、 数据库备份与恢复、 数据库补丁分析与安装、 7*24 小时数据库救援等工作。
7、4.1 系统健康状态检查检查内容包括Oracle 数据库和 CRS 错误日志和分析 ;? 文件系统空间使用情况检查;Oracle 数据库及 RAC 系统运行情况状态、性能分析和优化建议IO 情况检查 ;? 检查其 OS 状况,包括 CPU 、内存和交换区使用情况,硬盘和网络的记录 Oracle 数据库存储空间的逻辑结构;Oracle 数据库备份情况检查;根据检查结果分析并给出数据库可行的调整建议和实施;每月至少进行一次系统健康状态的检查,根据制定的维保服务内容和流程对Oracle 、Mysql ,SqlServer 进行一次全面巡检,包括检查数据库设备、系统的运行情况; 每月25 日之前提供数
8、据库巡检报告 。4.1.1 Oracle 数据库运维主要核查项提供切实可行的运维建设机制, 内数据库的运维主要结合广西质量技术监督局的实际情况,容覆盖 ORACLE 数据库的日常维护、紧急故障处理,软件升级等,客户可依据服务内容进行相 应的定制。我们将会提供全面的、针对性的服务解决方案,以保客户系统稳定、高效、可靠的运 行,以达到对业务系统的有效支持。 检查数据库cpu、I/O、内存性能记录数据库的cpu使用、10、内存等使用情况,使用vmstat,iostat,sar,top等命令进行信息收集并检查这些信息,判断资源使用情况。 检查rman 备份的有效性resto
9、re preview/restore database preview命令此命令用来查看还原需要使用哪个备份集来执行特定的恢复使用validate和check logical参数的restore命令,检查备份集,以确认数据库是可恢复的restore database validate使用check logical参数可以更完全的检查最新备份集runrestore database check logical validate;使用 validate backupset 命令使用具有validate参数或check logical参数的restore命令只能检查最新的备份集如果要检查任意的备份集
10、,就需要用validate backupset 命令。首先必须确认要检查的备份集的键(backup set key)list backupset;再执行检查validate backupset 141;或validate backupset 141 check logical; 检查oracle数据库集群运行状况用crs_stat -命令检查oracle数据库的几个集群模块是否有offline的 检查数据库的 Alert.log 日志,是否有 ora错误对每个数据库,cd 至 I bdump 目录,通常是 $ORACLE_BASE/admi n/bdump查看最新时
11、候有ora错误,找出来分析 收集每个数据库的 AWR报告,根据报告内容,优化数据库排查是否存在影响系统性能的等待事件、top 5 SQL、硬解析是否太高、缓冲区命中率是否高 检查ASM 磁盘组空间是否足够selectin sta nce_n ame,host_ name,startup_time,status,database_statusfromgv$in sta nee;确保数据磁盘组有足够的空间给数据库使用,如果是用于归档日志用的ASM磁盘组空间满,必须及时用rman备份并删除旧的归档日志。 检查各个数据库操作系统的磁盘空间利用率df -h 或者
12、 df -m文件系统空间使用率超过 80%,必须要清理磁盘无用的文件或者日志 检查数据库各个节点都处于读写模式select n ame,log_mode,ope n_mode from gv$database;各个节点都正常,数据库才能实现负载均衡和失败切换的功能 查看表空间使用率,及时添加数据文件SELECT UPPER(F.TABLESPACE_NAME) 表空间名,D.TOT_GROOTTE_MB 表空间大小(M),D.TOT_GROOTTE_MB - F.TOTAL_BYTES 已使用空间(M),TO_CHAR(ROUND(D.TOT_GROOTTE_MB
13、- F.TOTAL_BYTES) /D.TOT GROOTTE MB * 100,2),990.99)使用比,F.TOTAL_BYTES 空闲空间(M),F.MAX_BYTES 最大块(M)FROM (SELECT TABLESPACE_NAME,ROUND(SUM(BYTES) / (1024 * 1024), 2) TOTAL_BYTES, ROUND(MAX(BYTES) / (1024 * 1024), 2) MAX BYTES FROM SYS.DBA FREE SPACEGROUP BY TABLESPACE NAME) F,(SELECT DD.TABLESPACE_NAME,R
14、OUND(SUM(DD.BYTES) / (1024 * 1024), 2) TOT GROOTTE MBFROM SYS.DBA_DATA_FILES DDGROUP BY DD.TABLESPACE_NAME) DWHERE D.TABLESPACE_NAME = F.TABLESPACE_NAMEORDER BY 4 DESC;密切关注各个表空间使用情况,使用率查过85%以上的,要及时添加数据文件到表空间,并与上个月巡检结果对比,估算主要业务表空间增长增长情况,一次性添加做过数据文 件0检查失效的索引Select * from dba_indexes where statu
15、s=UNUSABLE:如果有失效索引, alter in dex in dex_name rebuild online在线重建。1检查大表,分析是否需要转换成分区表存放SELECT SEGMENT NAME, ROUND(SUM(BYTES) / 1024 / 1024 / 1024, 2) GFROM DBA_SEGMENTSWHERE OWNER NOT IN (SYS, SYSTEM)AND segme nt type NOT IN(INDEX, INDEX PARTITION, INDEX SUBPARTITION)GROUP BY SEGMENT_NAMEORDER B
16、Y G DESC;对于日志大表,建议改造成采用按时间分区的分区表,提升数据库读写效率。精品2检查oracle每个实例的的实际连接数和数据库配置的连接数Select count(1) from v$session;-实际连接的 session 数量show parameter sessi on;如果实际连接的session连接数快要达到系统配置的session数量,需要增加session的数量,以免有业务无法正常连接数据库3检查数据库运行慢的 SQLSELECT USERNAME,SID,OPNAME,ROUND(SOFAR * 100 / TOTALWORK, 0)
17、 | % AS PROGRESS,TIME REMAINING,SQL_TEXTFROM V$SESSION_LONGOPS, V$SQLWHERE TIME REMAINING 0AND SQL ADDRESS = ADDRESSAND SQL_HASH_VALUE = HASH_VALUE;检查占用CPU比较多的SQLS.USERNAME USERNAME,S.OSUSER OSNAME,P.SERIAL# S_#,P.TERMINAL,P.PROGRAM PROGRAM,P.BACKGROUND,S.STATUS,RTRIM(SUBSTR(A.SQL_TEXT, 1, 80) SQLFR
18、OM V$PROCESS P,V$SESSION S,V$SQLAREA A WHERE P.ADDR = S.PADDR AND S.SQL_ADDRESS =A.ADDRESS(+) AND P.SPID LIKE %&1%;5检查最消耗内存资源的SQLselect b.pga alloc mem / 1024 / 1024, a.*from v$sessi on a, v$process bwhere a.PADDR = b.addrand pga_alloc_mem / 1024 / 1024 100;感谢下载载精品4.1.2 Mysql 数据库运维主要检查项4.1.2.
19、1 检查数据库备份是否正常检查是否有备份机制,已有备份机制,且最后一个备份成功为正常 检查数据库后台日志,最近是否有 error 错误检查 data 目录下 host_name.err 近期是否有错误 检查 MySQL 数据库连接统计show status; 检查Aborted_clients 由于客户没有正确关闭连接已经死掉,已经放弃的连接数量。Aborted_connects 尝试已经失败的 MySQL 服务器的连接的次数。Threads_connected 当前打开的连接的数量。Max_used_connections 同时使用的连接的最大数目以 Max_us
20、ed_connections 远小于 f 中的最大连接数目则正常。如果接近则考虑 增大最大数目。 检查 MySQL 数据库表锁统计(包括立即锁及等待锁)show status like table%;如果 waited 的数值比较高,说明数据库锁争用比较严重 主库查看状态Show master statusShow slave status ,经常检查从服务器的复制状态,防止复制过程中出现故障从而导致 进程停止 查询从服务器状态感谢下载载精品 Mysql 连接数排查Show variables like %max_connect
21、ins% Show gloable status likemax_use_connections 当前数据库已经使用的最大连接数不能超过阀值 Mysql 文件打开数检查Show global status likeopen_files ;Show variables like open_files_limit 打开数量要小于 limit 值4.1.3 SqlServer 数据库运维主机检查项 检查数据库自动备份是否正常 检查是否有备份机制,以有备份机制,且最后一个备份成功为正常 验证备份集验证备份集 (RESTORE VERIFYONLY )4.1.3
22、.3 检查数据库集群是否能正常工作 检查磁盘空间是否足够检查数据文件所在的磁盘空间使用情况 检查日志文件所在的磁盘空间使用情况检查备份的磁盘空间使用情况使用 “事件查看器 ”,查看系统日志,关注错误信息排查错误。 重点关注与 SQLServer 相关的日志信息。及时备份与清理过期的日志信息。 检查系统日志感谢下载载精品4.2 数据库性能分析与优化调整根据用户需要进行数据库的性能分析, 针对发现的问题提出合理的解决方案 ;每月巡检中包含 对数据库运行性能的分析。主要包括:数据库性能的监控和调整、系统资源的监控及管理 。如:优化服务器配置根据现有硬件配置及用户访问量及服
23、务器性能指标,确定是否存在系统 (cpu, 内存 ,硬盘)瓶颈及数据库配置问题 ,提出解决瓶颈的方法及建议。优化应用程序根据应用程序配置 ,确定是否存在应用程序问题使系统运行缓慢,提出应用程序优化建议 (如 :负载均衡 )。数据库及应用程序整合分析数据库与应用布局是否合理 ,提出整合建议。数据库参数调整优化参数,使数据库在最优的环境下运行。数据库潜在重要问题数据库是否存在潜在问题,对数据库有什么重要的影响 , 或深圳广西质量技术监督局方面认 为紧急的。优化内存配置与系统后台进程优化物理文件的存放 ,对大型数据库考虑用磁盘阵列柜存放优化数据库逻辑结构 优化表空间、临时表空间、回滚段 优化数据库对
24、象优化表结构、建立分区表,优化索引结构、更新统计信息优化 SQL 语句查询运行慢的 SQL 语句,并给出优化建议 提供数据库优化方案及实施方案、报告等4.3 数据库备份以及恢复服务根据现场情况,制定合理的备份计划,定期备份各个数据库。具备条件的情况下,要定期对备 份集进行异机恢复,测试备份集是否可用。数据库发生重大故障时 (如磁盘阵列故障导致的数据库瘫痪) ,以最快的速度从备份系统中恢复 数据,并使系统能够在最短的时间内恢复正常运行。4.4 数据库补丁分析与安装根据用户需要提供相关系统软件升级服务;当数据库ORACLE 、MYSQL 、SQLSERVER 软件有最新更新升级时,维保方须及时通知
25、广西质量技术监督局,并根据广西质量技术监督局的要求和安 排到现场进行更新升级(每年一般不超过两次) 。4.5 7*24 小时数据库救援服务提供7 X24小时应急响应热线,由具有丰富工作经验的资深 OCP认证工程师在用户的Oracle 产品出现重大故障时提供现场紧急救援服务。重大故障包括:OS故障,导致Oracle不能正常启动或运行硬件故障(包括 CPU、硬盘等),导致数据库崩溃人为故障,包括维护人员不小心删除数据库文件,或人为将Table中的数据删除等等导致数据库不能正常运行的情况,如控制文件遭破坏,Redo Log文件遭破坏,数据文件遭破坏等等其他故障,包括影响数据库正常运行的各类紧急故障5
26、技术支持以及服务体系国外环厂左持5.1 故障处理要求25分钟内故障处理电话响应服务,故障服务的现场响应时间小于1小时,即1小时内有能够处理故障的技术人员到达现场,并立即投入对故障的处理,并能够在2个小时内恢复故障系统的正常运行。如果用户的问题不能通过电话解决,客户服务部会立刻派经验丰富的工程师到现场为用户解决 问题,客户服务人员对解决的过程进行记录,并向用户提供解决问题的报告包括问题原因、解决方法、解决问题的方式和进程,以及建议用户对系统进行正常使用的指导和培训问题解决后需要 用户进行确认。5.2 重大活动现场护航敏感时期、重大节假日、领导巡查,维护技术原因提前入场做详细巡检,并于活动时间段内
27、入 驻客户驻地,提供 5*8 小时的现场保障服务 。在国家节假日期间前一个星期, 提供节日值班表,包含: 当日负责人姓名及联系电话、反应时间、到现场时间、处理好时间 等内容。 以发电子邮件方式告知客户负责人。5.3 维护作业计划为保障数据库系统的长效运行。我们制定 日、周、月 的检查内容,通过 自动、远程、现场相 结合的方式,形成日常作业计划,对数据库运行情况检查,及早发现问题和处理问题。如:每日的 数据库表自动分析、每周的远程备份情况检查、每月的现场设备检查等 。5.4 信息安全保障系统的安全性是业务正常运行的保障,其重要性不言而喻。我公司会根据标准的安全规范和成 功经验,为用户的系统进行安
28、全性检查,包括文件权限的设置、用户访问的限制、增补软件的更新 等技术方面,同时对系统安全策略进行评估,将发现的问题隐患及改进建议以报告的形式提交给用 户。通过系统安全性检查,可以提高系统的安全级别,防止系统遭到恶性攻击口。5.5 第三方协助服务协助用户或第三方完成对系统设备、软件的维护、升级、扩容等技术支持工作,确保客户生产 系统的安全平稳运行。5.6 服务质量分析提供每月 1 次对 oracle 、sqlserver 、mysql 全面巡检服务, 对维保范围系统进行细致全面地监 视、检查、隐患排除等。并按照用户要求提供特殊时段保障要求的巡检。每月提交月度服务报告、 包括并不限于服务天数、 次数、 电话接通延迟时间、 报修故障及原因、 恢复措施报告等定量数据;根据用户需要召开服务质量分析例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年防治高血压知识讲座总结
- 建筑电工(建筑特殊工种)特种作业证考题及答案
- 设备维修与保养计划模板
- 遵守企业守秘协议承诺书6篇
- 桌上的绿植我与它的故事5篇
- 跨领域项目管理计划与执行指南
- 守秘数据安全承诺书(5篇)
- 2020-2021中考化学综合题专题复习【化学推断题】专题解析含详细答案
- 委托开发客户协议书
- 学校存在安全协议书
- 新型电力系统下的成本疏导与储能价格机制
- 公司网络安全培训
- 2025云南水润融媒体发展有限公司招聘工作人员1人笔试考试参考试题及答案解析
- 微信网络安全课件制作
- 2025年6月高级钳工题库含参考答案
- 2025年内蒙古机电职业技术学院单招职业技能考试题库含答案
- GB/T 14748-2025儿童呵护用品安全儿童推车
- 2025年商用净水器行业分析报告及未来发展趋势预测
- 高分子化学期末考试试卷及答案
- DB1509∕T 0004-2023 东佛里生羊饲养管理技术规程
- 室内精装修工程施工工艺标准
评论
0/150
提交评论