GBase 8A MPP Cluster 产品培训-日常维护.ppt_第1页
GBase 8A MPP Cluster 产品培训-日常维护.ppt_第2页
GBase 8A MPP Cluster 产品培训-日常维护.ppt_第3页
GBase 8A MPP Cluster 产品培训-日常维护.ppt_第4页
GBase 8A MPP Cluster 产品培训-日常维护.ppt_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

GBase8aMPPCluster日常维护 南大通用数据技术股份有限公司 维护管理规范介绍 目录 2 一 数据库日常维护 二 问题解答 三 维护管理规范介绍 目录 3 一 数据库日常维护 二 问题解答 三 检查集群状态查询磁盘空间监控内存使用情况帐号 权限管理系统日志查看 日常维护 4 集群状态 使用gcadmin命令查看正常的集群状态 命令行方式 上图为正常的集群状态和节点状态 当集群 节点某个状态不正常时 相应文字会闪烁 5 集群状态 集群的工作状态分为 ACTIVED状态 当前集群中Online的节点个数大于1 2时 集群总的状态为ACTIVED状态 LOCKED状态 当前集群中Online的节点个数小于等于1 2时 集群总的状态为LOCKED状态 集群不再执行SQL操作 集群的模式分为 normal 正常 能执行所有SQL操作readonly 只读 只能执行查询SQL 用于数据备份操作 recovery 恢复 不能进行任何SQL操作 用于数据恢复操作 6 节点状态 节点的工作状态分为 Online状态 节点为正常状态 Offline状态 则表示节点断线或者集群gcware服务未启动 各模组进程的工作状态分为 Open状态 该模组进程为正常状态 Close状态 则表示该模组进程启动失败或消失 datastate数据的一致性状态分为 0 该节点数据一致性正常 1 该节点数据一致性已不正常 nodestate节点的一致性状态分为 0 该节点正常 1 该节点不正常 长期故障 7 模组进程故障排除 节点的工作状态为Offline状态排查是否掉电 断网等硬件 网络问题 重新启动该节点的gcware服务 servicegcwarestart整体集群重启操作172 17 254 101节点root用户Cexecsservicegcwarerestart查看gcware日志分析原因 vi var log corosync log查找lost的记录 8 模组进程close状态故障排除 节点服务启动后 正常有以下模组进程启动 gcluster进程名 gclusterdgnode进程名 gbasedgcsync同步进程名 gc sync servergcware进程名 corosync监控工具 monit元数据恢复工具 gcmetarecover数据恢复工具 gcdatarecover检查进程是否正常命令ps ef grep进程名如果有进程不存在 需重新启动该节点gcware服务servicegcwarerestart servicegcwarerestart会启动所有模组进程 需使用root帐号启动服务 9 模组进程close状态故障排除 查看模组进程状态命令 service进程名status单独启动 停止各模组进程命令如下 需使用root帐号启动服务 gcluster进程启停命令 servicegclusterdstart stopgnode进程启停命令 servicegbasedstart stopgcsync同步进程启停命令 servicegcsyncstart stopgcware进程启停命令 servicecorosyncstart stopmonit监控工具启停命令 servicemonitstart stop元数据恢复工具启停命令 servicegcmetarecoverstart stop数据恢复工具启停命令 servicegcdatarecoverstart stop 10 数据恢复 datastate状态为1的故障排除 当某个节点执行命令失败后 数据恢复工具可监控到错误日志 然后调用同步工具 自动修复节点数据不一致的情况 确保各节点数据的一致性 数据恢复 datastate状态为1的故障排除 说明 同步工具是将safegroup组另一个好的节点上的数据拷贝到locked节点上 适用于节点出现offline状态 故障恢复后需数据恢复 执行加载 DDL DML语句导致数据状态不一致时 Lock节点发起自动恢复 集群支持自动恢复方式 恢复时先恢复ddl操作 然后恢复dml操作 DDL自动恢复 datastate状态为1的故障排除 DDL自动恢复实现过程 如果有节点执行DDL操作失败 gcware会把失败记录写入到ddlevent日志 Gcmetarecover恢复进程定时的从gcware检索ddlevent日志 发现有错误信息 则会将表上锁 重新执行DDL操作 执行成功后 清除错误日志记录 解除表锁 数据自动恢复 datastate状态为1的故障排除 数据自动恢复实现过程 如果有节点执行dml loader操作失败 gcware会把失败记录写入到dmlevent日志 Gcdatarecover恢复进程定时的从gcware检索dmlevent日志 发现有错误信息 则会将表上锁 进行数据恢复 自动调用同步工具 将同组中另一个好的节点上的表的副本分片数据 非整个表分片数据 拷贝过来 同步成功后 清除错误日志记录 解除表锁 节点故障排除 当某个节点出现故障时 短时间无法修复 需设置节点状态failuregcadminsetnodestatenodeip192 168 12 53failure当故障修复完毕 则将节点状态设置为normalgcadminsetnodestatenodeip192 168 12 53normal数据会自动恢复 15 15 集群命令行gcadmin管理工具 命令行工具gcadmin可以为管理员提供管理集群的操作 包括 添加SafeGroup 查看集群状态 切换集群状态 查询集群表锁等常用功能 主要功能 gcadmin help列出所有命令gcadminaddsg nodes names移除组 有数据时慎用 gcadmin showcluster 查看集群信息gcadminswitchmode normal readonly recovery 切换集群模式gcadminshowlock查看集群锁 表级 gcadminsetnodestate normal failure 节点出现故障时 设置节点状态为failure 修好以后 设置节点状态为normal 16 gcadmin切换集群模式 集群模式集群模式分为 normal 正常 能执行所有SQL操作readonly 只读 只能执行查询SQL 用于数据备份操作 recovery 恢复 不能进行任何SQL操作 用于数据恢复操作 举例 备份之前设置集群模式为readonly gcadminswitchmodereadonly备份结束之后 将集群模式设置为normalgcadminswitchmodenormal 17 17 gcadmin查看集群锁 查看集群锁命令 gcadminshowlock功能 查看目前集群中的表级锁 示例 Tablename 锁加在哪个表上Owner 哪个节点加的这把锁Content 锁的备注Createtime 锁的创建时间 以加锁的节点的时间为准 Orphan 是否是孤儿锁 Type 锁的类型 S 共享锁E 独占锁 18 gcadmin查看集群锁 查看集群锁gcadminshowlock 19 检查内存使用率 使用top LINUX nmon opt gnode server bin 目录下 等工具进行监控 opt gnode server bin nmon 20 检查磁盘空间使用情况 使用df h命令查看磁盘的使用率和剩余空间如果空间快满 需考虑是否增加磁盘或者集群扩容 21 连接集群数据库几种方法 通过GBaseShell方式连接集群 命令行方式 gccli ugbase pgbase20110531 h172 17 254 106 101 108 111 118 P5258 opt gcluster server bin gbase ugbase pgbase20110531 P5258批处理SQL文件 gccli ugbase pgbase20110531 Dtest vvv f sql result txt2 sql result err企业管理器可连接 windows下的图形化客户端 应用程序访问 22 实用SQL语句 帐号管理 创建用户 CREATEUSERadminIDENTIFIEDBY 123456 admin是新用户名 123456是密码删除用户DROPUSERadmin 修改用户名RENAMEUSERold userTOnew user设置 修改密码SETPASSWORD PASSWORD adminnew SETPASSWORDFOR admin1 PASSWORD admin 查询用户 SELECTTRIM host host TRIM user user passwordFROMgbase user 用户管理 23 实用SQL语句 帐号管理 GRANT和REVOKE语句允许系统管理员创建8a集群用户帐号 并处理用户权限的赋予与收回 授权语法 GRANTALLONTEST TO admin WITHMAX QUERIES PER HOUR20MAX UPDATES PER HOUR10MAX CONNECTIONS PER HOUR5MAX USER CONNECTIONS2 MAX QUERIES PER HOUR 每节点上限制每用户每小时发出的查询数MAX UPDATES PER HOUR 每节点上限制每用户每小时发出的更新数MAX CONNECTIONS PER HOUR 每节点上限制每用户每小时可连接服务器的次数MAX USER CONNECTIONS 每节点上限制每用户可同时连接的最大连接数 24 实用SQL语句 帐号管理 权限列表 25 实用SQL语句 帐号管理 查看用户授权的语句SHOWGRANTSFORuser 收回语法 REVOKEALLPRIVILEGES GRANTOPTIONFROMuser 收回权限管理 26 查看服务器运行语句 查看本节点正在运行的线程 SQL语句 SHOW FULL PROCESSLIST 如果有SUPER权限 可以看到所有线程 显示8a集群的系统变量的值 SHOW GLOBAL SESSION VARIABLES LIKE pattern 举例 显示集群压缩相关的系统变量的值SHOWVARIABLESLIKE compress 27 查看服务器运行语句 显示警告或错误信息 SHOWWARNINGS 显示由最后一个语句产生的错误 警告和注意信息 SHOWERRORS 显示由最后一个语句产生的错误信息 显示集群中节点信息 SHOWNODES 如果有SUPER权限 可以看到所有节点信息 SHOWLOCALNODE 显示集群中客户端正在访问节点的信息 28 查询数据库信息 showdatabases 查看系统中数据库名的语句 根据权限显示 usedb name 数据库作为以后查询的缺省数据库 showtables 列出给定数据库的所有非临时表desctest t 查看test库t表的列信息showindexfromtest t 查看test库t表的索引信息 29 查询创建数据的信息 SHO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论