信创服务器、中间件、数据库监控方案设计与实现_第1页
信创服务器、中间件、数据库监控方案设计与实现_第2页
信创服务器、中间件、数据库监控方案设计与实现_第3页
信创服务器、中间件、数据库监控方案设计与实现_第4页
信创服务器、中间件、数据库监控方案设计与实现_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信创服务器、中间件、数据库监控方案设计与实现

【摘要】国家战略、大势所趋,信创设备、软件将越来越多,其监控是全新课题,本文探讨、分享了相关方案设计及经验,供大家参考。1、背景当前趋势下,商业银行将逐步替代国外设备,采用信创服务器、信创操作系统、信创中间件、信创数据库进行替代,而信创服务器、信创操作系统、信创中间件、信创数据库的监控又是全新课题,本文将讨论如何将这些操作系统、数据库、中间件纳入监控。2、需求分析2021年10月20日,人民银行办公厅、中央网信办秘书局、工业和信息化部办公厅、银保监会办公厅、证监会办公厅联合发布《关于规范金融业开源技术应用与发展的意见》。《意见》指出:“探索自主开源生态,重点在操作系统、数据库、中间件等基础软件领域和云计算、大数据、人工智能、区块链等新兴技术领域加快生态建设,利用开源模式加速推动信息技术创新发展。本次建设的服务器有海光、鲲鹏两种类型,海光使用的芯片架构为X86架构,鲲鹏使用的架构为ARM架构,操作系统均为银河麒麟V10,数据库使用了达梦数据库,Web中间件使用的是TongWeb,满足监管要求和保障系统安全稳定运行。3、解决方案3.1总体思路及架构设计1、目前我行大部分设备、软件、数据库均采用IBMTivoli进行监控,但是信创设备、数据库IBMTivoli不支持,我们将采用Prometheus作为信创设备监控系统,通过AlertManager、SNMP_notifier通过SNMPTrap协议跟集中监控平台实现告警集成。2、操作系统采用OSexporter进行数据采集。3、TongWeb采用MIDexporter进行数据采集。4、达梦数据库采用DBexporter进行数据采集。3.2操作系统监控设计与实现1、监控指标CPU、内存、磁盘使用率、分区使用率、系统平均负载、网络流量、磁盘读写速率、温度2、方案1)采用Prometheusexpoter作为采集代理AMD架构使用的采集代理为node_exporter-1.3.1.linux-amd64ARM架构使用的采集代理为node_exporter-1.3.1.linux-arm642)操作系统监控数据展现如下:3)告警rules4)跟集中监控平台集成通过alertmanager与集中监控平台集成,alertmanager.yml需要修改以下配置alertmanager.ymlreceivers:-name:'snmp_notifier'

webhook_configs:

-

url:'http://x.x.x.x:9464/alerts'

send_resolved:

true同时运行snmp_notifier,运行参数如下./snmp_notifier--web.listen-address=:9464--alert.severity-label=severity--alert.severities=5,4,3,2,1--alert.default-severity=5--snmp.destination=X.X.X.:162--snmp.retries=3--snmp.trap-oid-label=oid--snmp.trap-default-oid=.4.1.1664.2--snmp.trap-description-template=description-template.tpl--log.level=info--log.format=logger:stderr3.3数据库监控设计与实现1、达梦数据库监控指标包括状态、内存使用情况、表空间、TPS、会话信息、DML信息等A、数据库状态select*fromv$dsc_ep_info;B、数据库内存使用情况(selectsum(n_pages*(page_size/1024))/1024fromv$bufferpool)+(selectsum(total_size)/1024/1024fromv$mem_pool)||'MB'asTOTAL_SIZE,((selectsum(n_pages*(page_size/1024))/1024fromv$bufferpool)+(selectsum(total_size)/1024/1024fromv$mem_pool))/512000*100||'%'asUSED_SIZE

fromdual;C、表空间D、TPS

(每秒事务数)E、会话信息(active,inactive,maxsession,idle

session)F、DML

信息(select,insert,update,delete)G、DB

load信息(dbtimecputime,io响应时间)2、通过定制开发达梦数据库的exporter进行监控1)定制开发达梦的exporter2)达梦数据库监控数据展现如下:3)告警rule3、跟现有的集中监控平台集成3.4中间件监控设计与实现1、监控指标jvm_memory_pool_bytes_max{pool="CodeCache"}、jvm_memory_pool_bytes_max{pool="CompressedClassSpace"}、jvm_memory_pool_bytes_max{pool="Metaspace"}、jvm_memory_pool_bytes_max{pool="PSEdenSpace"}、jvm_memory_pool_bytes_max{pool="PSOldGen"}、jvm_memory_pool_bytes_max{pool="PSSurvivorSpace"}、jvm_buffer_pool_used_bytes{pool="direct"}

、jvm_buffer_pool_used_bytes{pool="mapped"}、jvm_gc_collection_seconds_count{gc="PSMarkSweep"}、jvm_gc_collection_seconds_count{gc="PSScavenge"}、jvm_gc_collection_seconds_sum{gc="PSMarkSweep"}

、jvm_gc_collection_seconds_sum{gc="PSScavenge"}、进程、端口、日志、URL监控2、方案1)采集JVM监控采用JVM的exporter,进程、端口、日志、URL监控可以通过Python定制开发实现。2)展示3)告警rules编写4)跟现有的集中监控平台集成,修改alertmanager配置如下4、总结及展望信创的操作系统和中间件可以使用社区开源的exporter采集数据,在实施过程中比较顺利,但是达梦数据库的exporter需要自主研发,经过与我们的DBA以及厂商专家沟通,最后确定指标对应的SQL,起初因某些原因参数或者公式不正确,数据也不准确,经过多次沟通、测试、完善后最终展示了准确的数据。另外,达梦数据库V8不是很成熟,RAC模式下某个指标的两个实例采集的数据不一样,经过我们DBA和厂商的优化,终于采集到准确的数据,目前运行正常。此外监控告警如何与现有的集中监控平台集成也是一个棘手问题,经过研究、分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论