【私有云的监控系统和关键技术概述4000字】_第1页
【私有云的监控系统和关键技术概述4000字】_第2页
【私有云的监控系统和关键技术概述4000字】_第3页
【私有云的监控系统和关键技术概述4000字】_第4页
【私有云的监控系统和关键技术概述4000字】_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

私有云的监控系统和关键技术概述1.1ganglia监控系统Ganglia监控平台由伯克利大学成功设计,其目标是针对服务器集群,设计目标是假如在集群上具备成千上万节点的时候,可以给这些集群装置实施高效监控任务[5]。该平台核心作用为检测需要监控设备的各种数据和资源,监测的这些信息包括设备控制器及稳定,磁盘存取状态,网络设备,线路状态等。然后针对这些收集得到的信息实施整定处理,再采取Gang.web上面的系统页面查阅各个集群的全部信息及资料,还能够选中该群中里面的各个节点及设备,查阅集群上面的指定节点及其信息数据,这样获取局部数据。采取这种集群采集信息模式,再实施各节点信息研究,再就是能够对该集群信息实施调整处理提升使用效率,增加集群整体性能。全球越来越多公司在大集群项目中选中它实施集群监控,实现系统安全。该监控集群具备有Gmetad(GangliaMetaDaemon)、Gang.web和Gmond(GangliaMonitoringDaemon)。Gmond是配置于集群上要采集信息的主机设备里面,针对节点设备实施采集信息操作的普通多线程代码。该模块核心是采集信息,控制器使用率、控制器加载、内存应用状态和磁盘应用,磁盘与网络接口等内容。监控节点设备能够采取Gmond实施交互处理,这样得到该指标的信息。而且还在默认设置里面,相同集群里面全部主机采取组播模式实施共享信息,由此集群里面各个Gmond终端能够得到相同集群里面的各个主机采集的信息。Gmond具备优异的扩充性,采集信息的软件采取插件方式载入Gmond,同时耗费资源较少,能够采取C++和Python等实现设计,设计自定义的各种插件模块,这样完成各种有用的信息采集。在通常情况下各个Gmond都将对另外的节点发组播来采集信息,各个节点还接受以及保存另外节点送来的信息,这样集群上各节点都可以知道集群里面所有最近的信息,还能够使用共享数据迅速找到发集群里面失效的终端设备。Gmetad采集集群终端里面的所有信息,并集中起来,同时采取RRD文档实施保存和聚合功能。其核心是采集其所有信息数据形成树状扩充结构。Gmetad采取RRD实施信息保存以及聚合信息,它应用RRD工具把得到的信息保存进RRD文档,随后Gweb再采取RRD创建节点及其图片放到Web前端显示给客户。其采取RRD工具把采集的信息保存到RRD文档。RRD作为环形结构的数据库,其采取固定空间来保存信息。Gmetad采取监听方式实现和远端的Gmetad创建连接,这里采取主机授权模式给远端给出目前集群的XML文档。还能够采取连接Gmetad来实现监听目的,实施交互模式申请和应答操作。采取该交互模式能够查阅集群网格的情况,以及XML树整体架构,其还可查阅到集群数据及其简单的信息。Gmetad不但能够在Gmond里面得到的信息,其还能够在Gmetad里面取得信息,同时这个功能是具备分级授权模式的操作,能够创立共同的监测域来实施。Gangl-Web采取Web呈现Gmetad保存的集群信息,在该节点前端界面上显示信息。这里Gweb采取简单UI把全部信息中的数据汇集呈现到几个图表里面,而且还给出快速简单的查找方式,这样查阅特殊终端的特有信息数据。Ganglia扩充能力很强大,其在Gmond上能够采取三种模式扩充信息[12];能够在管理系统里面采取简单调整Gmet设置数据实现树状扩充,其具备很高的灵活性,这样集群节点上面能够采取组播办法采集共享数据,其适合在小规模集群上,还能够单播模式进行,而采集度量数据适合集群较大的情况下应用。其自身尤其适合高性能的监测采集系统,其和Zabbix和Nagios的最大差异就是不具备故障报警的性能。1.2Nagios监控系统Nagios作为一种开源的网络监控平台,具备很多实用功能。其能够监测各个节点的设备的信息,而且,还能够按照预设阙值发出告警控制信息[4]。其最大的好处是给出故障的警示通知,这样该平台会快速告诉云平台的工作职工,让管理者及时定位故障再处理故障。其更多是采取Linux做基础,它具备Web前台实施操作,极大的便于维护人员监测系统,然后在这里规定报警触发条件和事件。Nagios核心操作是采取轮询模式取得数据,同时实施监控(有ICMP和WEB以及邮件等);这个监控平台核心功能是:实施监测网络,同时监测集群里面的分布式设备和资源(例如设备控制器及稳定,磁盘存取状态,网络设备,线路状态等),其还具备自己编写插件扩充和完善该监控系统性能,而且具备非常高的并行检测和工作能力。另外Nagios具备的异常操作特性,能够将各个分布装置的异常信息发警报,通过短信、电子邮件通知运维人员。在Nagios的Web页面能够查阅在线集群主设备的数据及资源等,其包括在线数据,日志文档和故障报警信息等内容。其发出状态信息给故障点终端同时发出警告,其得到全部历史信息都可以在web里面实施,同时实施简单设置操作。Nagios实施监控具备有3种方式:(1)直接监控方式其核心引擎采取本地化的插件来实施,针对需要监控的终端实施直接获取信息。它是最简单监控模式,具备下述特性:1)监控主机里面实施设置操作就能启动监控运转。2)针对该被监控终端装置运转状态,没有监控功能。3)监测双方设备都必须具备直达的IP层。4)运转监控操作以及信息处理都必须采取Nagios平台,而被监控设备端不主动介入该操作,只依据常规逻辑来应对检测行为。(2)针对Windows的监控在Window中,采取在监控主机上实施check-nt完成工作。在该主机终端上要具备NSClient,采取这个插件采集该系统中的数据,还有控制器的使用率等,磁盘空间使用情况,还有进程运转等操作。(3)监控远端Linux主机插件由于本地信息只是具备读程序和数据的权限,这样Nagios平台只可以检测其主机的当地数据,不能够得到被监控主机数据,所以采取NRPE来实施远端Linux主机监测。其详细的监控过程是:Nagios上的主机要完成监控某个待监控节点的时候,采取用本地check-nrpe对待监控节点发出监测命令。而待监控节点上NRPE运行时接到监控机发来命令,就采取本地来运转该插件,这样得到待监控节点的数据。这样实现其数据采集,待监控节点会采取和监控节点间创建的通讯链送回其状态数据。同时监控节点运行check-nrpe把采集结果信息返到Nagios实施。而NRPE自己并不会发出监控操作,其全部的有关操作都是统一采取被监控节点本地插件实现,它仅仅是调用插件,然后返回信息数据结果。在采取check-nrpe时候,监控双方系统不用开放各种类型的端口,仅仅采取固定端实施网络信息就可。在固定端口时候,隔离后面的网络端口以及漏洞等都可以很好的处理。就算被监控节点发生一些调整,仅仅在被监控端对应修改就可以正常进行监控任务[12]。1.3监控系统需求分析采取云计算可以给海量客户给予高效安全的共享信息,最重要的就是其健壮性特性。其可以给出千万个虚拟节点及设备为客户应用。这样巨大虚拟机设备,假如不采取有效监控措施,就很难清楚虚拟机会不会一直在正常工作,而且不清楚全部系统资源和设备的使用和空闲状态,所以在此必须监测虚拟机使用状态,内存状态,网络通行量,设备磁盘状态等信息。其次需要告警系统。Ganglia优点就是实时的监控集群里面设备的所有参数,例如控制器,内存系统及其温度状态等信息,这些汇集成各个界面,同时给予端口供信息访问。假如发生问题,就会报警警示。而Nagio优点就是发生故障时能够给予很强的报警警示操作,可是实时监控当中,这个效果很弱,就算是采取NRPE还是不可以得到强大的设备监控目的。针对集群实施上,采取两个模式,第一是假如发生故障时,就会有警示发出,这样管理者可以快速出击处理故障,把损失降低到最小。第二是发生故障前,寻找将会发生的故障,来处理问题规避事故发生。所以Nagios适宜在第一的情况下实施,而Gangli适宜在第二的情况下实施,二者融合就可高效处理各个场景下的问题。采取Nagios应用Ganglia端口,来得到全部集群系统的监控信息,假如大于设置的报警数值,就能够实现报警信息。1.4基本监控架构1.4.1集中式监控结构采取集中监控方式重点是应用服务器完成对待监控节点实施监控。尤其是实现单台监控设备完成更多待监控节点以及虚拟设备的监测。而服务器就是实施采集信息达到汇集与处理的效果,其结构见图3-1所示。图3-1:集中式监控架构这个集中方式监控架构上,服务器是实施在待监控设备上得到监控数据。待监控设备就必须具备监控代理,这样实现与服务器实施信息通信。服务器通常是布设在某台微机里面,来采集所有监控代理产生的信息,再处理这些监控信息,把信息呈现在该监控端显示,还可以是先保存数据库里面,再在数据库当中查找和展现。该服务器能够对被控设备给出指令操作,这样实现动态配置,同时迅速的得到监控数据。该监控架构缺陷:假如待监控设备很多的情况下,服务器性能就大量耗费。因为一方面要在待监控设备得到信息,另一方面还要操作各种信息,如此就会带来服务器性能的瓶颈问题,这样会削弱设备可维护的特性[13]。1.4.2分布式监控结构分布式的监控系统里面,全部系统中具备屮心服务器,还要一些子监控服务器,以及待监控的设备来构成。其各个子服务器就承担实现其子网络的监控目的,各种子系统间并不是独立的,其能够传递数据。而且所有子系统的规模较小,发生的信息量也较小,如此就能够极大的降低中心服务器信息压力,实现整个监控网络。图3-4:分布式监控架构在分布式监控的上述架构上,具备三个层次,见图所示。在最底层放置待监控的设备,其采取执行监控代理软件的模式实施,采集各个终端状态数据,然后对子服务器传递其采集的数据。该中间层用来监控子服务层设备,其承担采集所有终端传递来的监控数据,在对屮心服务器传递采集得到的监控数据。而最上端层作为中心服务器端,其核心任务是采集各个子监控服务器信息,随后保存到数据库里面,还有直接采取服务器传递来实现查找功能。分布式监控架构把海量信息收集操作分散给各个子系统上,这样最大化降低中心服务器工作量,还减少网络负载量,可是这种方式会产生一些延迟时间[13]。1.5RDDTooLRRDTool(Round-Robin-Database-tool)其中的Round-Robin就是信息储存模式,这里各个信息对应某个时间槽,同时该指针会指到新的储存该信息的槽位上[14]。和别的数据库差异就是它采取固定大小的RRD文档存储以及聚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论