Ganglia实验指导书_第1页
Ganglia实验指导书_第2页
Ganglia实验指导书_第3页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Ganglia实验指导书1. Ganglia实验简介Ganglia监控软件主要是用来监控系统性能的软件,如 cpu、内存、硬盘利用率,I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分 配系统资源,提高系统整体性能起到重要作用。Ganglia由加州大学伯克利分校开发,是一个为诸如大规模集群和分 布式网格等高性能计算系统开发的一个可扩展的监控系 统,Ganglia 有两个 Daemon,分别是:客户端 GangliaMonitoring Daemon (gmond)和服务端 Ganglia Meta Daemon (gmetad),还有 Ganglia PHP We

2、b Frontend (基于 web 的动态 访问方式)组成,是一个 Linux下图形化监控系统运行性能 的软件,但不能监控节点硬件技术指标。Ganglia系统是建立在分级、联邦的基础之上,其结构为 树状结构,这使得它有很好的可扩展性,可以容易地适应不 同规模的集群。基于 XML技术的数据传递将系统的状态数 据跨越不同的系统平台进行交互。用简洁紧凑的XDR作为集群内部各节点发布数据的方式和设置阈值,使得Ganglia具有很低的额外开销。但由于每个节点要保存所有节点的状 态信息,所以单节点的资源使用情况会随着节点的增多而增大。同时监控数据采用多播的数据发布方式,当性能数据量 增大或性能数据变化较

3、快时,会对网络性能有一定的影响。2. Ganglia的安装RRDTool安装完成后,可以开始 GANGLIA的安装,先下 载GANGLIA的安装包到/tmp/,安装命令如下cd /tmp/tar zxvf Ganglia*gz./configure -with-gmetadmakemake install3. Ganglia的配置对每台需要监视的客户端即监视节点都只需要安装Ganglia-gmond。安装后启动服务:#service gmond start#chkconfig gmond on然后修改计算节点的配置文件:修改 /etc/gmond.conf:cluster name = &qu

4、ot;manager"(本网段的名字或集群的名,在 Ganglia网页中显示的是每个集群的名称)owner = "HPCUSER"(所有者)latlong = "unspecified"(经纬度)url = "unspecified"找到tcp_accept_channel在里面加入服务器的 ip地址 tcp_accept_channel port = 8649acl default = "deny"access mask = 32action = "allow"Ganglia的配置就

5、完成了,图-1是Ganglia检测到的整个集群的资源负载百分比信息,从这个图像可以看出哪些资 源比较空闲,哪些资源比较紧张。4. Ganglia资源监控Ganglia最主要的功能是监控集群中各个节点的CPU、内存、网络吞吐量的情况,如图-1饼状图表示的是集群在某个时间段内的资源总体消耗情况,红色表示集群资源占用非 常高,橙色次之,灰白色表示集群资源空闲。Cluster Load Percentages 100+ C20.002) 75100 (60.00Z) 50-75 <13.33X>口 0-25 C6.672)图5-1集群资源负载百分比图5-2是集群在某一个小时内的资源使用情况

6、,分别对 应集群的进程数、集群 CPU占用百分比、集群内存占用总 数、集群网络流量。hpc_in_!box Cluster Load last hour站 MCIir:MJ?: 20hpc_m_bax. Cluster CPU last hour17 WIT ao User CPU Nice CPU Ssten CPU WAIT CPU Idle CPU1曲EICDDhpe_in_&i3x Clutter Hemofif last hour3C 4Q17: DO HeHorjf Used Heiigry tiarctf Menorjr Buffered Tat al In-Care M

7、eiiary17: 2aB Henor Cached Memory Swappedhp-e in box Clust&r N&tw&rk last hour n k t "IQ hB k kJ ko-In Out17-ae 1 - win Load Modes : IP KJ s Running PmceKse-s图5-2集群资源使用总统概况图-3表示集群中节点数和 CPU核心数,绿色的直线表示集群中有15个节点(1个管理节点和14个计算节点),红色的直线表示整个集群一共有64个CPU核心。图5-3上一个小时集群活动进程数图-4表示用户占用 CPU时间,以百分

8、比表示,蓝色填充图部分表示这段时间 CPU的占用率约为3%左右,表示集群资源当前比较空闲。图图-4上一个小时集群处理器资源占用情况图-5表示集群的内存和交换内存(swap)使用情况, 红色的直线表示集群一共有64GB内存,紫色的直线表示集群一共有16GB交换内存,青色表示内存 Bufer,深青色表 示在buffer中已命中的情况,蓝色表示用户进程占用内存情 况。图图-5上一个小时集群内存资源占用情况图-6表示集群网络资源占用情况,绿色的曲线表示数据流向集群,蓝色曲线表示从集群流出的数据。n Ia16: 55nr一hpc_ in_baxtc-r Nc twark I a a t hi 口ur*图

9、图-6上一个小时集群内存资源占用情况图-7表示集群中每个节点 (包括管理节点)资源占用情 况,白色表示集群空闲,绿色表示集群节点正在被使用, 橙色和红色表示集群的资源负载比较大。管理员可以根据 这个监控图查看集群中哪些节点空闲哪些节点负载较高, 以方便将空闲的资源提供给用户和减轻高负载节点的负 荷。beln?bcln6bclnlT+*1. nj n1.0 jlfi +Q 17:00 1T:ZO1& 40 IT:0017:2l&:4017:00 IT ZO1 lDa?d dih last liaur lezHi Give last luur loard one t«i

10、t hmu(HOM D.flS)CROW Q,iflQ>(n«r O.6| gaKfiw 1»51 hour (门叶Cl帕|>managebclnlQ1SE1 hour£noubdnll0. D1& 4017:00last Hour(门叶Cl O即be mi 4hcinubclnfl 2 祠1K1 hgur(now 0.60ibclnS loadoiH Eat! hour iftw B.0d)10 4D 17:W IT 20 也祠丿冋hourntw 1 $in:4 ©叶 Ci: t hgu r (now 0用0|bclnJbcln4a D i1K4Q 17:W iciird1 WEt hour(now OiOO)bcln Isa-dDn- EeI hour (HMr B.M)c o 1D> 4017:00?:2CI iQaJdiw Hatt hour (rm Q. BO|i图图-7集群计算节点资源使用情况图-8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论