




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
前言 1. Nagios简介 2. 相关环境 3. 部署规划 4. 代码获取 5. 前提依赖 5.1 主机环境检查(全部节点) 6. 编译安装 6.1 创建用户nagios(全部节点) 6.2 安装nagios主程序(主节点安装) 6.3 安装nagios插件(全部节点安装) 6.4 安装NRPE(全部节点安装) 6.4.1 被监控节点配置 6.4.2 主节点配置 6.5 安装Apache(主节点安装) 6.6 安装PHP(主节点安装) 6.7 使用apache 发布PHP的WEB 7. 配置Nagios 7.1 配置远程被监控节点 7.1.1 修改配置文件 7.1.2 重启xinetd服务 7.1.3 校验配置 7.2 配置监控服务主节点 7.2.1 cgi.cfg(控制CGI访问的配置文件) 7.2.2 nagios.cfg(nagios主配置文件) 7.2.3 定义监控的主机组 7.2.4 定义监控的主机 本地主机监控配置 远程主机监控配置 邮件监控 校验配置 启动 8. 监控页面 9. 相关链接前言最近在研究云监控的相关工具,之前写过Ganglia的安装步骤,这回来记录下Nagios的安装步骤。本文不讲解相关原理,若想了解请参考其他资料.本文目的: 即使之前未触过nagios,也能按照文中步骤搭建自己的nagios监控集群.Author duangr Website /duangr/blog/1831601. Nagios简介Nagios是一个可运行在Linux/Unix平台之上的开源监视系统,可以用来监视系统运行状态和网络信息。Nagios可以监视所指定的本地或远程主机以及服务,同时提供异常通知功能。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。2. 相关环境Host NameIPOSArchduangr-10CentOS 6.4x86_64duangr-21CentOS 6.4x86_64duangr-32CentOS 6.4x86_643. 部署规划项值监控服务主节点(Master)duangr-1被监控从节点(Slave)duangr-2, duangr-3Nagios主节点需要安装:nagiosnagios-pluginnrpephpapacheNagios从节点需要安装:nagios-pluginnrpe安装路径规划项值nagios安装路径/usr/local/nagiosphp安装路径/usr/local/phpapache安装路径/usr/local/apache24. 代码获取nagios-4.0.2.tar.gznagios-plugins-1.5.tar.gznrpe-2.15.tar.gzhttpd-2.2.23.tar.gzphp-5.4.10.tar.gz5. 前提依赖5.1 主机环境检查(全部节点)1# rpm -q gcc glibc glibc-common gd gd-devel xinetd openssl-devel2gcc-4.4.7-3.el6.x86_643glibc-2.14.1-6.x86_644glibc-common-2.14.1-6.x86_645gd-2.0.35-11.el6.x86_646package gd-devel is not installed7package xinetd is not installed8openssl-devel-1.0.0-27.el6.x86_64若有缺失,请先安装. 可通过如下几个镜像网站下载相关安装包://centos/6.4/os/x86_64/Packages//centos/6.4/os/x86_64/Packages/安装后再次检查如下:1# rpm -q gcc glibc glibc-common gd gd-devel xinetd openssl-devel2gcc-4.4.7-3.el6.x86_643glibc-2.14.1-6.x86_644glibc-common-2.14.1-6.x86_645gd-2.0.35-11.el6.x86_646gd-devel-2.0.35-11.el6.x86_647xinetd-2.3.14-38.el6.x86_648openssl-devel-1.0.0-27.el6.x86_646. 编译安装6.1 创建用户nagios(全部节点)1useradd nagios -d /usr/local/nagios2passwd nagios (密码自定义)6.2 安装nagios主程序(主节点安装)1tar -zxf nagios-4.0.2.tar.gz2cd nagios-4.0.23./configure -prefix=/usr/local/nagios 4make all5make install & make install-init & make install-commandmode & make install-config将nagios添加为服务1chkconfig -add nagios 2chkconfig nagios off3chkconfig -level 35 nagios on4chkconfig -list nagios 5nagios 0:关闭 1:关闭 2:关闭 3:启用 4:关闭 5:启用 6:关闭6.3 安装nagios插件(全部节点安装)1tar -zxf nagios-plugins-1.5.tar.gz2cd nagios-plugins-1.53./configure -prefix=/usr/local/nagios -with-nagios-user=nagios -with-nagios-group=nagios 4make & make install如果出现mysql相关的编译错误,是mysql的默认安装路径被修改导致的,调整with-mysql后重新make1./configure -prefix=/usr/local/nagios -with-mysql=/usr/local/mysql2make & make install6.4 安装NRPE(全部节点安装)1tar -zxf nrpe-2.15.tar.gz2cd nrpe-2.153./configure -enable-command-args4make all5make install-plugin下面步骤只需要在被监控节点执行1make install-daemon & make install-daemon-config & make install-xinetd6.4.1 被监控节点配置如果是被监控节点,需要配置NRPE已守护进程运行(通过xinetd来运行)1、更改/etc/xinetd.d/nrpe文件,设置允许nagios主节点服务器连接1vi /etc/xinetd.d/nrpe2only_from = 02、在/etc/services结尾增加:1nrpe 5666/tcp # NRPE3、增加对参数的支持1vi /usr/local/nagios/etc/nrpe.cfg2dont_blame_nrpe=14、启动xinetd1service xinetd restart5、验证nrpe是否监听1netstat -at | grep nrpe6、测试nrpe是否正常运行1/usr/local/nagios/libexec/check_nrpe -H localhost2NRPE v 主节点配置如果是监控服务主节点,在全部被监控节点NRPE配置完成后,可以依次做下检测1/usr/local/nagios/libexec/check_nrpe -H 12NRPE v2.153/usr/local/nagios/libexec/check_nrpe -H 24NRPE v2.156.5 安装Apache(主节点安装)1tar -zxf httpd-2.2.23.tar.gz2cd httpd-2.2.233./configure -prefix=/usr/local/apache24make & make install6.6 安装PHP(主节点安装)1cd /export/home/tools/soft/php2tar -zxf php-5.4.10.tar.gz3cd /php-5.4.104./configure -prefix=/usr/local/php -with-apxs2=/usr/local/apache2/bin/apxs5make & make install6.7 使用apache 发布PHP的WEBvi /usr/local/apache2/conf/httpd.conf01.02Listen 8003.0405 DirectoryIndex index.html index.php06 AddType application/x-httpd-php .php0708.09#setting for nagios10ScriptAlias /nagios/cgi-bin /usr/local/nagios/sbin1112 AuthType Basic13 Options ExecCGI14 AllowOverride None15 Order allow,deny16 Allow from all17 AuthName Nagios Access18 AuthUserFile /usr/local/nagios/etc/htpasswd19 Require valid-user2021Alias /nagios /usr/local/nagios/share2223 AuthType Basic24 Options None25 AllowOverride None26 Order allow,deny27 Allow from all28 AuthName nagios Access29 AuthUserFile /usr/local/nagios/etc/htpasswd30 Require valid-user31为web访问时添加用户名和密码(此处用户名为admin,可自定义)1/usr/local/apache2/bin/htpasswd -c /usr/local/nagios/etc/htpasswd admin启动apache1/usr/local/apache2/bin/apachectl start访问页面: 0/nagios/7. 配置Nagios7.1 配置远程被监控节点7.1.1 修改配置文件1# su - nagios2$ vi /usr/local/nagios/etc/nrpe.cfg修改为如下配置内容:1commandcheck_users=/usr/local/nagios/libexec/check_users -w $ARG1$ -c $ARG2$2commandcheck_load=/usr/local/nagios/libexec/check_load -w $ARG1$ -c $ARG2$3commandcheck_disk=/usr/local/nagios/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$4commandcheck_procs=/usr/local/nagios/libexec/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$5commandcheck_procs_args=/usr/local/nagios/libexec/check_procs $ARG1$6commandcheck_swap=/usr/local/nagios/libexec/check_swap -w $ARG1$ -c $ARG2$以上监控命令功能:check_users 监控登陆用户数check_load 监控CPU负载check_disk 监控磁盘的使用check_procs 监控进程数量,状态包括 RSZDTcheck_swap 监控SWAP分区使用7.1.2 重启xinetd服务配置完上述命令后,重启 xinetd服务1service xinetd restart7.1.3 校验配置检查监控命令配置是否ok1/usr/local/nagios/libexec/check_nrpe -H localhost -c check_users -a 5 102/usr/local/nagios/libexec/check_nrpe -H localhost -c check_load -a 15,10,5 30,25,203/usr/local/nagios/libexec/check_nrpe -H localhost -c check_disk -a 20% 10% /4/usr/local/nagios/libexec/check_nrpe -H localhost -c check_procs -a 200 400 RSZDT5/usr/local/nagios/libexec/check_nrpe -H localhost -c check_swap -a 20% 10%7.2 配置监控服务主节点7.2.1 cgi.cfg(控制CGI访问的配置文件)(使用 nagios 用户)vi /usr/local/nagios/etc/cgi.cfg修改如下内容,为admin用户增加权限:1default_user_name=admin2authorized_for_system_information=nagiosadmin,admin3authorized_for_configuration_information=nagiosadmin,admin4authorized_for_system_commands=nagiosadmin,admin5authorized_for_all_services=nagiosadmin,admin6authorized_for_all_hosts=nagiosadmin,admin7authorized_for_all_service_commands=nagiosadmin,admin8authorized_for_all_host_commands=nagiosadmin,admin7.2.2 nagios.cfg(nagios主配置文件)(使用 nagios 用户)vi /usr/local/nagios/etc/nagios.cfg1#cfg_file=/export/home/nagios/etc/objects/localhost.cfg (注释掉)2cfg_dir=/export/home/nagios/etc/servers主配置文件声明了监控脚本的存储路径为 ./servers, 默认没有此目录,需要手工创建nagios 会读取 servers 目录下面后缀为.cfg的全部文件作为配置文件1cd /usr/local/nagios/etc2mkdir servers3cd servers7.2.3 定义监控的主机组声明一个监控的主机组,将主机环境中提到的三台主机全部加入监控vi /export/home/nagios/etc/servers/group.cfg新文件,内容如下:1define hostgroup2 hostgroup_name duangr-server3 alias duangr Server4 members duangr-1,duangr-2,duangr-35解释下上面的配置:hostgroup_name: 主机组的名称,可随意指定alias: 主机组别名,可随意指定members: 主机组成员,多个主机名称之前使用逗号分隔.另外主机名称必须与 define host 中host_name 一致.主机的定义,后面会说到.7.2.4 定义监控的主机下面开始定义具体的主机 本地主机监控配置先定义本地主机 duangr-1vi /export/home/nagios/etc/servers/duangr-1.cfg新文件,内容如下:01define host02 use linux-server03 host_name duangr-104 alias duangr-105 address 006 07 08define service09 use local-service10 host_name duangr-111 service_description Host Alive12 check_command check-host-alive13 14define service15 use local-service16 host_name duangr-117 service_description Users18 check_command check_local_users!20!5019 20define service21 use local-service22 host_name duangr-123 service_description CPU24 check_command check_local_load!5.0,4.0,3.0!10.0,6.0,4.025 26define service27 use local-service28 host_name duangr-129 service_description Disk Root30 check_command check_local_disk!20%!10%!/31 32define service33 use local-service34 host_name duangr-135 service_description Disk Home36 check_command check_local_disk!20%!10%!/export/home37 38define service39 use local-service40 host_name duangr-141 service_description Zombie Procs42 check_command check_local_procs!5!10!Z43 44define service45 use local-service46 host_name duangr-147 service_description Total Procs48 check_command check_local_procs!250!400!RSZDT49 50define service51 use local-service52 host_name duangr-153 service_description Swap Usage54 check_command check_local_swap!20!1055 说明下,由于是此主机也是监控服务主节点所在主机,因此可以使用check_local_* 的相关命令来进行监控.这个文件中已经将常用的监控项配置进去. 远程主机监控配置再定义远程主机duangr-2和duangr-3定义远程主机的监控之前,需要先定义check_nrpe命令vi /usr/local/nagios/etc/objects/commands.cfg在文件的最后面添加如下内容:1# check_nrpe command definition2define command3 command_name check_nrpe4 command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -t 30 -c $ARG1$5 6define command7 command_name check_nrpe_args8 command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -t 30 -c $ARG1$ -a $ARG2$9 定义duangr-2主机的监控配置$ vi /usr/local/nagios/etc/servers/duangr-2.cfg新文件,内容如下:001define host002 use linux-server003 host_name duangr-2004 alias duangr-2005 address 1006 007 008define service009 use local-service010 host_name duangr-2011 service_description Host Alive012 check_command check-host-alive013 014define service015 use local-service016 host_name duangr-2017 service_description Users018 check_command check_nrpe_args!check_users!5 10019 020define service021 use local-service022 host_name duangr-2023 service_description CPU024 check_command check_nrpe_args!check_load!15,10,5 30,25,20025 026define service027 use local-service028 host_name duangr-2029 service_description Disk Root030 check_command check_nrpe_args!check_disk!20% 10% /031 032define service033 use local-service034 host_name duangr-2035 service_description Disk /export/home036 check_command check_nrpe_args!check_disk!20% 10% /export/home037 038define service039 use local-service040 host_name duangr-2041 service_description Procs Zombie042 check_command check_nrpe_args!check_procs!5 10 Z043 044define service045 use local-service046 host_name duangr-2047 service_description Procs Total048 check_command check_nrpe_args!check_procs_args!-w400 -c600049 050define service051 use local-service052 host_name duangr-2053 service_description Swap Usage054 check_command check_nrpe_args!check_swap!20% 10%055 056 057;058; 下面是一些常用进程的监控,主要是云平台相关进程059;060; 监控crond进程061define service062 use local-service063 host_name duangr-2064 service_description PS: crond065 check_command check_nrpe_args!check_procs_args!-c1:1 -Ccrond066 067; 监控zookeeper进程068define service069 use local-service070 host_name duangr-2071 service_description PS: QuorumPeerMain072 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -aserver.quorum.QuorumPeerMain073 074;监控storm的从节点进程075define service076 use local-service077 host_name duangr-2078 service_description PS: supervisor079 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -adaemon.supervisor080 081; 监控storm的主节点进程082define service083 use local-service084 host_name duangr-2085 service_description PS: nimbus086 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -adaemon.nimbus087 088; 监控MetaQ进程089define service090 use local-service091 host_name duangr-2092 service_description PS: MetaQ093 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -ametamorphosis-server-w094 095; 监控Redis进程096define service097 use local-service098 host_name duangr-2099 service_description PS: redis-server100 check_command check_nrpe_args!check_procs_args!-c1:1 -Credis-server101 102; 监控hadoop主节点NameNode进程103define service104 use local-service105 host_name duangr-2106 service_description PS: NameNode 107 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -node.NameNode108 109; 监控hadoop主节点SecondaryNameNode进程110define service111 use local-service112 host_name duangr-2113 service_description PS: SecondaryNameNode114 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -node.SecondaryNameNode115 116; 监控hadoop主节点ResourceManager进程117define service118 use local-service119 host_name duangr-2120 service_description PS: ResourceManager121 check_command check_nrpe_args!check_procs_args!-c1:1 -Cjava -aser
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国装配式建筑政策推动与建材供应链优化分析报告
- 2025-2030中国纺织产业升级路径及国际竞争力分析报告
- 2026届四川省资阳市雁江区八年级物理第一学期期末统考模拟试题含解析
- 浙江省温州市秀山中学2026届物理八上期末联考模拟试题含解析
- 2026届汉中市重点中学物理八上期末复习检测模拟试题含解析
- 河南省开封市尉氏县2026届物理八年级第一学期期末检测模拟试题含解析
- 湖北省黄冈市季黄梅县2026届八年级物理第一学期期末考试试题含解析
- 智能快递柜2025年物流信息化解决方案报告
- 县域商业综合体社区商业品牌塑造报告
- 智能工厂2025年技术发展趋势与前景评估可行性分析报告
- 2023江苏省高中学业水平合格性考试英语模拟试卷(含答案详解1)
- 低于成本价中标造成的价格争议
- CPR心肺复苏课件
- 化验室培训记录
- (完整word)化学各仪器矢量图合集
- 埃菲尔铁塔精品课件
- 德国工业标准DIN8077聚丙烯(PP)管材尺寸赵彦波
- 拖拉机和联合收割机查验记录表
- (公开课)26个英文字母书写笔顺动态演示(基础教育)
- Q∕GDW 11304.2-2021 电力设备带电检测仪器技术规范 第2部分:红外热像仪
- 部编版一年级道德与法治上册第1课《开开心心上学去》精品课件
评论
0/150
提交评论