[关闭]
@Great-Chinese 2017-03-14T05:59:51.000000Z 字数 3548 阅读 1024

Linux监控 --nagios

Linux监控--nagios


1.1nagios安装 -服务端(192.168.31.127)

http://ask.apelearn.com/question/7155 # nagios监控搭建参考文献
Nagios是一款开源软件,可以监控网络设备网络流量、Linux/windows主机状态,甚至可以监控打印机。支持web界面配置、管理操作,支持短信、邮件通知,可以自定义脚本实现自定义化监控

  1. # 首先安装epel扩展源
  2. rpm -ivh http://www.lishiming.net/data/attachment/forum/epel-release-5-4_64.noarch.rpm
  3. # 然后分别安装httpd nagios
  4. yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
  5. # 设置登录nagios后台的用户和密码
  6. htpasswd -c /etc/nagios/passwd nagiosadmin
  7. # 检测配置文件
  8. nagios -v /etc/nagios/nagios.cfg
  9. # 启动相关服务
  10. service httpd restart; service nagios start
  11. vim /etc/nagios/nagios.cfg # nagios配置文件

1.2 Nagios安装 - 客户端(192.168.31.116)

1,在客户端安装软件

  1. # 首先在客户端机器上安装epel扩展源(如果安装了,就不需要再安装)
  2. rpm -ivh http://www.lishiming.net/data/attachment/forum/epel-release-5-4_64.noarch.rpm
  3. # 然后在客户端安装相关软件
  4. yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
  5. # 修改客户端配置文件
  6. vim /etc/nagios/nrpe.cfg # 修改内容如下
  7. allowed_hosts=127.0.0.1,192.168.31.127 #后面的ip为服务端ip
  8. dont_blame_nrpe=1
  9. # 启动客户端
  10. /etc/init.d/nrpe start

2,在监控中心(192.168.31.127)添加被监控主机(192.168.31.116)

  1. # 在服务端进入此目录下
  2. cd /etc/nagios/conf.d/
  3. # 在服务端编辑此文件
  4. vim 192.168.31.116.cfg # 增加内容如下
  5. define host{
  6. use linux-server
  7. host_name 192.168.31.116
  8. alias 0.12
  9. address 192.168.31.116
  10. }
  11. define service{
  12. use generic-service
  13. host_name 192.168.31.116
  14. service_description check_ping
  15. check_command check_ping!100.0,20%!200.0,50%
  16. max_check_attempts 5
  17. normal_check_interval 1
  18. }
  19. define service{
  20. use generic-service
  21. host_name 192.168.31.116
  22. service_description check_ssh
  23. check_command check_ssh
  24. max_check_attempts 5
  25. normal_check_interval 1
  26. }
  27. define service{
  28. use generic-service
  29. host_name 192.168.31.116
  30. service_description check_http
  31. check_command check_http
  32. max_check_attempts 5
  33. normal_check_interval 1
  34. }
  35. # 当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
  36. max_check_attempts 5
  37. # 重新检测的时间间隔,单位是分钟,默认是3分钟
  38. normal_check_interval 1
  39. #在服务出现异常后故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0
  40. notification_interval 60
  41. # 在服务端检测配置文件
  42. nagios -v /etc/nagios/nagios.cfg
  43. # 在服务端重启nagios
  44. service nagios restart

3,在监控中心(192.168.31.127)继续添加被监控主机(192.168.31.116)

  1. # 在服务端定义一个check_nrpe命令
  2. vim /etc/nagios/objects/commands.cfg # 增加内容如下
  3. define command{
  4. command_name check_nrpe
  5. command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
  6. }
  7. # 然后在客户端定义command命令
  8. vim /etc/nagios/nrpe.cfg # 增加内容如下
  9. command[check_hda1]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda1
  10. command[check_hda2]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda2
  11. /usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda2 # 查看运行是否正确
  12. # 然后在服务端进入此目录下
  13. cd /etc/nagios/conf.d/
  14. vim 192.168.31.116.cfg # 继续增加内容如下
  15. define service{
  16. use generic-service
  17. host_name 192.168.31.116
  18. service_description check_load
  19. check_command check_nrpe!check_load
  20. max_check_attempts 5
  21. normal_check_interval 1
  22. }
  23. define service{
  24. use generic-service
  25. host_name 192.168.31.116
  26. service_description check_disk_sda1
  27. check_command check_nrpe!check_hda1
  28. max_check_attempts 5
  29. normal_check_interval 1
  30. }
  31. define service{
  32. use generic-service
  33. host_name 192.168.31.116
  34. service_description check_disk_sda2
  35. check_command check_nrpe!check_hda2
  36. max_check_attempts 5
  37. normal_check_interval 1
  38. }
  39. # 客户端重启nrpe
  40. service nrpe restart
  41. # 服务端重启nagios
  42. service nagios restart

1.3,nagios配置邮件告警

  1. # 在客户端配置邮件告警文件
  2. vim /etc/nagios/objects/contacts.cfg # 增加内容如下
  3. define contactgroup{
  4. contactgroup_name admins
  5. alias Nagios Administrators
  6. members nagiosadmin,melody
  7. }
  8. define contact{
  9. contact_name 123
  10. use generic-contact
  11. alias melody
  12. email 244048927@qq.com
  13. }
  14. define contact{
  15. contact_name 456
  16. use generic-contact
  17. alias gary
  18. email 834865081@qq.com
  19. }
  20. # 然后在服务端的告警文件里面加上contact_groups
  21. vim 192.168.31.116.cfg # 增加最后一句
  22. define service{
  23. use generic-service
  24. host_name 192.168.31.116
  25. service_description check_load
  26. check_command check_nrpe!check_load
  27. max_check_attempts 5
  28. normal_check_interval 1
  29. contact_groups common # 增加最后一句
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注