nagios优化

来源:岁月联盟 编辑:exp 时间:2011-09-07

 一直在使用nagios做系统的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。
1.调整external_command_buffer_slots nagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。
2.避免servicegroup,hostgroup过大 有一次我的一个servicegroup下的service达到了3670个,导致nagios plugin返回127.将这个servicegroup下的service降到2900个后恢复正常。
3.设置use_large_installation_tweaks 这个设置缺省是关闭的,在监控的service较多的情况下,建议打开这个设置。
4.调整max_concurrent_checks  如果有部分service的监控状态一直不更新,建议将这个配置适度调大。
5.调整check_result_reaper_frequency 这个配置决定了处理检查结果的频率,如果这个值太大,会导致监控service的状态更新延时变大。
6.调整max_check_result_reaper_time 这个配置决定了每次处理检查结果最多可以花费的时间。这个值太大或太小都会导致监控service的状态更新延时变大。

作者“linux进阶屋”