简介
nagios在监控界算是比较古老了!但是应该还有很多人在用吧!
我用过nagios
刚开始工作的时候,其实那时候zabbix已经开始就行了,最开始用的也是zabbix。
换工作之后,机器数量比较少了。之前的运维就搭建了nagios,使用snmp获取监控信息,应该是为了部署方便,毕竟snmp服务在linux上基本都是系统自带的包就有了。
由于还有第三方的监控就没有深入研究nagios,主要是时间不够用!
现在工作中还在用nagios,从开始的终端配置,到使用python脚本批量配置,客户端使用ansible进行部署。
接着就是二次开发,写个web方便配置管理。
机器一多,一个个配置也是麻烦,开发api,让客户端自己上报吧!
历史指标没有怎么办?
nagios默认不保存历史指标,可以通过扩展实现,以前可能用的比较多的解决方案是pnp。
后来在nagios文档里面翻到了一套解决方案:nagflux+influxdb+grafana+histou
nagflux 是将性能指标的文件写入到influxdb里面;
influxdb 是持久化存储指标的;
grafana 可以直接读取influxdb;
histou 就是一套展示前端,不用自己去配置grafana;
nagios 需要配置nagflux能解析出来的性能指标文件
运行了好几年了,还在用!
不足
nagios配置修改后要reload才能生效!没有做变更判断,只能定时reload。
监控项目太多,服务端压力也是很大的时候,特别是reload的时候。
性能指标太长被截断,这个可以修改nrpe的限制来改善,但是需要重新部署!暂时没做!
没有最好,只有更好
现在监控系统有很多选择,适合的就行,能满足的就行。
本文暂时没有评论,来添加一个吧(●'◡'●)