编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

你用过nagios吗?

wxchong 2024-06-13 22:46:42 开源技术 11 ℃ 0 评论

简介

nagios在监控界算是比较古老了!但是应该还有很多人在用吧!

我用过nagios

刚开始工作的时候,其实那时候zabbix已经开始就行了,最开始用的也是zabbix。

换工作之后,机器数量比较少了。之前的运维就搭建了nagios,使用snmp获取监控信息,应该是为了部署方便,毕竟snmp服务在linux上基本都是系统自带的包就有了。

由于还有第三方的监控就没有深入研究nagios,主要是时间不够用!

现在工作中还在用nagios,从开始的终端配置,到使用python脚本批量配置,客户端使用ansible进行部署。

接着就是二次开发,写个web方便配置管理。

机器一多,一个个配置也是麻烦,开发api,让客户端自己上报吧!

历史指标没有怎么办?

nagios默认不保存历史指标,可以通过扩展实现,以前可能用的比较多的解决方案是pnp。

后来在nagios文档里面翻到了一套解决方案:nagflux+influxdb+grafana+histou

nagflux 是将性能指标的文件写入到influxdb里面;

influxdb 是持久化存储指标的;

grafana 可以直接读取influxdb;

histou 就是一套展示前端,不用自己去配置grafana;

nagios 需要配置nagflux能解析出来的性能指标文件

运行了好几年了,还在用!


不足

nagios配置修改后要reload才能生效!没有做变更判断,只能定时reload。

监控项目太多,服务端压力也是很大的时候,特别是reload的时候。

性能指标太长被截断,这个可以修改nrpe的限制来改善,但是需要重新部署!暂时没做!

没有最好,只有更好

现在监控系统有很多选择,适合的就行,能满足的就行。


Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表