我们在k8s集群中使用云原生的promethues通常需要用到coreos的prometheus-operater,它可以方便的帮助我们在k8s中部署和配置使用prometheus。但prometheus并不是开箱即用的,如果要做到开箱即用的监控全家桶,官方提供了两个选择,分别是prometheus-operater helm chart和kube-prometheus。这两者都可以为我们提供开箱即用的方式部署promethues+alertmanager+promethues-push-gateway(kube-promethueus不包含,需要单独部署)+grafana全家桶,同时包含kubernetes-mixin的一整套报警规则和node-exporter,kube-state-metrics等一系列metrics exporter。区别在于helm chart由社区维护,而kube-promethues由coreos维护。这里我们将以kube-prometheus为例,简要说明配置和使用方式。
继续阅读“配置和使用kube-prometheus”
grafana dashboard django bug修复
grafana的官方有很多用户提供的dashboard样本,其中关于django的有
https://grafana.com/grafana/dashboards/9528
对应的django-metric是https://github.com/korfuri/django-prometheus/
但是这个dashboard的页面是有问题的。页面的选择器选择的label是app,但是prometheus采集到的metric label是service和job。所以我们需要把dashboard json做一下修改。
继续阅读“grafana dashboard django bug修复”
两个简单的linux监控软件
除了zabbix,nagios这样重量型的监控软件之外,挑选了几个简单的linux监控软件,也还比较好用,记录一下
继续阅读“两个简单的linux监控软件”
windows配置snmp v3监控(net-snmp)
因为windows本身是不支持snmp v3的,所以需要第三方工具的帮助
这里我们选择常用的net-snmp
继续阅读“windows配置snmp v3监控(net-snmp)”