培训对象: 监控运维工程师、系统管理员、DevOps工程师、SRE人员。
培训目标:
掌握Zabbix和Prometheus两种主流监控体系的架构。
能够自定义监控指标采集业务和系统数据。
熟练配置告警规则和通知渠道。
具备监控系统选型和迁移能力。
培训内容介绍:
二、 Zabbix架构与部署: 安装Zabbix Server、Agent和Web界面,理解Server、Proxy、Agent的角色。
三、 Zabbix监控项配置: 使用系统自带监控项,自定义监控项(UserParameter)采集应用指标(如并发连接数)。
四、 Zabbix触发器与告警: 配置触发器表达式,设置告警动作,集成企业微信、钉钉通知。
五、 Zabbix模板与自动发现: 创建模板复用监控配置,使用自动发现(LLD)监控动态端口和挂载点。
六、 Prometheus架构与部署: 安装Prometheus Server,配置抓取目标,了解TSDB存储原理。
七、 Prometheus Exporters使用: 部署Node Exporter、MySQL Exporter、Blackbox Exporter采集各类指标。
八、 自定义指标接入(Pushgateway): 对于短任务和批处理作业,使用Pushgateway推送自定义指标。
九、 PromQL自定义查询: 编写PromQL查询自定义指标,聚合计算业务关心的数据(QPS、成功率)。
十、 Grafana自定义仪表盘: 在Grafana中创建自定义仪表盘,使用变量实现动态过滤,展示业务指标。
十一、 AlertManager告警配置: 配置告警规则(rules),定义路由和接收器,实现告警分级和抑制。
十二、 实战项目:业务指标监控落地: 为具体业务应用自定义监控指标,分别在Zabbix和Prometheus中实现,对比效果。