培训对象: 面向IT专业人士、系统管理员、开发人员及需要负责系统监控与性能优化的技术人员。适合希望提升现代监控解决方案技能、保障系统可靠性与性能的从业人员。
培训目标: 理解Prometheus的基础概念及其在监控中的作用,掌握在不同环境中配置与部署Prometheus的技能。能够创建与管理告警主动应对潜在问题,通过PromQL查询语言提取与处理数据,构建具有洞察力的仪表板。
培训内容介绍:
性能监控系统价值与演进:学习性能监控系统在企业IT架构中的核心价值,了解监控技术从传统工具到云原生监控的演进历程。
Prometheus基础概念与架构:掌握Prometheus的起源、核心特性与架构设计,理解其与其他监控系统的差异及成为现代IT基础设施优选的原因。
Prometheus安装与配置:学习在Docker、Kubernetes等不同环境中安装与配置Prometheus,掌握配置文件结构、数据源配置及服务发现机制。
Grafana数据分析系统搭建:掌握Grafana的安装与配置,学习数据源接入、仪表板设计、可视化图表配置,构建直观的性能监控看板。
PromQL查询语言深度实践:学习PromQL的基本语法与高级用法,通过实操提取与处理时序数据,构建具有洞察力的监控报告。
Exporter与指标采集:掌握各类Exporter(Node Exporter、Blackbox Exporter等)的配置与使用,学习系统性能数据(CPU、内存、网络、磁盘IO)的采集方法。
告警规则与Alertmanager配置:学习告警规则的定义与配置,掌握Alertmanager的部署与设置,实现告警分组、抑制及路由管理。
告警通知渠道集成:学习将告警集成到钉钉、企业微信、邮件等通知渠道,用Python等语言定制自定义告警实现场景化通知。
JMeter实时压测指标收集:掌握JMeter与Prometheus的集成方法,在压测过程中实时收集响应时间、TPS等性能指标,实现性能瓶颈的动态分析。
服务发现与动态监控:学习基于Kubernetes的服务发现机制,实现动态基础设施的自动监控与指标采集。
指标长期存储方案:了解Prometheus的本地存储限制,学习Thanos、VictoriaMetrics等长期存储解决方案的架构与部署。
综合监控平台部署实战:通过完整项目演练,完成Prometheus+Grafana+Alertmanager监控平台的全流程部署与配置,实现企业级监控体系落地