曙海培训-混沌工程实战培训课程-曙海培训中心,全国连锁

混沌工程实战培训课程

培训对象： 面向测试工程师、研发工程师、架构师、运维工程师及SRE团队人员。适合需要提升分布式系统容错性、建设高可用服务治理体系的团队技术人员。

培训目标： 深入理解混沌工程的核心理念与实验原则，掌握故障演练平台的流程设计、产品设计及技术架构。能够针对典型历史故障设计实验场景，度量系统稳态，控制爆炸半径，实现自动化演练，切实提升线上系统的稳定性与容错能力。

培训内容介绍：

混沌工程背景与核心原则：学习混沌工程的诞生背景（Netflix ChaosMonkey）及其在分布式系统稳定性保障中的核心价值，掌握混沌工程的五大核心原则。
业内大厂混沌工程实践：通过Netflix、阿里、携程等业界标杆案例，学习不同规模企业的混沌工程落地路径与成熟度模型。
混沌工程体系建设：以混沌工程"五条原则"及"成熟度模型"为指导，学习故障演练平台的建设方法论与组织演进路径。
故障画像与场景设计：掌握如何针对典型历史故障设计实验场景，学习故障画像分析方法，建立系统脆弱点识别机制。
系统稳态指标设计：学习如何定义和度量系统的稳态指标，建立应用在正常状态下的可观测性基准。
爆炸半径控制技术：掌握演练断路器设计原理，学习如何限制故障影响范围，确保演练不会对生产业务造成不可控影响。
故障预案设计：学习针对不同故障场景的预案设计方法，建立故障发生前的应对策略体系。
监控告警体系集成：掌握混沌工程与监控告警体系的联动机制，学习如何通过演练验证监控有效性。
自动化演练实现：从人工值守演练到自动化演练的演进路径，学习常态化演练标准的建立与执行。
技术架构与平台开发：学习故障演练平台的技术架构设计，掌握可扩展、易集成的平台开发方法。
从单应用到数据中心演练：掌握演练范围的扩展策略，从单一应用演练到数据中心级演练的实施要点。
混沌工程文化落地：学习如何在团队中拥抱面向失效设计的文化，持续降低演练成本，建立全面的演练管理体系。

混沌工程实战培训课程-曙海培训中心

培训班介绍

混沌工程实战培训课程