培训对象: 高级运维工程师、SRE、云架构师、平台工程师。
培训目标:
掌握云平台架构设计: 学习如何基于公有云或私有云设计高可用、高弹性的云平台架构。
精通云原生运维技术: 深入掌握Kubernetes、Service Mesh(Istio)、GitOps等云原生技术的运维实践。
提升平台工程能力: 能够构建企业内部的开发者平台(IDP),提升研发自服务能力和交付效率。
构建可观测性体系: 学会搭建涵盖指标、日志、链路的立体化可观测性体系,快速定位和解决问题。
培训内容介绍:
一、云平台架构设计原则: 讲解高可用、容灾、弹性伸缩、成本优化的云平台架构设计方法论。
二、多云与混合云管理: 探讨多云/混合云架构的挑战与解决方案,使用Terraform等工具实现基础设施即代码(IaC)。
三、Kubernetes集群深度运维: 集群版本升级、节点管理、性能调优、安全加固、故障排查高级技巧。
四、服务网格(Istio)实战: 深入介绍Istio架构,实现灰度发布(金丝雀、蓝绿)、流量治理、可观测性增强和安全通信(mTLS)。
五、GitOps与持续交付: 使用ArgoCD或Flux实现基于Git的声明式应用交付,提升部署的可靠性和安全性。
六、构建内部开发者平台(IDP): 探讨如何通过抽象底层基础设施复杂性,为开发者提供“自助式”的应用部署和管理平台。
七、云原生可观测性(一)- 监控: 深入Prometheus联邦、远程存储、高可用方案,实现大规模集群监控。
八、云原生可观测性(二)- 日志: 构建Loki或EFK日志栈,实现日志的高效采集、存储和查询分析。
九、云原生可观测性(三)- 链路追踪: 使用Jaeger或SkyWalking实现分布式追踪,快速定位微服务性能瓶颈。
十、云成本优化(FinOps): 学习如何分析云成本构成,通过资源优化、弹性伸缩、购买策略等手段有效控制云支出。
十一、云平台安全最佳实践: 镜像安全扫描、运行时安全、策略即政策(OPA)、合规性审计。
十二、混沌工程与稳定性建设: 引入混沌工程理念,通过主动注入故障来验证和提升系统的韧性。