运维平台开发工程师、平台工程团队成员
运维架构师、技术负责人
DevOps工程师、SRE(站点可靠性工程师)
希望建设内部开发者平台(IDP)的技术管理者
理解平台工程(Platform Engineering)的核心理念与价值
掌握运维平台的整体架构设计与关键技术选型
学会构建企业级内部运维平台,提供自助化、标准化的运维能力
熟悉平台工程化实践,包括基础设施即代码、CI/CD平台、可观测性平台等
了解平台运营度量与持续改进方法
通过行业案例掌握运维平台工程的落地路径与演进趋势
平台工程概述:平台工程的定义、发展背景与核心价值;与DevOps、SRE的关系与协同;平台工程成熟度模型;从传统运维到平台工程的演进路径。
运维平台架构设计:平台分层架构(基础设施层、核心服务层、能力层、交互层);平台能力抽象与服务化;平台高可用与扩展性设计;多租户与资源隔离方案。
基础设施即代码(IaC)与平台工程:Terraform、Crossplane、Pulumi等工具在平台中的应用;资源抽象与标准化;基础设施自助申请与交付流程;配置漂移检测与修复。
CI/CD平台设计与实践:统一CI/CD引擎选型(Jenkins、GitLab CI、Tekton);多租户流水线设计与隔离;流水线模板与最佳实践;发布策略(蓝绿部署、金丝雀发布)的平台化支持。
可观测性平台建设:统一监控、日志、追踪平台架构(Prometheus + Loki + Tempo + Grafana);数据采集与存储方案;平台自身可观测性设计(健康检查、性能监控);告警统一接入与管理。
运维门户与开发者自服务:内部开发者平台(IDP)设计理念;Backstage等开源框架的应用;服务目录与环境管理;资源申请、环境创建、权限申请等自助流程。
CMDB与服务拓扑:配置管理数据库(CMDB)的建设与维护;资源与应用的关联模型;服务依赖关系自动发现;CMDB与自动化平台的联动。
权限管理与统一认证:多系统统一认证(SSO)集成;基于角色的访问控制(RBAC)模型设计;权限治理与审计日志;平台内跨系统权限同步。
运维流程自动化与作业平台:作业平台架构设计(脚本库、任务编排、审批流);常见运维场景自动化(发布、巡检、备份);工单系统与自动化引擎联动;执行记录与审计。
平台工程化工具链:平台自身的CI/CD、测试、版本管理;开源工具选型与集成(Kubernetes、Docker、Prometheus等);平台组件生命周期管理;平台开发与运维的融合。
平台运营度量与持续改进:平台使用数据采集与分析(用户活跃度、资源利用率);开发者满意度度量与反馈机制;平台健康度与SLO;平台ROI评估与持续优化。
平台工程案例与演进趋势:行业头部企业(如腾讯、阿里、字节)的平台工程实践;平台即产品理念;平台生态建设与开源贡献;平台工程未来趋势(AI驱动、平台网格)。