专题一:Cassandra数据库管理基础
专题二:Cassandra数据建模与CQL开发
专题三:Cassandra高可用与一致性管理
专题四:Cassandra性能优化与调优
专题五:Cassandra备份恢复与集群管理
专题六:Cassandra云服务与生态工具
专题七:Cassandra CQL深度开发与查询优化
专题八:Cassandra开发集成(Java/Python/Go)
专题九:Cassandra监控与运维自动化
专题十:Cassandra安全与权限管理
专题十一:Cassandra数据迁移与跨中心复制
专题十二:Cassandra高级特性与实践
培训对象:
新入职的数据库管理员、系统运维人员
需要掌握Cassandra基础管理的开发人员
准备DataStax Cassandra基础认证的初级从业者
培训目标:
掌握Cassandra的安装配置、体系结构、日常管理操作,能够独立完成集群搭建、节点管理、基本CQL操作,理解无中心架构的核心原理。
培训内容:
NoSQL与Cassandra定位:列式数据库特性、CAP理论(AP)、最终一致性、适用场景(时序、消息、推荐等)
Cassandra发展历史:从Facebook开源到DataStax商业化、版本演进
体系架构:无中心对等架构、Gossip协议、节点发现机制
数据模型基础:Keyspace、Table、Row、Column、Partition Key、Clustering Key
安装部署:单节点安装、多节点集群规划、配置文件(cassandra.yaml)核心参数
集群通信:Snitch(动态感知)、Gossip种子节点配置
客户端工具:cqlsh命令行使用、nodetool工具集、DataStax Studio
基本CQL操作:创建Keyspace、创建表、插入/查询/更新/删除数据
节点管理:启动/停止节点、节点状态查看(nodetool status)、节点添加/移除
日志管理:system.log调试、调试级别设置、慢查询日志
集群监控初步:nodetool info/tpstats/compactionhistory
综合实战:搭建三节点Cassandra集群并完成基本运维任务
培训对象:
软件开发工程师、数据建模人员
从关系型数据库转向Cassandra的开发人员
需要设计高性能数据模型的架构师
培训目标:
掌握Cassandra数据建模的核心原则(围绕查询设计),能够根据业务访问模式设计合理的表结构、主键和二级索引,避免常见建模陷阱。
培训内容:
数据建模原则:围绕查询建模(Query-First Design)、反范式化、避免JOIN和事务
主键设计:Partition Key与Clustering Key的作用、唯一性保证、数据分布影响
查询驱动建模步骤:识别业务查询、设计表满足查询、评估性能与存储
表设计示例:用户表、时间序列表、物联网设备数据表
复合主键与排序:Clustering Key排序方向、多字段排序规则
二级索引:原生二级索引原理、局限性(性能、一致性)、何时使用
物化视图(Materialized View):自动维护视图表、适用场景、注意事项
轻量级事务(LWT):Compare-and-Set机制、性能影响、适用场景
集合类型:Set、List、Map的使用与限制(冻结集合、大小限制)
用户定义类型(UDT):嵌套结构、适用场景
TTL(Time To Live):自动过期数据、表级和列级TTL
综合实战:为电商订单系统设计Cassandra数据模型
培训对象:
数据库管理员、系统架构师
需要设计高可用、多数据中心方案的运维负责人
准备DataStax高级认证的从业者
培训目标:
深入理解Cassandra高可用机制,掌握数据复制、一致性级别、多数据中心部署、故障检测与恢复,能够设计跨地域容灾架构。
培训内容:
数据复制机制:Partitioner(分区器)、Replication Factor、复制策略(SimpleStrategy/NetworkTopologyStrategy)
一致性级别:ONE、QUORUM、LOCAL_QUORUM、EACH_QUORUM、ALL等,读写一致性配置
读写协调过程:协调节点(Coordinator)、从副本读取、读修复(Read Repair)
提示移交(Hinted Handoff):临时故障处理、hint存储与重放
故障检测与恢复:Phi Accrual Failure Detector、节点恢复后的数据同步(Hinted Handoff/修复)
节点修复(Node Repair):nodetool repair必要性、增量修复、全量修复
多数据中心部署:NetworkTopologyStrategy配置、跨数据中心读写一致性
跨数据中心复制:每个数据中心独立副本因子、本地读优先
一致性权衡:强一致性与高可用的平衡、影响性能的因素
轻量级事务(LWT)与Paxos:内部Paxos协议实现、序列化一致性
容灾演练:节点故障模拟、数据中心故障模拟、恢复流程
综合实战:配置多数据中心集群并验证跨数据中心读写一致性
培训对象:
资深数据库管理员、性能优化工程师
应用开发人员需要优化查询
运维负责人
培训目标:
掌握Cassandra性能优化的核心方法,能够进行内存/磁盘/线程调优、Compaction策略选择、查询优化、硬件规划,提升集群吞吐和延迟。
培训内容:
性能影响因素:硬件、数据模型、查询模式、GC、操作系统
内存调优:堆内存设置、堆外内存、off-heap缓存、JVM调优基础
磁盘I/O优化:CommitLog/SSTable分离、Compaction I/O控制、RAID策略
线程池调优:并发读/写线程、Compaction线程数、TCP设置
Compaction策略选择:SizeTieredCompaction、LeveledCompaction、TimeWindowCompactionStrategy适用场景
缓存配置:Key Cache、Row Cache、Counter Cache命中率优化
查询优化:避免全表扫描、ALLOW FILTERING使用限制、索引优化
分页查询:token函数分页、offset限制、高效游标
批量操作(Batch):使用场景、性能影响、atomicity权衡
监控工具:nodetool cfstats、tpstats、proxyhistograms解读
GC优化:G1GC配置、GC日志分析、停顿排查
综合实战:对Cassandra集群进行全链路压测与优化
培训对象:
数据库管理员、灾备管理人员
需要制定备份策略的运维工程师
负责集群日常运维的人员
培训目标:
掌握Cassandra备份恢复的多种方法,能够进行快照备份、增量备份、跨集群数据同步,并能执行数据恢复、集群重建等操作。
培训内容:
备份概述:数据一致性保证、备份窗口、RPO/RTO设定
快照备份(Snapshot):nodetool snapshot创建、增量备份与增量快照
备份文件管理:SSTable文件存储、提交日志备份可选项
恢复操作:快照恢复流程、同步恢复后的数据(incremental repair)
数据导入导出:COPY命令(CSV)、sstableloader工具(批量加载)
跨集群数据同步:Spark连接、DSBulk工具、自研ETL
集群扩缩容:添加新节点(bootstrap)、节点下线(decommission)、数据重新平衡
节点替换:硬件故障时用新节点替换、数据自动同步
集群升级:滚动升级步骤、版本兼容性、降级方案
元数据备份:system keyspace备份、schema导出
备份验证与演练:定期恢复演练、数据完整性检查
综合实战:执行节点替换和快照恢复演练
培训对象:
云架构师、DevOps工程师
需要将Cassandra部署到云环境的技术人员
基于Cassandra的SaaS开发者
培训目标:
掌握云上Cassandra服务(如DataStax Astra、Amazon Keyspaces、阿里云Cassandra版)的使用方法,了解相关生态工具。
培训内容:
云Cassandra服务概览:DataStax Astra、Amazon Keyspaces、Azure Managed Instance for Cassandra、阿里云Cassandra
DataStax Astra:无服务器模式、按量付费、内置监控
Amazon Keyspaces:兼容Cassandra协议的AWS托管服务、容量模式
云上实例创建:网络配置(VPC)、安全组、访问控制(IAM)
连接与驱动:云服务连接方式(证书/令牌)、专用终端节点
备份与恢复:云服务内置备份、PITR、跨区域复制
监控与告警:云监控集成、性能指标、成本分析
迁移到云:cassandra-loader、AWS DMS、双写迁移
生态工具:DataStax Studio(数据建模与查询)、OpsCenter(监控管理)、K8s Operator
与大数据生态集成:Spark Connector、Flink Connector、Kafka Connect
客户端驱动兼容性:不同语言驱动对云服务的支持
综合实战:在DataStax Astra上创建集群并连接测试
培训对象:
软件开发工程师
需要编写复杂CQL查询的开发人员
数据库性能调优人员
培训目标:
深入掌握CQL语法与高级特性,能够利用函数、聚合、条件更新、集合操作等编写高效查询,避免常见性能陷阱。
培训内容:
CQL数据类型深入:uuid、timeuuid、duration、inet、tuple等
高级查询条件:IN、CONTAINS、LIKE(6.0+)、!=(6.0+)
聚合函数:COUNT、SUM、AVG、MIN、MAX(需ALLOW FILTERING)
分组与排序:GROUP BY(4.6+)、ORDER BY与分区内排序
JSON支持:SELECT JSON、INSERT JSON、导出JSON
条件更新:IF EXISTS、IF NOT EXISTS、IF条件判断
批量操作优化:BATCH原子性保证、批量大小控制
计数器表:计数器类型、原子增量、适用场景
函数与表达式:WRITETIME、TTL、token、cast
索引性能考量:二级索引查询限制、索引选择建议
分页技术:paging state、自动分页、客户端游标
综合实战:使用CQL完成复杂报表查询(结合聚合与分页)
培训对象:
Java/Python/Go开发工程师
需要连接Cassandra的应用开发者
全栈开发人员
培训目标:
掌握主流语言连接Cassandra的客户端驱动使用方法,能够进行数据操作、连接池配置、异步处理,开发高性能应用。
培训内容:
Java驱动:DataStax Java Driver(4.x/3.x)对比、依赖引入
Java驱动基础:CqlSession构建、执行CQL、结果集处理
Java驱动高级特性:异步执行、可重试策略、负载均衡策略(DCAware/TokenAware)
Spring Data Cassandra集成:实体映射、CassandraRepository、模板使用
Python驱动:DataStax Python Driver安装、Session配置、PreparedStatement
Python异步支持:异步驱动(AIO)基础
Go驱动:gocql包使用、连接配置、迭代器、扫描
连接池调优:连接数配置、心跳、空闲清理
异步与非阻塞:响应式编程与Cassandra结合(Reactive Cassandra)
对象映射框架:Kundera(JPA)、Achilles(高级对象映射)
数据一致性在客户端的实现:一致性级别配置、重试策略
综合实战:使用Spring Data Cassandra构建REST API
培训对象:
数据库运维工程师、SRE
监控系统建设人员
需要构建自动化运维平台的工程师
培训目标:
掌握Cassandra监控体系与自动化运维工具,能够使用Prometheus、Grafana、DataStax OpsCenter等实现全栈监控和自动化管理。
培训内容:
监控指标分类:节点状态、吞吐量(读/写)、延迟(99th)、存储容量、GC活动
DataStax OpsCenter:安装配置、监控面板、管理功能(修复/备份)
JMX监控:Cassandra JMX MBean、jconsole/jmxterm使用
Prometheus集成:cassandra-exporter、metric收集、配置
Grafana仪表盘:预置面板导入、关键指标可视化
告警规则:节点宕机、高延迟、GC暂停、空间不足
日志分析:system.log、debug.log、gc.log分析工具
nodetool命令自动化:脚本封装、状态检查、定期修复
自动化部署工具:Ansible Playbook、Chef Cookbooks
滚动升级自动化:版本升级步骤、健康检查
备份恢复自动化:定时快照、上传S3、恢复脚本
综合实战:使用Prometheus+OpsCenter构建完整监控体系
培训对象:
安全管理员、数据库管理员
合规审计人员
需要满足等保要求的系统负责人
培训目标:
掌握Cassandra安全配置,包括认证、授权、加密、审计,能够保护数据安全,满足合规要求。
培训内容:
安全框架:认证(Authentication)、授权(Authorization)、加密(Encryption)、审计(Audit)
认证配置:PasswordAuthenticator、LDAP集成、Kerberos(DataStax Enterprise)
角色与权限:CREATE ROLE、LOGIN、SUPERUSER、授权(GRANT/REVOKE)
对象权限:权限级别(ALL/ALTER/SELECT/MODIFY/DROP等)、级联授权
加密通信:node-to-node加密(TLS)、client-to-node加密
静态加密:数据文件加密(磁盘加密)、JVM系统属性
审计日志:审计类别配置、日志存储、告警集成
安全最佳实践:禁用默认端口、关闭不必要服务、最小权限原则
渗透测试基础:常见攻击向量(无认证、弱密码)
合规支持:与LDAP/AD集成、日志合规存储
网络安全策略:防火墙规则、安全组配置
综合实战:配置Cassandra集群启用认证与TLS
培训对象:
数据库架构师、数据迁移工程师
需要执行异构数据迁移的技术人员
多数据中心部署负责人
培训目标:
掌握从关系型数据库或其他NoSQL到Cassandra的数据迁移方法,以及跨数据中心的数据同步策略,确保数据无缝迁移和异地容灾。
培训内容:
迁移方法论:评估兼容性、数据建模调整、迁移工具选型
从RDBMS迁移:使用Spark Connector、读取JDBC写入Cassandra
从HBase迁移:利用ExportSnapshot、BulkLoad
从MongoDB迁移:自定义ETL、变更数据捕获(CDC)
DSBulk工具:高性能批量导入导出、参数优化
实时同步:Kafka Connect Cassandra Sink Connector、CDC (Debezium)
跨数据中心复制:NetworkTopologyStrategy、异步复制、读写一致性
双活数据中心架构设计:本地读、本地写、冲突处理
迁移验证:数据一致性检查、性能对比、应用回归测试
停机迁移与在线迁移策略:双写、切流量
迁移后优化:compaction调整、缓存预热
综合实战:使用DSBulk将MySQL数据迁移到Cassandra
培训对象:
高级数据库管理员、架构师
需要利用Cassandra高级特性的技术专家
准备DataStax高级认证的从业者
培训目标:
深入理解Cassandra高级特性,如物化视图、SASI索引、存储附加索引(SAI)、DSE特性,能够根据复杂场景设计优化方案。
培训内容:
物化视图深入:内部实现、性能影响、与二级索引对比
SASI索引(实验性):字符串索引增强、性能分析
存储附加索引(SAI):DataStax Enterprise索引、索引选择建议
时序数据优化:TWCS Compaction策略、分区大小管理
计数器表高级应用:分布式计数器、批量递增
用户定义函数(UDF)与聚合(UDA):DSE/开源版本支持
Spark与Cassandra集成优化:数据本地性、分区切分
搜索引擎集成:DSE Search(Solr)、Elasticsearch与Cassandra集成
多租户实现:使用Keyspace隔离、资源限制(cgroups)
故障自愈自动化:结合运维工具实现自动修复
混沌工程实验:注入故障、验证系统韧性
综合实战:设计支持多租户、时序大数据的Cassandra架构