培训对象:
大数据工程师、OLAP开发人员、数据分析平台开发者、BI报表工程师。
培训目标:
理解Kylin的Cube预计算原理和适用场景。
掌握数据模型设计和Cube构建优化。
能够使用SQL和BI工具查询Kylin。
具备Cube管理和查询性能调优能力。
培训内容介绍:
二、 Kylin部署与配置: 安装Kylin服务,配置与Hadoop、Hive、HBase的集成,启动Cube构建引擎。
三、 数据模型设计: 创建项目和数据源,设计事实表和维度表,建立星型模型和雪花模型。
四、 Cube构建原理: 理解Cube的Cuboid概念,了解逐层构建和快速构建算法的差异。
五、 维度与度量定义: 选择维度列,定义度量聚合类型(SUM、COUNT、MAX、MIN、DISTINCT COUNT)。
六、 Cube构建优化: 使用聚合组(Aggregation Group)、强制维度(Mandatory Dimension)减少Cuboid数量。
七、 Rowkey设计: 设计Rowkey顺序,将高频过滤字段前置,使用字典编码压缩存储。
八、 Cube构建与调度: 触发全量构建和增量构建,设置构建调度策略,监控构建进度。
九、 SQL查询接口: 使用标准SQL查询Kylin,理解查询下压和查询改写机制。
十、 BI工具集成: 配置Tableau、PowerBI等工具连接Kylin,实现可视化报表开发。
十一、 查询性能调优: 分析慢查询日志,优化维度过滤条件,使用查询缓存提升响应速度。
十二、 实战项目:多维分析平台: 针对销售/流量数据设计Cube,实现OLAP多维分析,支持钻取、切片、旋转操作。