培训对象: 后端开发工程师、数据分析师、运维工程师、需要实现搜索功能的技术人员。
培训目标:
深入理解Elasticsearch的分布式架构和倒排索引原理。
掌握索引设计、映射分析和分词器配置。
能够实现复杂的全文检索和聚合分析查询。
具备ES集群部署、性能优化和数据迁移能力。
培训内容介绍:
二、 索引管理与映射设计: 掌握索引的创建、更新、删除,设计合理的字段映射和动态映射策略,选择合适的分词器。
三、 分词器与中文分词: 配置IK分词器、拼音分词器,自定义词典处理专业术语,解决中文搜索的分词难题。
四、 全文检索查询DSL: 使用match、multi_match、query_string等全文查询,实现相关性评分和搜索排序。
五、 精准查询与复合查询: 使用term、terms、range、bool组合查询,构建复杂的过滤和搜索条件。
六、 聚合分析框架: 掌握Bucket、Metric、Pipeline聚合类型,实现数据统计、分组分析和趋势计算。
七、 地理空间查询: 实现周边搜索、地理距离排序,结合GeoHash处理地理位置数据的聚合分析。
八、 索引别名与重建策略: 使用索引别名实现零停机索引重建,处理索引映射变更和业务迭代。
九、 集群部署与分片规划: 部署多节点集群,规划分片数量和副本数量,分配节点角色(Master/Data/Ingest)。
十、 性能优化与调优策略: 优化查询性能(缓存、路由)、写入性能(批量、刷新间隔)和段合并策略。
十一、 监控与运维管理: 使用Cerebro、Kibana监控集群健康状态,管理索引生命周期和快照备份恢复。
十二、 实战项目:构建搜索引擎应用: 开发电商商品搜索、日志分析系统或站内全文检索,涵盖数据同步、搜索和聚合全流程。