培训对象: 后端开发工程师、全栈工程师、AI应用开发者、希望构建智能知识库的IT人员。
培训目标:
掌握RAG原理: 深入理解检索增强生成(RAG)的核心架构和工作流程。
熟悉向量数据库: 学习向量数据库的基本概念、选型及在RAG中的应用。
开发RAG应用: 能够独立搭建一个基于外部知识库的智能问答系统,处理文档加载、切片、嵌入、存储、检索和生成的完整链路。
优化检索效果: 掌握提升检索精度和生成质量的高级技巧,如混合搜索、重排序等。
培训内容介绍:
一、RAG全景图: 深入剖析RAG如何弥补大模型知识滞后和缺乏私有知识的短板。
二、文档加载与解析: 实战:使用工具(如LangChain、LlamaIndex)加载PDF、Word、网页等多种格式的文档。
三、文本切片策略: 探讨不同切片方法(固定大小、递归、基于文档结构)对检索效果的影响及最佳实践。
四、向量化与Embedding模型: 讲解如何将文本转换为向量,并介绍主流的Embedding模型及其选型。
五、向量数据库深度解析: 对比主流向量数据库(Pinecone, Milvus, Chroma, Qdrant)的架构、特点与适用场景。
六、构建RAG流水线(一): 使用LangChain/LlamaIndex框架,将文档存储到向量数据库。
七、构建RAG流水线(二): 实现基于用户问题的向量检索,并将检索到的上下文与问题一起提交给大模型生成答案。
八、检索效果优化: 学习混合搜索(关键字+向量)、元数据过滤、重排序等高级检索技巧。
九、多模态RAG探索: 介绍如何让RAG系统检索和处理图片、表格等非结构化数据。
十、查询理解与改写: 引入Query Understanding技术,对用户问题进行改写、扩展,提升检索命中率。
十一、RAG应用评估: 介绍评估RAG系统性能的指标(如检索命中率、生成答案的忠实度)和工具(如RAGAS)。
十二、企业级RAG应用部署: 讨论如何将RAG应用容器化、部署到云环境,并进行性能监控和日志分析。