曙海培训-大模型应用开发：RAG与企业知识库培训课程-曙海培训中心,全国连锁

大模型应用开发：RAG与企业知识库培训课程

培训对象： 后端开发工程师、全栈工程师、AI应用开发者、希望构建智能知识库的IT人员。
培训目标：
- 掌握RAG原理： 深入理解检索增强生成（RAG）的核心架构和工作流程。
- 熟悉向量数据库： 学习向量数据库的基本概念、选型及在RAG中的应用。
- 开发RAG应用： 能够独立搭建一个基于外部知识库的智能问答系统，处理文档加载、切片、嵌入、存储、检索和生成的完整链路。
- 优化检索效果： 掌握提升检索精度和生成质量的高级技巧，如混合搜索、重排序等。
培训内容介绍：
- 一、RAG全景图： 深入剖析RAG如何弥补大模型知识滞后和缺乏私有知识的短板。
- 二、文档加载与解析： 实战：使用工具（如LangChain、LlamaIndex）加载PDF、Word、网页等多种格式的文档。
- 三、文本切片策略： 探讨不同切片方法（固定大小、递归、基于文档结构）对检索效果的影响及最佳实践。
- 四、向量化与Embedding模型： 讲解如何将文本转换为向量，并介绍主流的Embedding模型及其选型。
- 五、向量数据库深度解析： 对比主流向量数据库（Pinecone, Milvus, Chroma, Qdrant）的架构、特点与适用场景。
- 六、构建RAG流水线（一）： 使用LangChain/LlamaIndex框架，将文档存储到向量数据库。
- 七、构建RAG流水线（二）： 实现基于用户问题的向量检索，并将检索到的上下文与问题一起提交给大模型生成答案。
- 八、检索效果优化： 学习混合搜索（关键字+向量）、元数据过滤、重排序等高级检索技巧。
- 九、多模态RAG探索： 介绍如何让RAG系统检索和处理图片、表格等非结构化数据。
- 十、查询理解与改写： 引入Query Understanding技术，对用户问题进行改写、扩展，提升检索命中率。
- 十一、RAG应用评估： 介绍评估RAG系统性能的指标（如检索命中率、生成答案的忠实度）和工具（如RAGAS）。
- 十二、企业级RAG应用部署： 讨论如何将RAG应用容器化、部署到云环境，并进行性能监控和日志分析。

大模型应用开发：RAG与企业知识库培训课程-曙海培训中心

培训班介绍

大模型应用开发：RAG与企业知识库培训课程