课程定位
大模型高级工程师认证课程,帮助学员掌握:
§ 大模型提示词技巧
§ 检索增强和微调的原理和流程
§ LangChain、Llama-Index 和 Dify 等大模型开发组件的使用方法
§ 工程化评测的概念与方法
§ 大模型的规范和安全性
课程以项目式结构呈现,学员将作为教育内容开发公司的员工,构建基于大模型的答疑机器人,解决新员工入职频繁答疑的问题。同时,课程将结合垂直领域应用场景,特别是投资研究部门的个性化需求,探讨大模型在专业领域的深度应用。
针对投资研究部门的垂直领域应用需求,介绍如何将大模型技术应用于金融投资研究场景,包括行业分析、公司研究、市场数据解读等专业应用。
§ 获取课程代码并安装依赖环境
§ 切换 Python 环境
针对投资研究部门的垂直领域应用场景,探讨如何将大模型技术应用于金融数据分析、行业研究报告生成、投资决策支持等专业场景。
§ 新员工频繁咨询相同问题
§ 文档库信息过多,难以消化
§ 传统问答系统基于固定规则,无法处理不同问法
利用大模型技术构建智能问答应用,基于公司内部知识库准确回答问题。
针对投资研究部门的垂直领域需求,探讨如何构建面向金融行业的智能问答系统,处理行业分析、公司研究、市场数据等专业问题。
§ 通过 OpenAI Python SDK 调用大模型
§ 流式输出优化用户体验
§ API Key 安全配置
§ 输入文本分词化(Token 化)
§ Token 向量化
§ 大模型推理
§ 输出 Token(自回归生成)
§ 输出文本
§ Temperature:控制随机性(0-2)
§ Top_p:控制候选范围(0-1)
§ 参数调优策略
§ 大模型知识局限性
§ 上下文窗口限制
§ 上下文工程(Context Engineering)概念
§ RAG(检索增强生成)技术方案
针对投资研究部门的垂直领域应用,探讨如何利用大模型 API 处理金融术语、行业数据、研究报告等专业内容,以及如何构建面向投研场景的智能问答系统。
§ 建立索引阶段:文档解析、文本分段、文本向量化、存储索引
§ 检索生成阶段:检索相关文本段、生成最终回答
§ 使用 LlamaIndex 构建 RAG 应用
§ 索引保存与加载
§ 代码封装与复用
§ Embedding 模型的作用
§ 对比学习原理
§ 向量相似度计算
针对投资研究部门的垂直领域知识库,探讨如何构建金融行业专业文档的 RAG 系统,包括行业报告、公司财报、市场数据的检索与生成应用。
§ 基本要素:任务目标、上下文、角色、受众、样例、输出格式
§ 提示词模板设计
§ 清晰表达需求,使用分隔符
§ 限定角色和受众
§ 规定输出格式(结构化输出)
§ 提供少样本示例
§ 思维链(Chain of Thought)推理
§ 文档润色
§ 文档质量审查
§ 内容创作
§ 文本分类与情感分析
针对投资研究部门的垂直领域应用,探讨如何优化提示词以生成高质量的研究报告、行业分析文档,以及如何利用大模型进行金融文本的情感分析和风险识别。
§ 答疑机器人存在的问题
§ 查看 RAG 检索结果排查问题
§ 建立自动化测试机制
§ Ragas 评测框架
§ TruLens 评测框架
§ DeepEval 评测框架
§ 自定义评测框架
§ Answer Correctness:评估回答准确度
§ Context Recall:评估检索召回效果
§ Context Precision:评估检索精度
§ 评测指标计算过程
针对投资研究部门的垂直领域应用,探讨如何构建专业的评测体系,评估金融问答系统的准确性、专业性和合规性,确保投研建议的质量和可靠性。
§ 增加召回文档切片数量
§ 文档结构化处理(Markdown 格式)
§ 评估改进效果
§ 内容质量优化
§ 召回算法优化
§ 文本分割优化(Token 分割、句子分割、句子窗口分割、语义分割、Markdown 分割)
§ 上下文窗口优化
§ 问题改写优化(多步骤查询分解、HyDE 假设文档增强检索)
§ 重排序优化
§ 大模型参数调优
§ 提示词模板优化
§ 优化效果评估
针对投资研究部门的垂直领域应用,探讨如何优化 RAG 系统以准确检索和生成金融行业专业内容,包括行业分析、公司研究、市场趋势等投研核心场景。
§ 工具调用
§ 多模态处理
§ 任务分解
§ 上下文管理
§ 明确目标
§ 定义工具函数
§ 将工具函数与大模型集成(Assistant API)
§ 建立工具映射关系
§ 意图识别的作用
§ 多任务处理流程
§ 上下文工程应用
针对投资研究部门的垂直领域应用,探讨如何构建智能体系统处理投研场景的复杂任务,如数据查询、报告生成、风险评估等,以及如何实现多智能体协同完成投研工作流。
§ 垂直领域适配
§ 任务优化
§ 成本控制
§ 性能提升
§ 机器学习基础:通过数据寻找规律
§ Loss Function 和 Cost Function
§ 梯度下降算法
§ 神经网络:万能复杂函数逼近器
§ 预训练与微调
§ 高效微调技术(LoRA)
§ 任务设计
§ 微调流程
§ 训练参数调优
§ 微调效果评估
§ 常见问题与解决方法
针对投资研究部门的垂直领域应用,探讨如何通过微调技术让大模型更好地理解金融术语、行业知识、投资逻辑,提升在投研场景下的准确性和专业性。
§ 预置模型 API 调用
§ 按需计费
§ 无需运维
§ 限流问题
§ 使用 vLLM 部署模型
§ 部署开源模型
§ 部署微调模型
§ 测试服务运行状态
§ 评估服务性能
§ 使用大模型服务平台部署模型
§ 使用函数计算服务部署模型
§ 使用模型在线服务平台部署模型
§ 使用云服务器或容器服务部署模型
§ 云服务方案对比和决策推荐
针对投资研究部门的垂直领域应用,探讨如何部署面向投研场景的专用模型服务,包括模型选型、性能优化、成本控制等,确保投研系统的稳定性和专业性。
§ 模型的功能性需求:自然语言处理、视觉、语音、多模态任务,以及垂直领域的特殊需求
§ 模型的非功能性需求:性能、成本、稳定性
§ 系统性能提升:更快处理请求、减少大模型处理请求数和运算量、减少 Tokens 输入输出、并行化处理、不默认依赖大模型
§ 用户感知优化:流式输出、分块处理、展示任务进度、完善错误处理机制、提供用户反馈入口
§ 优化系统性能时节约成本
§ 云上部署成本优化:选择合适的 GPU 实例规格、选择合适的计费方式
§ 降低用户请求的资源消耗
§ 自动化扩缩容
§ 评测基线管理
§ 模型实时监控与预警
§ 容灾性设计
针对投资研究部门的垂直领域应用,探讨如何确保投研系统的性能、成本和稳定性,包括在金融数据高峰期如何保证系统响应速度,以及如何控制投研系统的运营成本。
§ 提示词注入攻击
§ 指令注入攻击
§ 数据投毒攻击
§ 对抗性攻击
§ 隐私泄露风险
§ 使用安全防护服务
§ 防护文本内容
§ 集中管理安全规则
§ 防护图像内容
§ 多种风险防护能力
针对投资研究部门的垂直领域应用,探讨如何确保投研系统的安全合规,包括敏感金融数据的保护、合规性检查、风险内容过滤等,确保投研建议符合监管要求。
§ 攻击大模型本身:训练数据中的风险
§ 攻击大模型的应用
§ 攻击大模型的基础设施