@llplmlyd
2026-03-27T06:32:58.000000Z
字数 309
阅读 0
大模型 AI
| 对比项 | RAG | 微调 |
|---|---|---|
| 应用场景 | 解决垂直领域知识问答的“幻觉”问题 | 解决风格化生成和垂域系统指令生成问题 |
| 技术能力要求 | 需要了解如何使用向量数据库 | 需要有较强的数据预处理能力 |
| 成本比较 | 部署和运维线上推理服务与向量数据库 | 微调训练成本,部署运维成本,需要专业技术人员操作 |
| 数据集准备 | 准备一份知识库文档即可 | 需要在知识库文档里提取高质量问答 |
| 最终输入大模型的token个数 | 需要将知识与问题拼接起来,输入大模型的tokens个数较多 | |
| 推理速度 | 经过检索、生成两个步骤,且向大模型输入较多token,推理速度相对较慢 | 直接推理,速度较快 |
| 知识更新的及时性 | 可以做到准实时,只需要及时地更新知识库中的文档 | 比RAG慢,微调训练需要花费较多时间 |
