什么是 RAG
LLM 的局限性
大语言模型虽然能力强大,但存在三个根本性局限:
RAG(Retrieval-Augmented Generation,检索增强生成)的核心思路:在 LLM 回答问题之前,先从外部知识库中检索相关信息,然后让 LLM 基于检索到的事实来生成回答。
| 方式 | 原理 | 类比 |
|---|---|---|
| 纯 LLM | 模型凭记忆回答 | 开卷考试(但不一定对) |
| Fine-tuning | 重新训练模型 | 重新上课学习 |
| RAG | 检索资料后回答 | 开卷考试,先查资料再答题 |
2026/5/14大约 16 分钟
大语言模型虽然能力强大,但存在三个根本性局限:
RAG(Retrieval-Augmented Generation,检索增强生成)的核心思路:在 LLM 回答问题之前,先从外部知识库中检索相关信息,然后让 LLM 基于检索到的事实来生成回答。
| 方式 | 原理 | 类比 |
|---|---|---|
| 纯 LLM | 模型凭记忆回答 | 开卷考试(但不一定对) |
| Fine-tuning | 重新训练模型 | 重新上课学习 |
| RAG | 检索资料后回答 | 开卷考试,先查资料再答题 |
经过前面八个章节的学习,我们已经掌握了 LangChain 的核心概念、模型调用、提示词工程、输出解析、文档加载、向量存储、链式调用(LCEL)、记忆机制、检索增强生成(RAG)以及 Agent 智能代理等关键技能。本章将把这些知识融会贯通,从零构建一个完整的 智能知识库助手(Smart Knowledge Base Assistant)项目。
构建一个基于 RAG + Agent 架构的智能知识库助手,具备以下核心能力: