什么是 RAG
LLM 的局限性
大语言模型虽然能力强大,但存在三个根本性局限:
RAG(Retrieval-Augmented Generation,检索增强生成)的核心思路:在 LLM 回答问题之前,先从外部知识库中检索相关信息,然后让 LLM 基于检索到的事实来生成回答。
| 方式 | 原理 | 类比 |
|---|---|---|
| 纯 LLM | 模型凭记忆回答 | 开卷考试(但不一定对) |
| Fine-tuning | 重新训练模型 | 重新上课学习 |
| RAG | 检索资料后回答 | 开卷考试,先查资料再答题 |
2026/5/14大约 16 分钟
大语言模型虽然能力强大,但存在三个根本性局限:
RAG(Retrieval-Augmented Generation,检索增强生成)的核心思路:在 LLM 回答问题之前,先从外部知识库中检索相关信息,然后让 LLM 基于检索到的事实来生成回答。
| 方式 | 原理 | 类比 |
|---|---|---|
| 纯 LLM | 模型凭记忆回答 | 开卷考试(但不一定对) |
| Fine-tuning | 重新训练模型 | 重新上课学习 |
| RAG | 检索资料后回答 | 开卷考试,先查资料再答题 |