标签: 向量检索 | HSX BLOG

检索增强生成 RAG

什么是 RAG

LLM 的局限性

大语言模型虽然能力强大，但存在三个根本性局限：

RAG（Retrieval-Augmented Generation，检索增强生成）的核心思路：在 LLM 回答问题之前，先从外部知识库中检索相关信息，然后让 LLM 基于检索到的事实来生成回答。

方式	原理	类比
纯 LLM	模型凭记忆回答	开卷考试（但不一定对）
Fine-tuning	重新训练模型	重新上课学习
RAG	检索资料后回答	开卷考试，先查资料再答题

HSXISAWD2026/5/14大约 16 分钟