标签: RAG

什么是 RAG

LLM 的局限性

大语言模型虽然能力强大，但存在三个根本性局限：

RAG（Retrieval-Augmented Generation，检索增强生成）的核心思路：在 LLM 回答问题之前，先从外部知识库中检索相关信息，然后让 LLM 基于检索到的事实来生成回答。

方式	原理	类比
纯 LLM	模型凭记忆回答	开卷考试（但不一定对）
Fine-tuning	重新训练模型	重新上课学习
RAG	检索资料后回答	开卷考试，先查资料再答题

HSXISAWD2026/5/14大约 16 分钟

LangChain 项目实战

项目概述

经过前面八个章节的学习，我们已经掌握了 LangChain 的核心概念、模型调用、提示词工程、输出解析、文档加载、向量存储、链式调用（LCEL）、记忆机制、检索增强生成（RAG）以及 Agent 智能代理等关键技能。本章将把这些知识融会贯通，从零构建一个完整的 智能知识库助手（Smart Knowledge Base Assistant）项目。

项目目标

构建一个基于 RAG + Agent 架构的智能知识库助手，具备以下核心能力：

文档导入：支持 PDF、Markdown、TXT 等格式的文档批量导入与自动解析
智能问答：基于私有文档进行精准问答，并提供来源引用
主题摘要：自动提取文档主题并生成摘要
多轮对话：支持上下文关联的多轮对话，具备记忆能力
工具调用：Agent 可自主选择工具完成任务
流式响应：通过 API 提供 Server-Sent Events（SSE）流式输出

HSXISAWD2026/5/14大约 29 分钟