什么是 RAG？- 题目详情 - 前端面试题宝典

RAG 是 Retrieval-Augmented Generation，检索增强生成。它的核心思路是：不要只依赖大模型自身参数里的知识，而是在回答问题前，先从外部知识库、文档、数据库、搜索引擎或业务系统中检索相关内容，再把检索结果作为上下文交给大模型生成答案。

一个典型 RAG 流程通常分成两部分。

前置阶段会把文档切分成较小的 chunk，然后通过 embedding 模型转成向量，存入向量数据库或搜索引擎中。用户提问时，系统会把问题也转成向量，再去知识库中找语义最相近的内容。检索到相关片段后，再把这些片段和用户问题一起拼进 prompt，让大模型基于这些上下文进行回答。

RAG 的价值在于，它可以让大模型使用 外部、私有、实时更新的知识。比如企业内部文档、产品手册、代码规范、客服知识库，这些内容大模型本身未必知道，也不适合每次都通过微调来更新。RAG 可以降低幻觉，提高答案可追溯性，并且成本通常比微调更低。

不过 RAG 的效果不只取决于大模型，还很依赖检索质量。文档切分是否合理、embedding 是否准确、召回结果是否相关、是否需要 rerank、权限过滤是否正确，都会直接影响最终答案。如果检索结果不准，大模型可能会基于错误上下文生成看起来很合理但实际不对的答案。

从前端应用角度看，RAG 常见于智能客服、知识库问答、代码助手、BI 问答、企业搜索等场景。前端除了展示生成结果，还应该考虑来源引用、流式输出、检索中状态、无答案兜底、权限隔离和用户反馈，这些都会影响 RAG 产品的可信度和可用性。

问答题【101/1907】什么是 RAG？