问答题100/1884什么是 RAG?

难度:
2026-06-08 创建

参考答案:

RAG 是 Retrieval-Augmented Generation,检索增强生成。它的核心思路是:不要只依赖大模型自身参数里的知识,而是在回答问题前,先从外部知识库、文档、数据库、搜索引擎或业务系统中检索相关内容,再把检索结果作为上下文交给大模型生成答案。

一个典型 RAG 流程通常分成两部分。

前置阶段会把文档切分成较小的 chunk,然后通过 embedding 模型转成向量,存入向量数据库或搜索引擎中。用户提问时,系统会把问题也转成向量,再去知识库中找语义最相近的内容。检索到相关片段后,再把这些片段和用户问题一起拼进 prompt,让大模型基于这些上下文进行回答。

RAG 的价值在于,它可以让大模型使用 外部、私有、实时更新的知识。比如企业内部文档、产品手册、代码规范、客服知识库,这些内容大模型本身未必知道,也不适合每次都通过微调来更新。RAG 可以降低幻觉,提高答案可追溯性,并且成本通常比微调更低。

不过 RAG 的效果不只取决于大模型,还很依赖检索质量。文档切分是否合理、embedding 是否准确、召回结果是否相关、是否需要 rerank、权限过滤是否正确,都会直接影响最终答案。如果检索结果不准,大模型可能会基于错误上下文生成看起来很合理但实际不对的答案。

从前端应用角度看,RAG 常见于智能客服、知识库问答、代码助手、BI 问答、企业搜索等场景。前端除了展示生成结果,还应该考虑来源引用、流式输出、检索中状态、无答案兜底、权限隔离和用户反馈,这些都会影响 RAG 产品的可信度和可用性。

最近更新时间:2026-06-29

赞赏支持

题库维护不易,您的支持就是我们最大的动力!