Summio

术语表

什么是RAG(检索增强生成)?

RAG,全称检索增强生成,是一种 AI 模式:模型在作答前先从源文档中检索出相关段落,然后基于这些段落生成答案,把回答锚定在原文里。

普通大模型只会按训练数据回答,而训练数据在训练那一刻就被冻结了,且容易产生幻觉。RAG 通过加一个检索步骤来纠正这一点:用户提问时,系统先在语料库(一本书、一份 PDF、一份知识库)中找出最相关的段落,把这些段落作为上下文交给大模型,然后才让它回答。

由此得到的答案会引用具体段落,并被原文(而不是模型的训练记忆)所约束。所以 RAG 成为「与你的文档对话」、帮助中心之上的客服机器人、需要给结论标注来源的 AI 搜索引擎的标准模式。

RAG 的质量取决于三件事:原文如何切块(按段、按节还是按句)、切块如何嵌入以做相似度检索、以及如何提示模型使用检索到的上下文。这三个环节只要有一处薄弱,就会得到形式上有出处、实际却错误的答案。

Summio 的位置

Summio 用 RAG 把摘要和聊天回应里的每一句话都绑回到书、视频转录、文章或 PDF 中的具体段落。引擎引不到段落就不会输出这一句——正是这套以原文为准的策略,让 Summio 经得起认真阅读。

了解更多关于 Summio →

常见问题

RAG 和微调有什么区别?

微调是把新知识烙进模型权重,慢、贵,更新只能靠重新训练。RAG 让模型保持不动,按每次查询变更检索到的上下文:更新知识只是重建文档索引,根本不用重新训练模型。

RAG 能根除幻觉吗?

能显著降低,但不能根除。模型仍可能把检索到的段落看错、忽略它,或者把几段正确内容拼成错误的综合。强制引用策略(没有支持段落就不回答)能补上剩下的大半。

RAG 用在什么场景?

用于 AI 搜索引擎(Perplexity、ChatGPT 搜索、带联网的 Claude)、企业内部文档对话、帮助中心之上的客服机器人,以及像 Summio 这样的阅读类应用——任何答案必须可以追溯到具体来源的地方。