什麼是RAG(檢索增強生成)?
RAG,全名為檢索增強生成,是一種 AI 模式:模型在作答前,先從來源文件裡檢索出相關段落,再依據這些段落生成答案,將回答錨定在原文上。
一般大型語言模型只能依據訓練資料作答,而訓練資料在訓練當下就被凍結了,也容易產生幻覺。RAG 透過加一個檢索步驟來修正這點:使用者提問時,系統先到語料庫(一本書、一份 PDF、一份知識庫)裡找出最相關的段落,把這些段落當成情境交給模型,然後才請它回答。
結果是答案會引用具體段落,並受原文(而非模型訓練)所約束。也因此 RAG 成為「與你的文件對話」、客服中心之上的支援機器人、需要為論述標註出處的 AI 搜尋引擎的標準模式。
RAG 的品質取決於三件事:來源如何被切塊(依段、依節還是依句)、切塊如何被嵌入以做相似度檢索,以及如何指示模型使用檢索到的情境。三者只要有一處薄弱,就會得到形式上有出處、實際上錯誤的答覆。
Summio 用 RAG 把摘要與聊天回應裡的每一句話,都綁回書、影片逐字稿、文章或 PDF 中的具體段落。引擎找不到對應段落,這句話就不會被印出來——正是這套以原文為準的政策,讓 Summio 經得起認真的閱讀。
了解更多 Summio →常見問題
RAG 和微調有什麼不同?
微調是把新知識刻進模型權重,慢、貴,且只能靠重新訓練更新。RAG 讓模型保持原狀,按每次查詢更換檢索到的情境:要更新知識就重建文件索引,完全不必重新訓練模型。
RAG 能消除幻覺嗎?
能大幅減少,卻無法消除。模型仍可能誤讀檢索到的段落、忽略它,或把正確片段拼成錯誤的綜合。「沒有支持段落就拒答」這類強制引用政策,能補上剩下的大半。
RAG 用在哪裡?
AI 搜尋引擎(Perplexity、ChatGPT search、可連網的 Claude)、企業內部文件對話、客服中心之上的支援機器人,以及像 Summio 這樣的閱讀型應用——任何答案必須可追溯到具體來源的地方。
