Mi az RAG (retrieval-augmented generation)?
A RAG, vagyis retrieval-augmented generation egy AI-megközelítés, amelyben a modell előbb a forrásszövegből releváns részleteket keres ki, és csak ezután generál választ, amely ezekre épül.
Egy egyszerű nagy nyelvi modell a tanulás során rögzített tudásra támaszkodik, és hajlamos hallucinálni. A RAG ezt egy lekérési lépéssel oldja meg: amikor kérdés érkezik, a rendszer megkeresi a korpusz (könyv, PDF, tudásbázis) leginkább odaillő részleteit, kontextusként átadja a modellnek, és csak ezután kéri, hogy válaszoljon.
Az eredmény: a válasz konkrét részletekre mutat, és a forrásszöveghez marad horgonyozva a modell tanulóadatai helyett. Ezért lett a RAG sztenderd a „chatelj a dokumentumoddal” funkcióknál, a help bázis fölé épített támogatási botoknál és az olyan AI-keresőknél, amelyeknek meg kell jelölniük a forrásokat.
Egy RAG-rendszer minősége három dologon múlik: hogyan tagolódik a forrás részletekre (bekezdés, szakasz, mondat), hogyan ábrázolják a részleteket vektorként hasonlóság alapú kereséshez, és hogyan tanították a modellt a lehívott kontextus használatára. A három közül bármelyik gyengesége kifelé megalapozottnak tűnő, de érdemben hibás válaszokat eredményez.
A Summio a RAG-ot használja, hogy az összefoglaló vagy a chatválasz minden állítását egy könyv, videofelirat, cikk vagy PDF konkrét bekezdéséhez kösse. Ha a motor nem tudja idézni a bekezdést, az állítás nem jelenik meg. A forráshűségi szabály miatt érdemli ki a Summio a komoly olvasó bizalmát.
Tudj meg többet a Summióról →Gyakori kérdések
Mi a különbség a RAG és a fine-tuning között?
A fine-tuning új tudást „süt bele” a modell súlyaiba — lassú, drága, és csak újratanítással frissül. A RAG érintetlenül hagyja a modellt, és lekérdezésenként cseréli a lehívott kontextust: a tudás frissítése a dokumentumok újraindexelését jelenti, nem újratanítást.
Teljesen megszünteti a RAG a hallucinációkat?
Jelentősen csökkenti, de nem szünteti meg teljesen. A modell félreolvashatja a lekért részletet, figyelmen kívül hagyhatja, vagy helyes részletekből hibás szintézist építhet. A kötelező idézet szabálya (nincs részlet — nincs válasz) bezárja a fennmaradó rés nagy részét.
Hol használják a RAG-ot?
AI-keresőkben (Perplexity, ChatGPT Search, webhozzáféréses Claude), belső dokumentumokkal való chatben, help bázisra épülő támogatási botokban és olyan olvasóappokban, mint a Summio. Mindenhol, ahol a válasznak konkrét forráshoz kell horgonyzottnak lennie.
