Woordenlijst

Wat is RAG (retrieval-augmented generation)?

RAG, oftewel retrieval-augmented generation, is een AI-aanpak waarbij het model eerst relevante stukken uit een brontekst ophaalt en pas daarna een antwoord genereert dat daarop steunt.

Een gewoon groot taalmodel leunt op kennis die tijdens training is verankerd en is gevoelig voor hallucinaties. RAG lost dit op met een retrieval-stap: bij een vraag haalt het systeem de meest relevante stukken uit het corpus (boek, PDF, kennisbank), geeft ze als context aan het model en vraagt pas dán om een antwoord.

Het resultaat: het antwoord verwijst naar concrete passages en blijft verankerd in de brontekst in plaats van de trainingsdata. Daarom is RAG standaard geworden voor “chat met je document”-functies, supportbots boven een helpbase en AI-zoekmachines die hun bronnen moeten noemen.

De kwaliteit van een RAG-systeem hangt af van drie dingen: hoe de bron in stukken wordt verdeeld (alinea, sectie, zin), hoe stukken als vector worden weergegeven voor zoeken op gelijkenis, en hoe het model is geleerd de opgehaalde context te gebruiken. Een zwakte in een van de drie leidt tot antwoorden die extern goed onderbouwd lijken maar inhoudelijk fout zijn.

Waar Summio inpast

Summio gebruikt RAG om elke bewering in een samenvatting of chatantwoord te verbinden met een specifieke passage in een boek, videotranscript, artikel of PDF. Kan de motor de passage niet aanhalen, dan verschijnt de bewering niet. Het bronvasthoud-beleid maakt Summio het vertrouwen van een serieuze lezer waard.

Meer weten over Summio →

Veelgestelde vragen

Wat is het verschil tussen RAG en fine-tuning?

Fine-tuning “bakt” nieuwe kennis in de gewichten van het model — traag, duur en alleen via opnieuw trainen te updaten. RAG laat het model met rust en verandert de opgehaalde context per query: kennis bijwerken betekent documenten herindexeren, zonder opnieuw te trainen.

Schakelt RAG hallucinaties helemaal uit?

Het vermindert ze aanzienlijk maar elimineert ze niet volledig. Het model kan een opgehaald fragment verkeerd lezen, negeren of een verkeerde synthese maken van correcte fragmenten. Een verplicht-citaat-beleid (geen fragment, geen antwoord) sluit het grootste deel van het resterende gat.

Waar wordt RAG gebruikt?

In AI-zoekmachines (Perplexity, ChatGPT Search, Claude met webtoegang), in chats met interne documenten, in supportbots op een helpbase en in leesapps zoals Summio. Overal waar een antwoord verankerd moet zijn in een specifieke bron.