Ordlista

Vad är RAG (retrieval-augmented generation)?

RAG, eller retrieval-augmented generation, är en AI-metod där modellen först hämtar relevanta passager ur en källtext och därefter genererar ett svar som vilar på dem.

En vanlig stor språkmodell lutar sig mot den kunskap som etablerats under träningen och har en tendens att hallucinera. RAG löser detta med ett hämtningssteg: när en fråga kommer in plockar systemet de mest relevanta passagerna ur korpusen (bok, PDF, kunskapsbas), skickar dem som kontext till modellen och först därefter ombeds modellen att svara.

Resultatet: svaret pekar på specifika passager och förblir förankrat i källtexten i stället för i modellens träningsdata. Därför har RAG blivit standard för funktioner som ”chatta med ditt dokument”, supportbottar ovanpå en hjälpbas och AI-sökmotorer som måste ange källor.

Kvaliteten på ett RAG-system beror på tre saker: hur källan delas i passager (stycke, sektion, mening), hur passager representeras som vektorer för likhetssökning och hur modellen är tränad att använda den hämtade kontexten. Brister i något av de tre ger svar som utåt ser välgrundade ut men i sak är fel.

Här kommer Summio in

Summio använder RAG för att koppla varje påstående i en sammanfattning eller chattsvar till en specifik passage i en bok, ett videotranskript, en artikel eller en PDF. Kan motorn inte citera passagen trycks påståendet inte. Källtrohetspolicyn gör Summio värd den seriösa läsarens förtroende.

Läs mer om Summio →

Vanliga frågor

Vad är skillnaden mellan RAG och fine-tuning?

Fine-tuning ”bakar in” ny kunskap i modellens vikter — långsamt, dyrt och uppdateras bara med ny träning. RAG lämnar modellen orörd och ändrar den hämtade kontexten per fråga: att uppdatera kunskap innebär att indexera om dokument, inte att träna om något.

Eliminerar RAG hallucinationer helt?

Det minskar dem markant men eliminerar inte helt. Modellen kan misstolka en hämtad passage, ignorera den eller bygga en felaktig syntes av korrekta passager. En policy om obligatoriska citat (ingen passage — inget svar) täcker det mesta av det som återstår.

Var används RAG?

I AI-sökmotorer (Perplexity, ChatGPT Search, Claude med webbåtkomst), i ”chatta med interna dokument”, i supportbottar ovanpå en hjälpbas och i läsappar som Summio. Överallt där ett svar måste vara förankrat i en specifik källa.