Ordliste

Hva er RAG (retrieval-augmented generation)?

RAG, eller retrieval-augmented generation, er en AI-tilnærming hvor modellen først henter relevante passasjer fra en kildetekst og deretter genererer et svar som hviler på dem.

En vanlig stor språkmodell lener seg på kunnskap etablert under trening og er tilbøyelig til å hallusinere. RAG løser dette med et hentingstrinn: når et spørsmål kommer, finner systemet de mest relevante passasjene i korpuset (bok, PDF, kunnskapsbase), sender dem som kontekst til modellen og ber først deretter om et svar.

Resultatet: svaret peker til spesifikke passasjer og forblir forankret i kildeteksten i stedet for i modellens treningsdata. Derfor har RAG blitt standard for «chat med dokumentet»-funksjoner, supportbotter oppå en hjelpebase og AI-søkemotorer som må sitere kilder.

Kvaliteten på et RAG-system avhenger av tre ting: hvordan kilden deles i passasjer (avsnitt, seksjon, setning), hvordan passasjer representeres som vektorer for likhetsbasert søk, og hvordan modellen er lært å bruke den hentede konteksten. En svakhet i én av de tre gir svar som utad virker forankret, men i substans er feil.

Her passer Summio inn

Summio bruker RAG til å koble hvert utsagn i et sammendrag eller chatsvar til en spesifikk passasje i en bok, et videotransskript, en artikkel eller en PDF. Hvis motoren ikke kan sitere passasjen, blir utsagnet ikke skrevet. Kildetroskapspolitikken gjør Summio tilliten verdt for den seriøse leseren.

Les mer om Summio →

Vanlige spørsmål

Hva er forskjellen mellom RAG og fine-tuning?

Fine-tuning «baker inn» ny kunnskap i modellens vekter — tregt, dyrt og oppdateres bare ved retrening. RAG lar modellen være og endrer den hentede konteksten per forespørsel: å oppdatere kunnskap betyr å reindeksere dokumenter, ikke å retrene noe.

Fjerner RAG hallusinasjoner helt?

Det reduserer dem betydelig, men eliminerer dem ikke fullt ut. Modellen kan mislese en hentet passasje, ignorere den eller bygge en feil syntese fra korrekte passasjer. En politikk om obligatoriske sitater (ingen passasje — intet svar) lukker det meste av det som er igjen.

Hvor brukes RAG?

I AI-søkemotorer (Perplexity, ChatGPT Search, Claude med nettilgang), i chat med interne dokumenter, i supportbotter oppå en hjelpebase og i leseapper som Summio. Overalt hvor et svar må være forankret i en spesifikk kilde.