Ordliste

Hvad er RAG (retrieval-augmented generation)?

RAG, eller retrieval-augmented generation, er en AI-tilgang, hvor modellen først henter relevante passager fra en kildetekst og dernæst genererer et svar baseret på dem.

En almindelig stor sprogmodel læner sig op ad viden, der er etableret under træning, og er tilbøjelig til at hallucinere. RAG løser dette med et hentningstrin: når et spørgsmål kommer, finder systemet de mest relevante passager i korpusset (bog, PDF, vidensbase), sender dem som kontekst til modellen og beder først derefter om et svar.

Resultatet: svaret peger på konkrete passager og forbliver forankret i kildeteksten frem for i modellens træningsdata. Derfor er RAG blevet standard for ”chat med dit dokument”-funktioner, supportbots oven på en hjælpebase og AI-søgemaskiner, der skal angive kilder.

Kvaliteten af et RAG-system afhænger af tre ting: hvordan kilden opdeles i passager (afsnit, sektion, sætning), hvordan passager repræsenteres som vektorer til lighedssøgning, og hvordan modellen er trænet i at bruge den hentede kontekst. En svaghed i en af de tre fører til svar, der udadtil virker funderede, men er forkerte i substans.

Her passer Summio ind

Summio bruger RAG til at koble hvert udsagn i et resumé eller chatsvar til en specifik passage i en bog, et videotransskription, en artikel eller en PDF. Kan motoren ikke citere passagen, trykkes udsagnet ikke. Kildetroskabspolitikken gør Summio den seriøse læsers tillid værdig.

Læs mere om Summio →

Ofte stillede spørgsmål

Hvad er forskellen mellem RAG og fine-tuning?

Fine-tuning ”indlejrer” ny viden i modellens vægte — langsomt, dyrt og opdateres kun ved gentræning. RAG lader modellen være og ændrer den hentede kontekst pr. forespørgsel: at opdatere viden betyder at genindeksere dokumenter, ikke at gentræne.

Fjerner RAG hallucinationer fuldstændigt?

Den reducerer dem markant, men eliminerer dem ikke helt. Modellen kan misforstå en hentet passage, ignorere den eller bygge en forkert syntese af korrekte passager. En politik om obligatoriske citater (ingen passage — intet svar) lukker det meste af det resterende hul.

Hvor bruges RAG?

I AI-søgemaskiner (Perplexity, ChatGPT Search, Claude med webadgang), i chats med interne dokumenter, i supportbots oven på en hjælpebase og i læseapps som Summio. Alle steder, hvor et svar skal være forankret i en specifik kilde.