Co je RAG (retrieval-augmented generation)?
RAG, neboli retrieval-augmented generation, je AI přístup, ve kterém model nejprve vyhledá relevantní pasáže ve zdrojovém textu a teprve poté generuje odpověď opřenou o ně.
Běžný velký jazykový model se opírá o znalosti zafixované při tréninku a je náchylný k halucinacím. RAG to řeší krokem vyhledávání: po dotazu systém najde v korpusu (kniha, PDF, znalostní báze) nejvhodnější pasáže, předá je modelu jako kontext a teprve potom ho vyzve k odpovědi.
Výsledek: odpověď ukazuje na konkrétní pasáže a zůstává ukotvená ve zdrojovém textu místo v trénovacích datech modelu. Proto se RAG stal standardem pro funkce „chatuj se svým dokumentem“, podpůrné boty postavené nad bázi nápovědy a AI vyhledávače, které musí uvádět zdroje.
Kvalita RAG systému závisí na třech věcech: jak je zdroj rozdělen na pasáže (odstavec, sekce, věta), jak jsou pasáže reprezentovány jako vektory pro vyhledávání podobnosti a jak je model naučen pracovat s vyhledaným kontextem. Slabina v kterékoli ze tří částí vede k odpovědím, které navenek vypadají podložené, ale jsou věcně chybné.
Summio používá RAG, aby každé tvrzení v souhrnu nebo chatové odpovědi propojilo s konkrétní pasáží v knize, přepisu videa, článku nebo PDF. Pokud motor pasáž nedoloží, tvrzení se nevytiskne. Politika věrnosti zdroji dělá ze Summia partnera hodného důvěry vážného čtenáře.
Více o Summiu →Časté dotazy
Jaký je rozdíl mezi RAG a fine-tuningem?
Fine-tuning „zaformuje“ nové znalosti do vah modelu — pomalu, draho a aktualizuje se jen dotrénováním. RAG model nemění a mění jen kontext stažený pro každý dotaz: aktualizace znalostí znamená přeindexování dokumentů, nikoli další trénink.
Odstraňuje RAG halucinace úplně?
Výrazně je snižuje, ale neodstraňuje úplně. Model může načtenou pasáž špatně přečíst, ignorovat ji nebo z dobrých pasáží sestavit chybnou syntézu. Politika povinných citací (žádná pasáž — žádná odpověď) uzavírá většinu zbývající mezery.
Kde se RAG používá?
V AI vyhledávačích (Perplexity, ChatGPT Search, Claude s přístupem na web), v chatu nad interními dokumenty, v podpůrných botech nad bází nápovědy a v čtecích aplikacích jako Summio. Všude, kde odpověď musí být ukotvena v konkrétním zdroji.
