Sözlük

RAG (retrieval-augmented generation) nedir?

RAG, yani retrieval-augmented generation, modelin önce kaynak metinden uygun parçaları getirip ardından bunlara dayanarak yanıt üreten bir AI yaklaşımıdır.

Sade bir büyük dil modeli, eğitim sırasında pekiştirilen bilgilere dayanır ve halüsinasyona meyillidir. RAG bunu bir retrieval (getirme) adımıyla çözer: bir soru geldiğinde sistem korpustan (kitap, PDF, bilgi tabanı) en uygun parçaları bulur, bunları modele bağlam olarak verir ve ancak ondan sonra yanıt istemesi söylenir.

Sonuç olarak yanıt belirli parçalara işaret eder ve modelin eğitim verisine değil kaynak metne bağlı kalır. Bu nedenle RAG, “belgeyle sohbet” özellikleri, yardım merkezinin üstüne kurulu destek botları ve kaynak göstermesi gereken AI arama motorları için standart hâline geldi.

Bir RAG sisteminin kalitesi üç şeye bağlıdır: kaynağın hangi parçalara bölündüğü (paragraf, bölüm, cümle), parçaların benzerliğe göre aranabilmesi için nasıl vektör olarak temsil edildiği ve modelin getirilen bağlamı nasıl kullanmaya öğretildiği. Üçünden birinin zayıflığı, dışarıdan iyi temellenmiş görünen ama özde yanlış yanıtlara yol açar.

Summio buraya nereden giriyor

Summio, özetteki veya sohbet yanıtındaki her iddiayı kitap, video transkripti, makale veya PDF içindeki belirli bir parçaya bağlamak için RAG kullanır. Motor parçayı gösteremezse iddia basılmaz. Kaynak sadakati politikası Summio’yu ciddi okuyucunun güvenine layık kılar.

Summio hakkında daha fazlası →

Sık sorulan sorular

RAG ile fine-tuning arasındaki fark nedir?

Fine-tuning yeni bilgiyi modelin ağırlıklarına “gömer” — yavaş, pahalı ve yalnızca yeniden eğitimle güncellenir. RAG ise modeli değiştirmez, her sorguda getirilen bağlamı değiştirir: bilgiyi güncellemek için belgeleri yeniden indekslemek yeterlidir, yeniden eğitim gerekmez.

RAG halüsinasyonu tamamen ortadan kaldırır mı?

Belirgin biçimde azaltır, tamamen ortadan kaldırmaz. Model getirilen parçayı yanlış okuyabilir, görmezden gelebilir ya da doğru parçalardan hatalı bir sentez kurabilir. Zorunlu alıntı politikası (parça yoksa yanıt yok) kalan farkın büyük kısmını kapatır.

RAG nerelerde kullanılır?

AI arama motorlarında (Perplexity, ChatGPT Search, web erişimli Claude), iç belgelerle sohbet uygulamalarında, yardım merkezi üzerine kurulu destek botlarında ve Summio gibi okuma uygulamalarında. Yanıtın belirli bir kaynağa demir atması gereken her yerde.