Glosaryo

Ano ang RAG (retrieval-augmented generation)?

Ang RAG, o retrieval-augmented generation, ay isang AI approach kung saan unang kinukuha ng modelo ang mga kaugnay na bahagi ng source text bago bumuo ng sagot na nakasalig sa mga ito.

Ang ordinaryong large language model ay umaasa sa kaalamang naitanim sa panahon ng training at madaling mag-halusinate. Nilulutas ito ng RAG sa pamamagitan ng hakbang sa retrieval: kapag may tanong, hinahanap ng sistema ang pinaka-kaugnay na bahagi sa corpus (libro, PDF, knowledge base), ipinapasa ito bilang konteksto sa modelo, at saka pa lamang hinihiling ang sagot.

Resulta: tumuturo ang sagot sa mga partikular na bahagi at nananatiling naka-anchor sa teksto ng pinagmulan sa halip na sa training data ng modelo. Kaya naging standard ang RAG para sa mga "chat with your document" features, support bots sa ibabaw ng help base, at AI search engines na kailangang magbanggit ng pinagmulan.

Ang kalidad ng RAG system ay nakadepende sa tatlong bagay: kung paano hinahati ang source sa mga bahagi (talata, seksyon, pangungusap), paano kinakatawan ang mga bahagi bilang vector para sa similarity search, at kung paano sinanay ang modelo na gumamit ng kinuhang konteksto. Kahinaan sa kahit alin sa tatlo ay nagdudulot ng sagot na mukhang nakaangkla sa labas ngunit mali sa nilalaman.

Saan papasok ang Summio

Ginagamit ng Summio ang RAG para iugnay ang bawat pahayag sa buod o chat reply sa isang partikular na bahagi sa libro, video transcript, artikulo, o PDF. Kung hindi maibibigay ng makina ang bahagi, hindi pi-print ang pahayag. Ang source-fidelity policy ang nagiging dahilan upang maging karapat-dapat ang Summio sa tiwala ng seryosong mambabasa.

Alamin pa ang tungkol sa Summio →

Madalas itanong

Ano ang pagkakaiba ng RAG at fine-tuning?

Inilalagay ng fine-tuning ang bagong kaalaman sa weights ng modelo — mabagal, mahal, at na-update lang sa retraining. Iniiwan ng RAG ang modelo at binabago ang kinukuhang konteksto kada query: ang pag-update ng kaalaman ay pag-reindex ng mga dokumento, hindi muling pagsasanay.

Tinatanggal ba ng RAG ang halusinasyon nang lubos?

Malaki ang ibinabawas, ngunit hindi nito tinatanggal nang lubos. Maaaring maling basahin ng modelo ang nakuhang bahagi, balewalain ito, o bumuo ng maling synthesis mula sa tamang mga bahagi. Sinasara ng mandatoryong sipi policy (walang bahagi — walang sagot) ang malaking bahagi ng natitirang gap.

Saan ginagamit ang RAG?

Sa mga AI search engine (Perplexity, ChatGPT Search, Claude na may web access), sa chat kasama ang internal documents, sa support bots sa ibabaw ng help base, at sa reading apps tulad ng Summio. Saanmang kailangan na nakaangkla ang sagot sa partikular na pinagmulan.