Summio

Glosari

Apakah RAG (retrieval-augmented generation)?

RAG, atau retrieval-augmented generation, adalah pendekatan AI di mana model mula-mula mengambil petikan yang relevan daripada teks sumber sebelum menjana jawapan yang bersandar padanya.

Model bahasa besar biasa bersandar pada pengetahuan yang ditanam semasa latihan dan terdedah kepada halusinasi. RAG mengatasi ini dengan langkah pengambilan: apabila soalan tiba, sistem mencari petikan paling relevan dalam korpus (buku, PDF, pangkalan pengetahuan), menghantarnya sebagai konteks kepada model, dan barulah meminta jawapan.

Hasilnya: jawapan menunjuk petikan tertentu dan kekal berlabuh pada teks sumber dan bukan data latihan model. Sebab itu RAG menjadi piawai untuk ciri "berbual dengan dokumen anda", bot sokongan di atas pusat bantuan, dan enjin carian AI yang perlu menyatakan sumber.

Kualiti sistem RAG bergantung kepada tiga perkara: bagaimana sumber dipecahkan kepada petikan (perenggan, seksyen, ayat), bagaimana petikan diwakili sebagai vektor untuk carian persamaan, dan bagaimana model dilatih menggunakan konteks yang diambil. Kelemahan dalam salah satu menghasilkan jawapan yang kelihatan beralasan tetapi sebenarnya salah dari segi isi.

Di mana Summio sesuai

Summio menggunakan RAG untuk mengaitkan setiap pernyataan dalam ringkasan atau jawapan sembang dengan petikan tertentu dalam buku, transkrip video, artikel atau PDF. Jika enjin tidak boleh memetik petikan tersebut, pernyataan itu tidak dicetak. Polisi kesetiaan kepada sumber menjadikan Summio layak mendapat kepercayaan pembaca yang serius.

Ketahui lebih lanjut tentang Summio →

Soalan lazim

Apakah perbezaan antara RAG dan fine-tuning?

Fine-tuning "membakar" pengetahuan baharu ke dalam pemberat model — perlahan, mahal, dan hanya dikemas kini melalui latihan semula. RAG membiarkan model utuh dan menukar konteks yang diambil bagi setiap pertanyaan: mengemas kini pengetahuan bermakna mengindeks semula dokumen, bukan melatih semula.

Adakah RAG menghapus halusinasi sepenuhnya?

Ia mengurangkan dengan ketara tetapi tidak menghapus sepenuhnya. Model boleh tersilap baca petikan yang diambil, mengabaikannya, atau membina sintesis yang salah daripada petikan yang betul. Polisi petikan wajib (tiada petikan — tiada jawapan) menutup sebahagian besar jurang yang tinggal.

Di mana RAG digunakan?

Dalam enjin carian AI (Perplexity, ChatGPT Search, Claude dengan akses web), dalam sembang dokumen dalaman, dalam bot sokongan di atas pusat bantuan, dan dalam aplikasi membaca seperti Summio. Di mana sahaja jawapan perlu dilabuh pada sumber tertentu.