용어집

RAG (검색 증강 생성)란 무엇인가요?

RAG, 즉 검색 증강 생성은 AI 모델이 답을 만들기 전에 먼저 원문에서 관련 구절을 찾아내고, 그 구절을 근거로 답하도록 하는 방식입니다.

평범한 대규모 언어 모델은 학습 데이터를 바탕으로 답합니다. 그런데 학습 시점에 고정된 지식만 갖고 있고, 사실을 지어내는 환각 현상도 일으킵니다. RAG는 여기에 검색 단계를 더해 이를 보완합니다 — 사용자의 질문이 들어오면 시스템은 코퍼스(책, PDF, 지식 베이스)에서 가장 관련 깊은 구절을 찾고, 그것을 맥락으로 모델에 건넨 뒤에야 답을 부탁합니다.

그 결과 답은 특정 구절을 인용하고, 모델의 학습이 아니라 원문에 묶입니다. 그래서 RAG는 “내 문서와 채팅” 기능, 헬프센터 위의 고객 지원 봇, 출처를 명시해야 하는 AI 검색 엔진의 표준 패턴이 됐습니다.

RAG의 품질은 세 가지에 달려 있습니다 — 원문을 어떻게 쪼개는지(문단·절·문장), 그 조각을 유사도 검색을 위해 어떻게 임베딩하는지, 그리고 모델에게 찾은 맥락을 어떻게 쓰라고 지시하는지. 셋 중 하나라도 약하면, 형식상으로는 출처에 묶여 있어도 사실은 틀린 답이 나옵니다.

Summio의 자리

Summio는 요약이나 챗 응답의 모든 주장을 책 · 동영상 자막 · 기사 · PDF 속 특정 구절로 묶어 두기 위해 RAG를 씁니다. 엔진이 인용할 구절을 못 찾으면 주장 자체를 출력하지 않습니다 — 이 원전 결착 원칙이, Summio를 진지한 독서에 쓸 수 있게 만드는 핵심입니다.

Summio에 대해 더 알아보기 →

자주 묻는 질문

RAG는 파인튜닝과 어떻게 다른가요?

파인튜닝은 새 지식을 모델 가중치에 새깁니다 — 느리고 비싸며, 재학습 외에는 갱신할 방법이 없습니다. RAG는 모델을 그대로 두고 질의마다 가져오는 맥락만 바꿉니다. 지식을 갱신한다는 건 문서를 다시 색인한다는 뜻이지, 모델을 다시 학습한다는 뜻이 아닙니다.

RAG가 환각을 없애 주나요?

크게 줄여 주지만 완전히 없애지는 못합니다. 모델은 가져온 구절을 잘못 읽거나, 무시하거나, 옳은 조각을 이어 잘못된 종합을 만들 수도 있습니다. “근거 구절이 없으면 답하지 않는다”는 인용 의무 정책이 남는 틈의 상당 부분을 메워 줍니다.

RAG는 어디에 쓰이나요?

AI 검색 엔진(Perplexity, ChatGPT search, 웹 접근이 가능한 Claude), 내부 문서와의 채팅, 헬프센터 위의 고객 지원 봇, 그리고 Summio 같은 독서 앱. 답이 특정 출처에 묶여야 하는 모든 자리에 쓰입니다.