用語集

RAG(検索拡張生成)とは?

RAG(検索拡張生成)とは、AIモデルが解答を生成する前に、まずソース文書から関連する箇所を検索して取り出し、その箇所に基づいて答える方式のことです。

通常の大規模言語モデルは学習データから答えるため、学習時点に固定された知識しか持たず、ハルシネーションを起こしがちです。RAGはここに検索ステップを足して問題を緩和します。ユーザーから質問が来ると、システムはコーパス(書籍、PDF、ナレッジベース)から最も関連性の高い箇所を探し出し、それをコンテキストとしてモデルに渡し、そのうえで初めて答えるよう指示します。

結果として、答えは具体的な箇所を引用し、モデルの学習内容ではなくソースの内容に縛られます。だからこそRAGは「あなたの文書と対話する」機能、ヘルプセンターに繋いだサポートボット、引用が必要なAI検索エンジンといった用途の標準パターンになっています。

RAGの品質は三つに依存します——ソースをどう刻むか(段落・節・文)、刻んだ断片を類似検索のためにどう埋め込むか、そしてモデルに取得済みコンテキストの使い方をどう指示するか。どこか一つでも弱いと、形のうえでは出典に紐づいていても実質的には誤った答えが出ます。

Summioの位置づけ

Summioは要約やチャットでのすべての主張を、書籍・動画の書き起こし・記事・PDFの具体的な箇所へ結びつけるためにRAGを使います。エンジンが該当箇所を引けない主張は印字しません——この原典依拠ポリシーが、Summioを本気の読書に耐えうるものにしています。

Summioについてもっと読む →

よくある質問

RAGはファインチューニングとどう違いますか?

ファインチューニングは新しい知識をモデルの重みに焼き付けます——遅く、高価で、再学習しないと更新できません。RAGはモデルを凍結したまま、クエリごとに取り出すコンテキストを変えます。知識を更新するには文書を再インデックスするだけで、モデルの再学習は不要です。

RAGはハルシネーションを根絶しますか?

大幅に減らしますが、根絶はしません。モデルは取り出した箇所を読み違える、無視する、あるいは正しい断片同士を間違って統合することがあります。「裏付けの箇所が無い主張には答えない」という引用必須のポリシーが、残ったずれの多くを埋めます。

RAGはどこで使われていますか?

AI検索エンジン(Perplexity、ChatGPT search、ウェブアクセス付きのClaude)、社内ドキュメントとのチャット、ヘルプセンター上のサポートボット、そしてSummioのような読書アプリ。回答が具体的な出典に結びついている必要がある場所すべてで使われています。