Glosario

¿Qué es RAG (Generación Aumentada por Recuperación)?

RAG, o Generación Aumentada por Recuperación, es un patrón de IA en el que el modelo recupera primero los pasajes relevantes de una fuente y solo entonces genera la respuesta, anclando lo que dice en el documento.

Un LLM ordinario responde a partir de sus datos de entrenamiento, fijados en el momento de entrenar el modelo y propensos a alucinar. RAG corrige esto añadiendo un paso de recuperación: cuando llega una pregunta, el sistema busca en un corpus (un libro, un PDF, una base de conocimiento) los pasajes más relevantes, los entrega al LLM como contexto y solo entonces le pide responder.

El resultado es una respuesta que cita pasajes concretos y queda condicionada por la fuente en lugar del entrenamiento del modelo. Por eso RAG es el patrón estándar para las funciones de "chatea con tu documento", para bots de soporte sobre un centro de ayuda y para buscadores con IA que necesitan atribuir lo que afirman.

La calidad de un sistema RAG depende de tres piezas: cómo se trocea la fuente (párrafo, sección, frase), cómo se embeden los trozos para la búsqueda por similitud y cómo se le pide al modelo que use el contexto recuperado. Un eslabón débil en cualquiera de las tres produce respuestas formalmente ancladas pero materialmente erróneas.

Dónde encaja Summio

Summio usa RAG para anclar cada afirmación de un resumen o respuesta del chat a un pasaje concreto del libro, transcripción, artículo o PDF. Si el motor no puede citar un pasaje, no imprime la afirmación — esa política de anclaje a la fuente es lo que hace de Summio una herramienta fiable para una lectura profesional.

Saber más sobre Summio →

Preguntas frecuentes

¿En qué se diferencia RAG del fine-tuning?

El fine-tuning incorpora conocimiento nuevo en los pesos del modelo — lento, caro y actualizable solo reentrenando. RAG deja el modelo congelado y cambia el contexto recuperado en cada consulta, así que actualizar conocimiento es reindexar un documento, no reentrenar nada.

¿Elimina RAG las alucinaciones?

Las reduce mucho pero no las elimina. El modelo aún puede malleer el pasaje recuperado, ignorarlo o coser una síntesis incorrecta a partir de fragmentos correctos. Las políticas de citado obligatorio (no responder si ningún pasaje sostiene la afirmación) cierran la mayor parte del hueco que queda.

¿Dónde se usa RAG?

En buscadores con IA (Perplexity, ChatGPT search, Claude con acceso web), en chat sobre documentación interna, en bots de soporte sobre centros de ayuda y en apps de lectura como Summio. En cualquier sitio donde la respuesta deba poder atribuirse a una fuente concreta.