Artículo destacado
ARAG: Framework Multi-Agente para Recomendaciones Contextuales Personalizadas
Escrito por
MIIA
Publicado
19 de julio de 2025
Lectura
4 min
Las recomendaciones personalizadas se han convertido en un pilar fundamental de muchos sistemas digitales, ya que buscan mostrar contenido, productos o servicios que se ajusten a las preferencias de cada usuario. Para lograr esto, se analizan comportamientos pasados, interacciones y patrones con el fin de anticipar qué resultará relevante para cada persona. Con el tiempo, estas técnicas han evolucionado desde filtros básicos hasta modelos avanzados basados en comprensión del lenguaje, lo que permite ofrecer sugerencias más precisas y adaptadas a los intereses cambiantes de los usuarios, mejorando así la interacción y satisfacción.
El principal reto en las recomendaciones está en captar las preferencias sutiles y dinámicas de cada usuario. En muchos casos, los sistemas fallan si el historial es limitado o si aparecen nuevos comportamientos que no coinciden con patrones anteriores. Métodos simples basados en similitud o en la antigüedad de las interacciones no logran reflejar intereses a largo plazo ni cambios contextuales. A medida que las necesidades de los usuarios varían constantemente, los sistemas sin capacidad de razonamiento semántico tienen dificultades para entregar resultados relevantes, lo que genera una experiencia pobre donde el contenido parece desconectado de lo que se busca en el momento.
Algunos enfoques habituales, como el ranking por recencia, priorizan los elementos con los que el usuario interactuó más recientemente. Otros, como la Recuperación Aumentada por Generación (RAG), seleccionan contenido basándose en la similitud semántica entre el historial del usuario y los metadatos de los items. Sin embargo, el modelo básico de RAG aplica la recuperación por embeddings sin incorporar un razonamiento profundo ni entendimiento entre sesiones, por lo que aunque identifica elementos relevantes, suele fallar al filtrarlos y ordenarlos considerando la intención real, especialmente en ámbitos variados como ropa o tecnología, donde el contexto es clave.
Frente a esto, investigadores de Walmart Global Tech propusieron ARAG (Agentic Retrieval-Augmented Generation), un sistema multi-agente que trabaja en conjunto mediante agentes especializados, cada uno dedicado a una tarea específica dentro del proceso de recomendación. Estos agentes son: uno que comprende el comportamiento del usuario, otro que evalúa la alineación de los items con las preferencias usando inferencia natural del lenguaje, un tercero que resume el contexto relevante, y finalmente un agente que ordena la lista final. Cada uno realiza un razonamiento particular, logrando que las recomendaciones estén más ajustadas tanto al historial como al contexto de la sesión actual.
El funcionamiento de ARAG comienza con la recuperación de un conjunto amplio de items candidatos a través de la similitud coseno en un espacio de embeddings. Luego, el agente de inferencia natural del lenguaje califica qué tan bien se relaciona la información textual de cada item con la intención inferida del usuario. Los items con mejores puntuaciones pasan al agente que resume el contexto para extraer la información clave que ayudará en el ordenamiento. En paralelo, el agente que entiende al usuario genera un resumen basado en su comportamiento pasado y reciente. Estas síntesis guían al agente encargado de ordenar los items según su probable relevancia. Todo el proceso se desarrolla en un espacio de memoria compartida que permite a los agentes razonar sobre los hallazgos de los demás, facilitando un procesamiento en paralelo y asegurando que el resultado final refleje fielmente la intención y el contexto del usuario.
Probado con el conjunto de datos de reseñas de Amazon, en categorías como Ropa, Electrónica y Hogar, ARAG mostró mejoras constantes y significativas. En ropa, logró un aumento del 42.12% en NDCG@5 y del 35.54% en Hit@5 respecto a métodos basados en recencia. En electrónica, mejoró NDCG@5 en un 37.94% y Hit@5 en un 30.87%. La categoría hogar también tuvo avances notables, con un 25.60% y 22.68% en esos mismos indicadores. Estos resultados evidencian cómo ARAG posiciona mejor los items relevantes en los primeros lugares. Además, un estudio de ablación confirmó que eliminar el agente de inferencia o el de resumen del contexto reduce la precisión, demostrando que el razonamiento multi-agente aporta mejoras claras al rendimiento.
Los investigadores lograron enfrentar un problema clave en los sistemas de recomendación: la dificultad de captar en profundidad el contexto del usuario. La solución propuesta, basada en la colaboración entre agentes especializados, evidencia avances importantes en precisión y relevancia, mostrando cómo los enfoques orientados al razonamiento pueden transformar las recomendaciones para alinearse mejor con la intención y el contexto del usuario.