Amazon ha alcanzado un hito impresionante al desplegar su robot número un millón en sus centros de distribución y clasificación a nivel mundial, consolidándose como el mayor operador de robótica móvil industrial del mundo. Este logro coincide con el lanzamiento de DeepFleet, una innovadora suite de modelos fundamentales diseñada para mejorar la coordinación entre grandes flotas de robots móviles. Entrenados con miles de millones de horas de datos reales de operación, estos modelos prometen optimizar los movimientos de los robots, reducir la congestión y aumentar la eficiencia general hasta en un 10%.
Los modelos fundamentales, que se han popularizado en el ámbito de la inteligencia artificial para lenguaje y visión, aprenden patrones generales a partir de enormes conjuntos de datos y pueden adaptarse a diferentes tareas. Amazon está aplicando este enfoque a la robótica, un campo que requiere inteligencia predictiva avanzada para coordinar miles de robots en entornos dinámicos como sus almacenes.
En los centros de distribución, estos robots transportan estanterías con inventario hasta los trabajadores humanos, mientras que en las instalaciones de clasificación se encargan de manejar paquetes para su entrega. Con flotas que alcanzan cientos de miles de unidades, enfrentar problemas como embotellamientos y bloqueos puede ralentizar el proceso. DeepFleet ofrece una solución al prever las trayectorias e interacciones de los robots para planificar con anticipación y evitar estos inconvenientes.
Los modelos se basan en datos variados que cubren diferentes configuraciones de almacenes, generaciones de robots y ciclos operativos, lo que les permite captar comportamientos emergentes como las ondas de congestión. Esta riqueza de información, que suma millones de horas de operación, posibilita que DeepFleet generalice su aprendizaje a múltiples escenarios, de manera similar a cómo los grandes modelos de lenguaje se adaptan a nuevas preguntas.
DeepFleet incluye cuatro arquitecturas distintas, cada una con un enfoque particular para modelar la dinámica de múltiples robots:
- Modelo Robot-Céntrico (RC): Este transformador autorregresivo se centra en cada robot individual, utilizando datos del entorno cercano —como robots, objetos y marcadores próximos— para predecir sus siguientes acciones. Procesa actualizaciones asíncronas y se combina con un simulador determinista para la evolución del estado. Con 97 millones de parámetros, fue el que logró mejores resultados en precisión de predicción de posición y estado.
- Modelo Robot-Suelo (RF): Emplea una atención cruzada para integrar el estado del robot con características globales del suelo, como vértices y conexiones. Decodifica las acciones de manera sincronizada, equilibrando interacciones locales y contexto de todo el almacén. Con 840 millones de parámetros, destacó especialmente en la predicción de tiempos.
- Modelo Imagen-Suelo (IF): Considera el almacén como una imagen con múltiples canales, utilizando codificación convolucional para características espaciales y transformadores para secuencias temporales. Sin embargo, tuvo un desempeño menor, probablemente por la dificultad para capturar interacciones a nivel de píxel a gran escala.
- Modelo Gráfico-Suelo (GF): Combina redes neuronales gráficas con transformadores para representar el suelo como un grafo espaciotemporal. Maneja eficientemente relaciones globales, prediciendo acciones y estados con solo 13 millones de parámetros, lo que lo hace ligero en cómputo pero competitivo en rendimiento.
Estas arquitecturas difieren en sus enfoques temporales (sincrónicos o basados en eventos) y espaciales (locales o globales), lo que permite a Amazon evaluar cuál modelo se adapta mejor a las previsiones a gran escala.
En las pruebas con datos reales retenidos, se utilizaron métricas como la deformación temporal dinámica para medir la precisión de trayectoria y el error por retraso en congestión para la veracidad operativa. El modelo RC lideró en general con mejores puntuaciones, mientras que el GF ofreció resultados sólidos con menos complejidad computacional.
Experimentos de escalabilidad confirmaron que aumentar el tamaño de los modelos y los conjuntos de datos reduce las pérdidas de predicción, siguiendo tendencias observadas en otros modelos fundamentales. Para GF, se estima que una versión con mil millones de parámetros, entrenada con 6.6 millones de episodios, podría optimizar eficientemente el cómputo.
Esta capacidad de escalar es fundamental, ya que la enorme flota de robots de Amazon ofrece una ventaja sin igual en cuanto a la disponibilidad de datos. Ya hay aplicaciones prácticas como la predicción de congestiones y el enrutamiento adaptativo, con potencial para asignación de tareas y prevención de bloqueos.
DeepFleet ya está mejorando la red global de Amazon, que incluye más de 300 instalaciones, y se ha desplegado recientemente en Japón. Al optimizar la eficiencia en el desplazamiento de los robots, permite procesar paquetes más rápido y con menores costos, beneficiando directamente a los clientes.
Además, Amazon ha invertido en el desarrollo de su fuerza laboral, capacitando a más de 700,000 empleados desde 2019 en habilidades relacionadas con robótica e inteligencia artificial. Esta integración permite que las máquinas asuman tareas pesadas, creando empleos más seguros para las personas.
De cara al futuro, Amazon sigue perfeccionando las variantes RC, RF y GF de DeepFleet. Esta tecnología tiene el potencial de transformar los sistemas multi-robot en logística, anticipando el comportamiento de grandes flotas y avanzando hacia operaciones más autónomas y escalables. Así, los modelos fundamentales trascienden lo digital para revolucionar la automatización física y transformar industrias dependientes de la coordinación robótica.



