Xiaomi lleva tiempo dejando claro que ya no es solo una marca de teléfonos móviles. Hoy en día, la empresa china abarca desde electrodomésticos y coches hasta diseño de chips, y ahora también se adentra en la robótica con su primer modelo de inteligencia artificial diseñado para visión, lenguaje y acción en robots, llamado Xiaomi-Robotics-0.
Este modelo es de código abierto y está disponible en plataformas como GitHub y HuggingFace. Según Xiaomi, ha sido optimizado para ofrecer un rendimiento alto y rápido, capaz de ejecutarse en tiempo real de forma fluida. No esperes que este modelo haga que un robot corra o salte como una persona, sino que ayude a robots sencillos a comprender su entorno y tomar decisiones acertadas, evitando errores como romper objetos accidentalmente.
Cuando hablamos de inteligencia artificial en robótica, no se trata solo de movimiento. Un robot debe saber, por ejemplo, que no es lo mismo agarrar un ladrillo que un gato y ajustar la fuerza que aplica. Esto implica que el robot debe interpretar lo que ve y ejecutar acciones adecuadas, entendiendo que si se trata de un objeto pesado, debe sujetarlo con más fuerza para moverlo.
Xiaomi ha obtenido resultados muy destacados en varias pruebas de rendimiento: LIBERO, que evalúa la transferencia de conocimientos; SimplerEnv, que mide el desempeño en simulaciones reales; y CALVIN, que evalúa tareas basadas en lenguaje. Según la compañía, Xiaomi-Robotics-0 alcanza altos porcentajes de éxito en tareas complejas que requieren el uso de ambas manos, como desmontar LEGOs y doblar toallas.
Para entrenar este modelo, que cuenta con 4.700 millones de parámetros, se utilizó un conjunto enorme de datos: 200 millones de pasos en trayectorias de robots, más de 80 millones de muestras de datos combinados de visión y lenguaje, incluyendo 338 horas de video de desmontaje de LEGOs y 400 horas de videos de doblar toallas.
En cuanto a resultados concretos, el modelo puede desmontar estructuras de LEGO de hasta 20 piezas, ajustar la fuerza de agarre en tiempo real para evitar fallos, doblar una toalla con una sola mano y distinguir entre dos toallas para dejar una en su lugar y doblar solo la otra. Aunque en un primer momento estas tareas parezcan simples, su aplicación tiene un gran potencial en entornos industriales y domésticos.
Lo más interesante es que este modelo demuestra capacidad para adaptarse a formas complejas e impredecibles, como una toalla arrugada en un cesto, entendiendo la “física de lo blando”. Esto podría ser útil no solo para manipular objetos cotidianos, sino también para intervenciones médicas que requieran manejar tejidos humanos, por ejemplo. En el caso de los LEGOs, no es solo desmontarlos, sino saber cómo están colocados, la fuerza y el ángulo correcto para no dañarlos — algo vital para tareas como limpiar escombros.
Tradicionalmente, los robots industriales se programan para seguir coordenadas fijas: mover algo del punto A al B. Pero un robot con una IA como la que propone Xiaomi puede aprender tareas completas, no solo movimientos, lo que abre un mundo de posibilidades. Imagina un futuro con robots domésticos que no solo limpian, sino que identifican objetos y saben cómo moverlos sin romperlos para limpiar a fondo.
En definitiva, Xiaomi-Robotics-0 marca un paso importante para que los robots sean más inteligentes y adaptativos, acercándonos cada vez más a máquinas capaces de interactuar con su entorno de forma segura y eficiente.


