Ultimas Noticias

Doblar la ropa o desmontar LEGOs ha sido siempre una tarea tediosa. La nueva IA de Xiaomi para robots le ha puesto fin

Hace mucho, muchísimo tiempo que Xiaomi dejó de ser una empresa de móviles. Hoy los tentáculos de la compañía alcanzan todo tipo de sectores, desde móviles y electrodomésticos hasta coches, diseño de chips y, desde ahora, robótica. Y es que la compañía china acaba de presentar su primer modelo de visión, lenguaje y acción para robótica. Su nombre: Xiaomi-Robotics-0.

De qué va esto. Xiaomi-Robotics-0 es un modelo open-source cuyo código puede encontrarse en GitHub y HugginFace. Tal y como explican desde la empresa, este modelo ha sido optimizado para ofrecer «alto rendimiento, velocidad y suavidad en ejecuciones en tiempo real». No hay que pensar en este modelo como una IA capaz de que un robot corra y salte cual humano, sino en uno capaz de hacer que un robot «sencillo» entienda su alrededor y sepa tomar la decisión óptima sin, por ejemplo, destrozar lo que tenga entre las manos.

Lo de los robots. Cuando hablamos de IA aplicada a la robótica no hablamos solo de que un robot sea capaz de moverse. El dispositivo ha de saber y entender que no debe aplicar la misma fuerza al sujetar un ladrillo que a un gato, por ejemplo. En ese sentido, tiene que haber un entendimiento de lo visual, una comprensión de lo que se está viendo y una ejecución de acciones acorde: esto es un ladrillo > es un objeto pesado > he de aplicar más fuerza para sujetarlo y moverlo de un lado a otro.

Resultados de Xiaomi-Robotics-0 en los benchmarks | Imagen: Xiaomi

Resultados de Xiaomi-Robotics-0 en los benchmarks | Imagen: Xiaomi

Los benchmarks. Xiaomi ha conseguido, según detallan en la web del proyecto, buenísimos resultados en los benchmarks LIBERO (mide la transferencia de conocimiento), SimplerEnv (mide el rendimiento en simulaciones reales) y CALVIN (mide el rendimiento en tareas condicionadas por el lenguaje). De acuerdo a la empresa, Xiaomi-Robotics-0 «consigue unas tasas altas de éxito y robustos resultados en dos desafiantes tareas bimanuales: desmontar LEGOs y doblar toallas».

Lo divertido del entrenamiento. Todo modelo de IA bebe de un dataset de entrenamiento. En el caso de Xiaomi-Robotics-0, un modelo de 4.700 millones de parámetros, el dataset consiste en 200 millones de pasos de tiempo de trayectorias de robots y más de 80 millones de muestras de datos generales de visión-lenguaje, incluyendo 338 horas de vídeo de desmontaje de LEGOs y 400 horas de vídeos de doblaje de toallas.

Los resultados. La compañía asegura en el paper que su modelo es capaz de desmontar LEGOs complejos de hasta 20 piezas, adaptar la sujeción en tiempo real para evitar fallos, usar una sola mano para poner bien la toalla y poder doblarla o, si recoge dos toallas del cesto, coger una de ellas, dejarla en su sitio y doblar solo una. Esto demuestra una capacidad interesante de adaptación y aprendizaje que, aunque puede parecer nimia sobre el papel, tiene su jugo si pensamos en robots industriales e incluso domésticos. 

Más allá. Lo que este modelo está demostrando es ser capaz de adaptarse a geometrías complejas e impredecibles, como la de una toalla tirada en un cesto, y a entender la, digamos, «física de lo blando». En una toalla puede parecer poca cosa, pero pensemos en manipular tejidos humanos en una intervención, por ejemplo. Lo mismo con los LEGO. No es solo desmontarlos, es entender la posición de los bloques, cómo encajan, qué fuerza aplicar y en qué ángulo para no romperlos. Pensemos en un robot que quita escombros.

Un robot industrial se ha programado históricamente con coordenadas fijas, es decir, mover algo del punto A al punto B. Un robot con una IA como la que propone Xiaomi sería mucho más versátil. El primer robot aprende movimientos, el segundo robot aprende tareas, y la diferencia es un mundo. Si pensamos en un futuro lejano en el que haya robots domésticos, no será lo mismo que un robot limpie el polvo de una estantería a que sepa identificar objetos, decoración, etc., y entienda que debe moverlos para evitar tirarlos y limpiar a fondo. 

Imagen de portada | Xiaomi

En Xataka | Una empresa china presume de otro límite en robótica: asegura que su nuevo robot humanoide corre como un atleta de élite

source

Mostrar más
Botón volver arriba