El Instituto de Investigación Toyota ha estado haciendo un trabajo increíble enseñando a los robots a aprender rápidamente y realizar tareas de forma autónoma; ahora está llevando su tecnología de modelo de comportamiento grande al extraordinario humanoide Atlas en asociación con Boston Dynamics.
El hardware de los robots humanoides, lo creas o no, probablemente ya sea lo suficientemente bueno. Más de una década de trabajo en Boston Dynamics ha dado como resultado no solo un robot Atlas hidráulico increíblemente atlético y capaz, sino también una gran cantidad de competidores comerciales emergentes de Tesla, Figure, Agility, Sanctuary, Fourier y muchos otros. Estos extraordinarios cuerpos de robots seguirán mejorando, pero ya son lo suficientemente buenos como para realizar todo tipo de trabajos útiles.
El software es el problema. Si necesita un equipo de codificación para enseñarle a un robot un nuevo comportamiento, apenas es mejor que los robots de producción convencionales actuales. Pero desarrollar un robot humanoide de uso general que entienda el mundo y cómo interactuar con él de manera flexible y adaptable es una tarea enorme.
El viejo Atlas: un tipo extravagante y muy gimnástico
Dinámica de Boston
La respuesta es la IA, por supuesto, como lo será pronto la respuesta para todo, pero la IA debe entrenarse con una gran cantidad de datos. ChatGPT, Grok, Llama y Claude se benefician de la enorme cantidad de datos (en gran parte escritos) que la humanidad ha acumulado a lo largo de los siglos. Los modelos de lenguajes grandes (LLM, por sus siglas en inglés) han avanzado muy rápidamente hasta ahora, porque el lenguaje es una representación altamente comprimida de la realidad, reducida a tamaños de archivos tan pequeños que se pueden procesar grandes cantidades.
Hay muchos menos datos disponibles para ayudar a los robots a aprender los conceptos básicos del movimiento, aparte del vídeo, que no cuenta la historia completa sobre por qué alguien hizo qué movimiento. Y realmente necesitan aprender cosas desde cero. De ahí la idea de un ‘Gran Modelo de Comportamiento’ o LBM, una forma para que los robots desarrollen lentamente los movimientos básicos que pueden utilizar para interactuar con el mundo y los combinen en movimientos más complejos al servicio de una tarea u objetivo, en de una manera similar a cómo los LLM han desarrollado una “comprensión” del lenguaje humano y han aprendido a interactuar con nosotros.
Si no ha visto el trabajo de LBM que realizó el Toyota Research Institute (TRI) el año pasado, tómese un momento para ponerse al día:
Enseñar nuevos comportamientos a los robots
En esencia, el equipo del TRI desarrolló un sistema de telepresencia que permite a los pilotos humanos “conducir” brazos robóticos, mirando a través de gafas de realidad virtual alimentadas por las cámaras del robot para ver exactamente lo que ve el robot, y equipadas con guantes hápticos para permitirles sentir también lo que el robot ve. Los sensores táctiles pueden sentir.
Luego, con el piloto humano limitado al conjunto exacto de “sentidos” que tiene el robot, se propusieron realizar una serie de tareas, muchas de ellas en la cocina. Pasaban un par de horas haciendo la misma tarea una y otra vez desde diferentes puntos de partida, corrigiendo sus errores si los cometían y marcando cada intento como un éxito o un fracaso.
A partir de ahí, los robots pasarían algún tiempo “pensando” en el problema, ejecutando efectivamente millones de simulaciones diferentes de la tarea mientras agregaban variables aleatorias y puntos de partida, calificando su propio desempeño cada vez de acuerdo con su propia comprensión de los modos de éxito y fracaso.
Y funcionó. El equipo del TRI había enseñado a sus brazos robóticos más de 60 comportamientos complejos hasta septiembre del año pasado, cuando vimos por primera vez el vídeo de arriba. Los investigadores informaron que a menudo pasaban una tarde realizando el entrenamiento piloto, luego regresaban a casa mientras el sistema de aprendizaje de comportamiento ejecutaba sus simulaciones durante la noche, y luego regresaban por la mañana para descubrir que los robots ahora eran capaces de realizar la tarea. ellos mismos y de manera bastante flexible.
Fue algo notable y estamos fascinados de saber qué tan lejos ha llegado en los últimos 12 meses, dado lo sorprendentemente rápido que están progresando las cosas en todos los campos de la IA. Pero también fue una investigación bastante limitada, realizada utilizando pares de brazos robóticos en lugar de cuerpos enteros.
Adiós al HD Atlas
Bueno, eso está a punto de cambiar. Boston Dynamics es el estándar de oro absoluto en la investigación en robótica y lo ha sido durante décadas. El viejo humanoide hidráulico Atlas pasará a la historia como una de las máquinas más innovadoras y significativas de la historia de la robótica.
Y el nuevo Atlas totalmente eléctrico, que quizás hayas visto en New Atlas, hizo su debut público hace apenas cinco meses. Esta notable evolución perdió parte del poder explosivo que convirtió a la Atlas original en una gimnasta tan extraordinaria, pero lo compensó con articulaciones totalmente giratorias en todo el cuerpo, lo que permitió la libre rotación en caderas, hombros, cintura, cuello, bíceps y muslos, por lo que cualquier sección determinada de su cuerpo puede mirar en cualquier dirección. De gimnasta a contorsionista… Échale un vistazo:
Todo el nuevo Atlas | Dinámica de Boston
Es un robot de aspecto verdaderamente extraordinario, ya rayado, abollado y con un aspecto muy usado, al estilo típico de Boston Dynamics, pero curiosamente hemos visto poco del nuevo Atlas en los últimos cinco meses para determinar exactamente dónde se encuentra y cuáles son sus capacidades actuales. son. Bueno, aparte de esto: sabemos que puede arrancar una serie de flexiones.
Así que las noticias de hoy son muy emocionantes; los grandes maestros indiscutibles del hardware de robots humanoides, que se asocian con un equipo líder en el desarrollo de AI LBM para mejorar las capacidades útiles de los robots humanoides.
“Nunca ha habido un momento más apasionante para la industria de la robótica y esperamos trabajar con TRI para acelerar el desarrollo de humanoides de uso general”, afirma Robert Playter, director ejecutivo de Boston Dynamics, en un comunicado de prensa. “Esta asociación es un ejemplo de dos empresas con una sólida base de investigación y desarrollo que se unen para trabajar en muchos desafíos complejos y construir robots útiles que resuelvan problemas del mundo real”.
“Los avances recientes en IA y aprendizaje automático tienen un enorme potencial para avanzar en la inteligencia física”, añade Gill Pratt, científico jefe de Toyota y director ejecutivo de TRI. “La oportunidad de implementar la tecnología de inteligencia artificial de última generación del TRI en el hardware de Boston Dynamics cambia las reglas del juego para cada una de nuestras organizaciones mientras trabajamos para amplificar a las personas y mejorar la calidad de vida”.
La asociación tiene como objetivo desarrollar rápidamente modelos de comportamiento de todo el cuerpo para el robot Atlas, pero también para otras plataformas humanoides con las que TRI podría trabajar. Será interesante ver qué diferentes tipos de hardware de entrenamiento de telepresencia se utilizan para resolver el problema, ya que Atlas es mucho más complejo que las configuraciones bimanuales simples con las que TRI estaba trabajando originalmente.
Boston no es amable con sus robots; Incluso el nuevo Atlas parece haber pasado por las guerras.
Dinámica de Boston
Sin embargo, en última instancia, todavía no está claro si Boston tiene la intención de convertir Atlas en un producto comercial. Y la escala puede ser crucial aquí; Empresas como Tesla y Figure están diseñando sus humanoides teniendo en mente la fabricación en masa, con el objetivo de desplegar cientos, y luego miles, de ellos en el mundo realizando tareas pequeñas, simples y útiles. Allí, verán suceder una extraordinaria variedad de cosas, recopilarán una gran cantidad de datos del mundo real y utilizarán esos datos para impulsar el aprendizaje basado en enjambres.
Ese es el enfoque que, según Tesla, lo convierte en líder mundial en automóviles autónomos; Ya hay millones de estas cosas en el camino, observando constantemente y contribuyendo al conocimiento del conjunto. La IA es un juego de big data, y quien recopile la mayor cantidad de datos y los utilice de manera más eficiente ganará, según este modelo. Y el premio, según personas como Elon Musk, es posiblemente el producto más grande de la historia, una máquina transformadora que reemplaza la mano de obra y que eventualmente podría hacerse cargo básicamente de cualquier trabajo físico.
Si bien Boston Dynamics ha estado muy por delante de todos en humanoides durante al menos una década, Atlas ha sido designada específicamente como plataforma de investigación. La empresa ha restringido sus actividades comerciales a cuadrúpedos más pequeños y prácticos, como su plataforma Spot y su manipulador de cajas Stretch de un solo brazo y de carga pesada.
Quizás sea revelador que esta empresa pionera no parece creer que los humanoides estén listos para ponerse a trabajar todavía, y necesitarán algunos años más en el laboratorio, reuniendo minuciosamente los componentes básicos del comportamiento físico.
La promesa de los humanoides de uso general es tan enorme y el desafío tan grande, que seguramente habrá muchas sorpresas en el camino. Esto se siente como un campo donde estamos viendo cómo sucede la historia del futuro en tiempo real.
Fuente: Dinámica de Boston