
El nuevo modelo de inteligencia artificial de DeepMind puede asistir a los robots en el plegado de origami y en cerrar bolsas Ziploc.
El miércoles, DeepMind presentó dos nuevos modelos basados en Gemini, los cuales, según la compañía, sentarán las bases para una nueva generación de robots útiles.
Desde su lanzamiento a finales del año pasado, Gemini 2.0 ha sido integrado en varios productos de Google, incluyendo un nuevo chatbot basado en inteligencia artificial. Ahora, Google DeepMind está aprovechando esa misma tecnología para proyectos más innovadores. El miércoles pasado, el laboratorio de inteligencia artificial presentó dos nuevos modelos basados en Gemini, los cuales buscan "sentar las bases para una nueva generación de robots útiles".
El primero de estos modelos, Gemini Robotics, fue diseñado por DeepMind para permitir el control directo de robots. La empresa sostiene que los sistemas de inteligencia artificial para robots deben sobresalir en tres cualidades: generalidad, interactividad y destreza. La generalidad se refiere a la capacidad de un robot para adaptarse a situaciones nuevas, incluso aquellas no abordadas en su entrenamiento. La interactividad, por su parte, abarca la habilidad del robot para responder a las personas y su entorno. Finalmente, la destreza se relaciona con las habilidades motoras finas que, aunque son rutinarias para los humanos, son complicadas para los robots.
"Si bien nuestro trabajo previo mostró avances en estas áreas, Gemini Robotics representa un paso significativo en el rendimiento en todos estos aspectos, acercándonos a robots de propósito general", afirma DeepMind.
Por ejemplo, utilizando Gemini Robotics, el robot ALOHA 2 de DeepMind es capaz de doblar origami y cerrar una bolsa Ziploc. Este robot de dos brazos comprende todas las instrucciones ofrecidas en lenguaje natural cotidiano. En un video compartido por Google, se puede observar que incluso logra completar tareas a pesar de enfrentar obstáculos, como cuando un investigador mueve el Tupperware en el que el robot debía colocar la fruta.
Google también se ha asociado con Apptronik, la empresa detrás del robot bípedo Apollo, para desarrollar la próxima generación de robots humanoides. Al mismo tiempo, DeepMind está introduciendo Gemini Robotics-ER (razonamiento incorporado). Con respecto a este segundo modelo, la compañía ha indicado que permitirá a los robóticos ejecutar sus propios programas utilizando las avanzadas capacidades de razonamiento de Gemini. DeepMind está otorgando acceso al sistema a "evaluadores de confianza", incluyendo a Boston Dynamics, una antigua subsidiaria de Google.