Tecnología

Google busca revolucionar el mundo de la robótica al presentar el modelo de IA Gemini Robotics

El gigante tecnológico compartió videos en los que se puede observar a los robots equipados con el nuevo modelo Gemino Robotics.

13 de marzo de 2025, 9:26 p. m.
Google presenta Gemini Robotics
Google presenta Gemini Robotics | Foto: Captura de video

Google ha realizado un anuncio que promete cambiar el mundo de la tecnología y de la Inteligencia Artificial (IA). Hasta ahora, la IA había estado enclaustrada en un chat, pero con el anuncio de Google DeepMind, esto quedará en el pasado.

La nueva versión de su modelo Gemini fusiona el lenguaje, la visión y la acción física para la creación de robots más adaptables y útiles.

El gigante tecnológico compartió videos en los que se puede observar a los robots equipados con el nuevo modelo Gemino Robotics. El aparato manipulaba objetos en repuesta a órdenes habladas. Los brazos del robot doblan papel, entregan verduras, pueden colocar gafas en el estuche y realizan otras tareas.

Google DeepMind también anunció la versión de su modelo llamada Gemini Robotics-ER, que solo cuenta con compresión visual y espacial.

En otro video, el equipo del gigante tecnológico utilizó el modelo para controlar un robot humanoide llamado Apollo, de la startup Apptronik. El robot habla con un humano y mueve las letras por el tablero de una mesa cuando se le ordena.

“Hemos sido capaces de trasladar a la robótica la comprensión general de Gemini 2.0”, explicó Kanishka Rao, investigador de robótica de Google DeepMind, que dirigió el trabajo.

La división de IA de Google explicó que el nuevo modelo es capaz de controlar diferentes robots en varios escenarios específicos, algo que no se incluía antes en su entrenamiento.

“Una vez que la máquina comprende el concepto general, se vuelve mucho más general y útil”, agregó Rao.

Loa avances que dieron lugar a los chatbots como ChatGPT de OPENAI o el mismo Gemini de Google han suscitado la esperanza de una gran revolución en la robótica, pero los expertos aseguran que todavía queda mucho camino por recorrer.

Si bien todavía es muy pronto para reunir datos de entrenamiento de robots, los LLM pueden servir de base para nuevos modelos robóticos más capaces, debido a que contienen una gran cantidad de información sobre el mundo físico.

Desde Google han asegurado que están trabajando en varios proyectos de investigación que puedan mostrar el potencial de estos enfoques.

Google DeepMind demostró que ha seguido el ritmo de estos esfuerzos: en septiembre del 2024 reveló un robot que combina LLM y nuevos métodos de entrenamiento para realizar tareas como atarse los cordones y doblar la ropa.