Google anuncia dos modelos de IA para nueva generación de robots humanoides
Google DeepMind ha revelado dos modelos de inteligencia artificial: Gemini Robotics y Gemini Robotics-ER.

Google DeepMind ha revelado dos innovadores modelos de inteligencia artificial (IA) que, según la compañía, marcan el comienzo de una nueva era en robótica avanzada: Gemini Robotics y Gemini Robotics-ER.
Ambos modelos, desarrollados a partir de la IA Gemini 2.0, amplían significativamente las capacidades de los robots, permitiéndoles realizar tareas más variadas y complejas en entornos del mundo real.
El primero de ellos, Gemini Robotics, es un sofisticado sistema de visión-lenguaje-acción (VLA) que introduce el control físico como una nueva dimensión, permitiendo a los robots ejecutar tareas con precisión milimétrica. Gracias a esta innovación, los robots pueden realizar acciones detalladas como doblar una figura de origami o colocar cuidadosamente un bocadillo dentro de una bolsa con cierre hermético, explica la empresa en su blog oficial.
Para lograr una verdadera utilidad en entornos humanos, la IA aplicada a la robótica debe cumplir con tres principios clave:
- Versatilidad: la capacidad de adaptarse a múltiples escenarios y requerimientos.
- Interacción intuitiva: una comprensión ágil de instrucciones y respuestas rápidas a cambios en el entorno.
- Destreza física: la habilidad de ejecutar tareas que normalmente requieren el uso preciso de las manos y los dedos, como manipular objetos frágiles.
Google DeepMind asegura que, si bien sus desarrollos anteriores ya habían avanzado en estas áreas, Gemini Robotics representa un salto cualitativo en las tres dimensiones, acercando a la industria a la creación de robots verdaderamente versátiles.
Una IA adaptable a diferentes tipos de robots
Dado que los robots pueden tener diversas formas y tamaños, Gemini Robotics ha sido diseñado para integrarse fácilmente en distintas plataformas robóticas sin necesidad de ajustes extensivos.
Por otro lado, Gemini Robotics-ER es un modelo especializado en visión-lenguaje (VLM) con una capacidad avanzada de razonamiento espacial. Su propósito es permitir a los expertos en robótica desarrollar y personalizar programas mediante el aprovechamiento de la inteligencia corporal de Gemini.
Este modelo destaca por mejorar considerablemente la percepción tridimensional y la capacidad de identificación de objetos. Por ejemplo, al detectar una taza de café, el sistema no solo reconoce su forma, sino que también infiere el mejor punto de agarre en el asa y calcula una trayectoria óptima para alcanzarla sin derramar el contenido.
Gracias a la incorporación de Gemini en estos modelos, los robots pueden desempeñar una gama más extensa de funciones en entornos reales. Para llevar estos avances al siguiente nivel, Google DeepMind se ha asociado con la empresa Apptronik para desarrollar una nueva generación de robots humanoides.
Además, están colaborando con grupos de evaluación especializados que ayudarán a perfeccionar el potencial de Gemini Robotics-ER en aplicaciones prácticas.
El futuro de la IA en el mundo físico
Desde Google DeepMind destacan que los modelos Gemini han avanzado en el uso de razonamiento multimodal, integrando texto, imágenes, audio y video para resolver problemas complejos. Sin embargo, hasta ahora estas capacidades se habían limitado en gran medida a escenarios digitales.
Para que la IA tenga un impacto significativo en el mundo físico, es fundamental que desarrolle un “razonamiento corporal”, es decir, la capacidad de interpretar y responder de manera similar a los humanos a los estímulos del entorno. Además, debe actuar con seguridad y eficiencia al realizar tareas prácticas, indica EFE.
Por ello, la compañía afirma que estos nuevos modelos, construidos sobre la base de Gemini 2.0, establecen un punto de inflexión en el camino hacia robots más autónomos, inteligentes y funcionales en la vida cotidiana.
Sigue nuestro canal de WhatsApp
Recibe las noticias más importantes del día. Da click aquí
Te recomendamos
La IA de Google resolvió en 48 horas lo que científicos tardaron 10 años
¿Adiós celulares? Mark Zuckerberg anticipa el fin de los smartphones para esta fecha, asegurando que serán sustituidos por este nuevo artefacto inteligente
Elon Musk anuncia que Grok-3 estará gratis temporalmente: ¿Qué ofrece este nuevo modelo de IA?
Así es como Apple busca fusionar la inteligencia artificial con la realidad virtual