Un robot que prepara cafés abre nuevos caminos para las máquinas con IA
Un robot con inteligencia artificial capaz de preparar café y adaptarse en tiempo real a entornos impredecibles podría revolucionar la interacción entre humanos y máquinas. Gracias a la combinación de GPT-4, sensores avanzados y habilidades motoras precisas, este sistema marca un paso hacia la próxima generación de robots autónomos inteligentes.
Por Enrique Coperías
Un robot cafetero vierte agua de una tetera en una taza. Cortesía: Ruaridh Mon-Williams
Un robot con inteligencia artificial capaz de preparar café en una cocina inteligente y adaptarse a entornos dinámicos podría marcar el inicio de una nueva generación de máquinas inteligentes, según un estudio publicado en la revista Nature Machine Intelligence.
Gracias a una combinación de inteligencia artificial avanzada, sensores de alta sensibilidad y habilidades motoras precisas, este robot autónomo puede interactuar con su entorno de una manera más humana y natural que nunca, afirman los investigadores.
Desarrollado por un equipo de la Universidad de Edimburgo, en el Reino Unido, en colaboración con el Instituto de Tecnología de Massachusetts (MIT) y la Universidad de Princeton, en Estados Unidos, este innovador robot barista representa un avance significativo en la capacidad de los robots de servicio para ejecutar tareas que hasta ahora solo podían realizar los humanos.
Robots listos par la improvisación
Mientras que los robots han demostrado gran eficacia en fábricas y líneas de producción, estas máquinas se enfrentan a grandes desafíos en espacios más dinámicos e impredecibles, como una cocina doméstica o un restaurante. Esto se debe a que, tradicionalmente, los robots industriales han dependido de acciones preprogramadas, sin la capacidad de adaptarse a cambios inesperados o reaccionar en tiempo real a su entorno.
Para abordar este problema, el equipo de investigación ha desarrollado ELLMER (Embodied Large-Language-Model-Enabled Robot), un marco de inteligencia artificial que combina GPT-4 y RAG, tecnologías que permiten procesar comandos abstractos y descomponerlos en tareas concretas mediante una infraestructura de generación aumentada por recuperación (retrieval-augmented generation).
Además, incorpora retroalimentación sensorial, integrando visión por computadora y sensores de fuerza, lo que le permite ajustar su comportamiento en tiempo real. Esto se complementa con habilidades motoras avanzadas, gracias a un brazo robótico Kinova con siete grados de libertad, equipado con un sistema de control de precisión para manipular objetos de manera efectiva.
El desarrollo de robots autónomos inteligentes como ELLMER marca el comienzo de una era donde los robots de servicio podrán desempeñar funciones avanzadas en entornos dinámicos, facilitando así tareas domésticas y comerciales.
Capaz de programar subtareas
El funcionamiento del robot de cocina inteligente comienza con la interpretación de instrucciones verbales y el análisis del entorno mediante sensores de visión artificial. Luego, el robot busca una taza de café, determina cómo abrir cajones y puertas, mide y mezcla una proporción precisa de café molido con agua caliente y se adapta a cambios inesperados, como si alguien mueve la taza mientras trabaja.
En una prueba experimental, el robot recibió el comando: «Estoy cansado y espero visitas para tomar un pastel. ¿Puedes prepararme una bebida caliente y decorar el plato con el dibujo de un animal al azar?». El robot desglosó la tarea en subtareas: encontrar y colocar una taza, medir y verter café y agua caliente, y buscar un bolígrafo digital para dibujar un animal en un plato, utilizando DALL-E para generar el diseño.
Comparado con otros enfoques como VoxPoser, ELLMER demostró una mayor precisión y adaptabilidad gracias a la combinación de inteligencia artificial generativa, aprendizaje profundo y retroalimentación en tiempo real.
Razonamiento, movimiento y percepción
Los investigadores destacan que este avance es clave para el futuro de los robots de asistencia en el hogar, restaurantes e industrias, ya que combina razonamiento abstracto, interacción precisa con objetos y adaptabilidad instantánea.
El desarrollo de robots autónomos inteligentes como ELLMER marca el comienzo de una era donde los robots de servicio podrán desempeñar funciones avanzadas en entornos dinámicos, facilitando así tareas domésticas y comerciales.
La integración futura de sensores táctiles, robótica blanda y aprendizaje por imitación permitirá mejorar aún más su desempeño. Como concluye Ruaridh Mon-Williams, autor principal del estudio: «Estamos vislumbrando un futuro en el que los robots con inteligencia cada vez más avanzada se vuelven algo común. Nuestro trabajo muestra el potencial de combinar razonamiento, movimiento y percepción para crear máquinas verdaderamente inteligentes».
Con ELLMER, se abre una nueva era de robots inteligentes que no solo ejecutan órdenes, sino que razonan, aprenden y se adaptan en entornos complejos como una cocina profesional, un hogar o un restaurante. ▪️
Información facilitada por la Universidad de Edimburgo
Fuente: Mon-Williams, R., Li, G., Long, R. et al. Embodied large language models enable robots to complete complex tasks in unpredictable environments. Nature Machine Intelligence (2025). DOI: https://doi.org/10.1038/s42256-025-01005-x