Hay tres razones por las que los robots están a punto de ser mucho más útiles. El sueño de la robótica siempre fue construir un robot doméstico capaz de realizar las tareas del hogar. Aunque los especialistas lograron que los robots hagan cosas impresionantes en el laboratorio, esto suele requerir una planificación meticulosa en un entorno estrictamente controlado. Esto dificulta que los robots trabajen de forma confiable en hogares rodeados de niños y mascotas, con planos de planta muy diferentes y desordenados.
La paradoja de Moravec
Hay una observación muy conocida entre los especialistas en robótica llamada paradoja de Moravec: lo que es difícil para los humanos es fácil para las máquinas, y lo que es fácil para los humanos es difícil para las máquinas. Gracias a la IA, esto ahora está cambiando. Los robots están empezando a ser capaces de realizar tareas como doblar la ropa, cocinar y descargar cestas de la compra, que hasta hace poco se consideraban casi imposibles.
La robótica se encuentra en un punto de inflexión. En la investigación robótica converge una mezcla de factores realmente apasionante, que podría desembocar en robots que podrían salir del laboratorio y entrar en nuestros hogares.
Estas son tres razones por las que la robótica está a punto de vivir su “momento ChatGPT”.
Tres razones por las que el robot doméstico podría despegar
1. El hardware accesible hace que la investigación sea más accesible
Los robots son caros. Los altamente sofisticados pueden costar fácilmente cientos de miles de dólares, lo que los hace inaccesibles para la mayoría de los investigadores. Por ejemplo, el PR2, una de las primeras versiones de robot doméstico, pesaba 200 kilogramos y costaba 400 mil dólares.
Pero los robots nuevos y más baratos permiten a más investigadores hacer cosas interesantes. Durante la pandemia se lanzó un nuevo robot llamado Stretch, desarrollado por la startup Hello Robot, con un precio mucho más razonable, de unos 18 mil dólares y un peso de 23 kilogramos.
Tiene una pequeña base móvil, un bastón con cámara colgante, un brazo ajustable equipado con una pinza con ventosas en los extremos y se puede controlar con un mando de consola.
Mientras tanto, un equipo de Stanford creó un sistema llamado Mobile ALOHA (acrónimo aproximado de “un sistema teleoperativo de hardware de código abierto y bajo costo”), que aprendió a cocinar camarones con la ayuda de solo 20 demostraciones humanas y datos de otras tareas. Utilizaron componentes disponibles en el mercado para ensamblar robots a precios más razonables.
2. La IA nos ayuda a construir cerebros robóticos
Lo que diferencia a esta nueva generación de robots es su software. Gracias al auge de la IA, ahora la atención está pasando de las hazañas de destreza física logradas por robots caros a la construcción de cerebros robóticos de uso general en forma de redes neuronales.
En lugar de la planificación y la formación meticulosas tradicionales, los especialistas en robótica empezaron a utilizar el aprendizaje profundo y las redes neuronales para crear sistemas que aprendan de su entorno en tiempo real y adapten su comportamiento en consecuencia. El verano pasado, Google lanzó un modelo de visión, lenguaje y acción llamado RT-2. Este modelo obtiene su comprensión general del mundo a partir del texto y las imágenes en línea en los que formó, así como de sus propias interacciones.
Además, investigadores del Instituto de Investigación de Toyota, la Universidad de Columbia y el MIT pudieron enseñar rápidamente a los robots a realizar muchas tareas nuevas con la ayuda de una técnica de aprendizaje mediante IA llamada aprendizaje por imitación, además de la IA generativa. Creen haber encontrado una forma de extender la tecnología que impulsa la IA generativa del ámbito del texto, las imágenes y los vídeos al dominio de los movimientos de los robots.
Por su parte, Covariant, una empresa emergente de robótica que se separó de la unidad de investigación robótica de OpenAI, ahora cerrada, creó un modelo multimodal llamado RFM-1. Puede aceptar indicaciones en forma de texto, imagen, vídeo, instrucciones robóticas o medidas. La IA generativa permite al robot doméstico entender las instrucciones y generar imágenes o vídeos relacionados con esas tareas.
3. Más datos permiten al robot doméstico aprender más habilidades
El poder de los grandes modelos de IA, como el GPT-4, reside en las enormes cantidades de datos que aspira Internet. Pero esto no funciona realmente con los robots, que necesitan datos recopilados específicamente para ellos. Necesitan demostraciones físicas de cómo se abren las lavadoras y los refrigeradores, cómo se recogen los platos o cómo se dobla la ropa. Por el momento, estos datos son muy escasos y los humanos tardan mucho tiempo en recopilarlos.
Una nueva iniciativa iniciada por Google DeepMind, llamada Open X-Embodiment Collaboration, pretende cambiar esta situación. El año pasado, la empresa colaboró con 34 laboratorios de investigación y unos 150 investigadores para recopilar datos de 22 robots diferentes, incluido el Hello Robot Stretch. El conjunto de datos resultante, publicado en octubre de 2023, consiste en demostraciones de robots que realizan 527 habilidades, como levantar, empujar y moverse. Las primeras señales muestran que una mayor cantidad de datos conduce a robots más inteligentes.
Los investigadores construyeron dos versiones de un modelo de robot, llamado RT-X, que podían ejecutarse localmente en computadoras de laboratorio individuales o ser accesibles a través de la web. El modelo más grande, accesible a través de la web, fue entrenado previamente con datos de Internet para desarrollar un “sentido común visual”, o una comprensión básica del mundo, a partir de grandes modelos de lenguaje e imagen. Cuando los investigadores utilizaron el modelo RT-X en muchos robots diferentes, descubrieron que los robots podían aprender habilidades con éxito un 50% más que los sistemas que estaba desarrollando cada laboratorio individual.
El robot doméstico se une a la inteligencia artificial
Durante mucho tiempo, la investigación en robótica fue un campo despiadado, plagado de avances lentos. Lo que diferencia a esta nueva generación de robots es su software. En lugar de la planificación y el entrenamiento tradicionales, los robots comenzaron a utilizar el aprendizaje profundo y las redes neuronales para crear sistemas que aprenden de su entorno y ajustan su comportamiento en consecuencia. Al mismo tiempo, el hardware nuevo y más económico, como los componentes estándar y los robots como Stretch, están haciendo que este tipo de experimentación sea más accesible.
En general, los investigadores utilizan la inteligencia artificial para entrenar a los robots de dos maneras. Pathak utilizó el aprendizaje por refuerzo, una técnica de inteligencia artificial que permite mejorar los sistemas mediante prueba y error, para hacer que los robots adapten sus movimientos a nuevos entornos.
Los “perros robóticos” de Boston Dynamics
En 2022, el equipo de Pathak utilizó este método para crear “perros robóticos” de cuatro patas capaces de subir escalones y navegar por terrenos difíciles. Los robots fueron entrenados por primera vez para moverse de forma genérica en un simulador. Luego quedaron libres en el mundo real, con solo una cámara integrada y un software de visión artificial para guiarlos. Otros robots similares se basan en mapas internos del mundo estrictamente prescritos y no pueden navegar más lejos.
Pathak afirma que el enfoque del equipo se inspiró en la navegación humana. Los seres humanos reciben información sobre el mundo que los rodea a través de sus ojos y esto les ayuda a colocar instintivamente un pie delante del otro para moverse adecuadamente. En general, los seres humanos no miran al suelo bajo sus pies cuando caminan, sino unos pasos más allá, hacia el punto al que quieren ir. El equipo de Pathak entrenó a sus robots para que adoptaran un enfoque similar al caminar: cada uno de ellos usó la cámara para mirar hacia adelante. Luego, el robot pudo memorizar lo que tenía delante durante un tiempo suficiente para guiar la posición de las piernas. Los robots aprendieron sobre el mundo en tiempo real, sin mapas internos, y ajustaron su comportamiento en consecuencia.
En ese momento, los expertos dijeron que la técnica representaba un “gran avance en el aprendizaje y la autonomía de los robots” y que podría haber permitido a los investigadores construir robots con patas capaces de usarse en la naturaleza.
Desde entonces, los perros robot de Pathak subieron de nivel. El robot fue entrenado para moverse de forma genérica en una simulación. Sin embargo, gracias al aprendizaje por refuerzo, pudo aprender nuevas habilidades en movimiento, como saltar largas distancias, caminar sobre sus patas delanteras y trepar cajas que le doblaban la altura.
Estos comportamientos no fueron programados por los investigadores. Por el contrario, el robot aprendió mediante prueba y error y gracias a las entradas visuales de su cámara frontal. “Hace tres años, no creía que fuera posible”, dice Pathak.
Aprender por imitación
En la otra técnica popular, llamada aprendizaje por imitación, los modelos aprenden a realizar tareas imitando, por ejemplo, las acciones de un humano que teleopera un robot o utilizan un casco de realidad virtual para recopilar datos sobre un robot.
Es una técnica que estuvo de moda a lo largo de las décadas, pero que recientemente se volvió más popular entre los robots que realizan actividades de manipulación, explica Russ Tedrake, vicepresidente de investigación robótica del Instituto de Investigación de Toyota y profesor del MIT.
La idea es empezar con un humano, que controla manualmente el robot para demostrar comportamientos como batir huevos o recoger platos. Mediante una técnica llamada política de difusión, el robot puede utilizar los datos que se le proporcionan para aprender habilidades. Los investigadores enseñaron a los robots más de 200 habilidades, como pelar verduras y servir líquidos, y dicen que están trabajando para enseñarles 1000 antes de que acabe el año.
El equipo del Instituto de Investigación de Toyota espera que algún día esto pueda conducir a “excelentes modelos de comportamiento”, análogos a los excelentes modelos lingüísticos, afirma Tedrake. “Mucha gente piensa que el comportamiento de clonación nos llevará a un momento de ChatGPT en el ámbito de la robótica”, afirma Tedrake.
Todo esto está preparando el terreno para que los robots puedan ser útiles en los hogares. Las necesidades humanas cambian con el tiempo, y es importante enseñar a los robots a realizar de forma fiable una amplia gama de tareas, ya que les ayudará a adaptarse a nosotros. Este aspecto también es crucial para la comercialización: un robot doméstico de primera generación tendrá un precio elevado y deberá tener habilidades útiles para inducir a los consumidores a invertir en ellos.
Durante mucho tiempo, gran parte de la comunidad robótica se mostró muy escéptica ante este tipo de enfoques, afirma Chelsea Finn, profesora asistente de informática e ingeniería eléctrica en la Universidad de Stanford y consultora del proyecto Mobile ALOHA. Finn afirma que hace casi una década, los enfoques basados en el aprendizaje eran poco frecuentes en las conferencias sobre robótica y se denigraban en la comunidad robótica. “El auge [del procesamiento del lenguaje natural] ha convencido a una gran parte de la comunidad de que este enfoque es realmente muy poderoso”, afirma Finn. Pero hay un obstáculo: para imitar los nuevos comportamientos, los modelos de inteligencia artificial necesitan una gran cantidad de datos.
Artículo publicado originalmente en 17 Jul 2024