Esta semana, el MIT presentó un nuevo modelo para entrenar robots. En lugar del conjunto estándar de datos enfocados utilizados para enseñar a los robots nuevas tareas, el método es más amplio, imitando las enormes cantidades de información utilizadas para entrenar modelos de lenguaje grandes (LLMs).
Los investigadores señalan que el aprendizaje por imitación, en el que el agente aprende siguiendo a una persona realizando una tarea, puede fallar cuando se introducen pequeños desafíos. Estos podrían ser cosas como la iluminación, un entorno diferente u obstáculos nuevos. En esos escenarios, los robots simplemente no tienen suficientes datos sobre los que basarse para adaptarse.
El equipo se inspiró en modelos como GPT-4 para un enfoque de fuerza bruta en la resolución de problemas.
“En el dominio del lenguaje, todos los datos son solo oraciones”, dice Lirui Wang, autor principal del nuevo artículo. “En robótica, dada toda la heterogeneidad de los datos, si deseas preentrenar de manera similar, necesitamos una arquitectura diferente”.
El equipo introdujo una nueva arquitectura llamada Transformers Preentrenados Heterogéneos (HPT), que recopila información de diferentes sensores y entornos diferentes. Luego, se utilizó un transformador para unir los datos en modelos de entrenamiento. Cuanto más grande sea el transformador, mejor será la salida.
Los usuarios luego introducen el diseño del robot, su configuración y la tarea que desean que se realice.
“Nuestro sueño es tener un cerebro de robot universal que puedas descargar y usar en tu robot sin ningún entrenamiento”, dijo el profesor asociado de la CMU, David Held, sobre la investigación. “Aunque estamos en las primeras etapas, vamos a seguir esforzándonos y esperamos que la escalabilidad conduzca a un avance en las políticas robóticas, como lo hizo con los grandes modelos de lenguaje”.
La investigación fue financiada, en parte, por el Toyota Research Institute. El año pasado en TechCrunch Disrupt, TRI presentó un método para entrenar robots durante la noche. Más recientemente, logró una asociación histórica que unirá su investigación de aprendizaje de robots con hardware de Boston Dynamics.