Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Interacción humano-objeto a partir de instrucciones de nivel humano

Created by
  • Haebom

Autor

Zhen Wu, Jiaman Li, Pei Xu, C. Karen Liu

Describir

Este artículo propone un sistema para agentes inteligentes que interactúan de forma autónoma con su entorno para realizar tareas rutinarias siguiendo instrucciones de nivel humano. Este sistema requiere una comprensión fundamental del mundo para interpretar con precisión las instrucciones de nivel humano, así como habilidades precisas de movimiento e interacción de bajo nivel para ejecutar las acciones derivadas. Presentamos el primer sistema completo que sintetiza interacciones humano-objeto físicamente plausibles y a largo plazo para la manipulación de objetos en entornos contextuales. Aprovechando un modelo de lenguaje a gran escala (LLM), interpretamos las instrucciones de entrada en planes de ejecución detallados. A diferencia de trabajos anteriores, generamos interacciones dedo-objeto que se coordinan a la perfección con los movimientos de cuerpo completo. Además, entrenamos una política que rastrea los movimientos generados a partir de simulaciones físicas mediante aprendizaje por refuerzo (RL) para garantizar la plausibilidad física de los movimientos. Los resultados experimentales demuestran la eficacia del sistema para sintetizar interacciones realistas con diversos objetos en entornos complejos, lo que destaca su potencial para aplicaciones prácticas.

Takeaways, Limitations

Takeaways:
Proponemos el primer sistema completo que entiende instrucciones de nivel humano y sintetiza interacciones humano-objeto físicamente plausibles a largo plazo.
Cree interacciones realistas a través de una coordinación suave de las interacciones entre los dedos y los objetos y de los movimientos de todo el cuerpo.
Entrenamiento de políticas que asegura la validez física a través del aprendizaje de refuerzo.
Demostrar aplicabilidad práctica a través de experimentos con diversos objetos y entornos complejos.
Limitations:
No se establecen explícitamente las limitaciones de la aplicabilidad del sistema actual en el mundo real.
Se necesita más investigación para determinar la versatilidad y aplicabilidad del sistema a diversas tareas.
Existe la posibilidad de errores debido a errores de interpretación en LLM o limitaciones de la simulación física.
👍