Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

UAD: Destilación de Affordance no supervisada para la generalización en manipulación robótica

Created by
  • Haebom

Autor

Yihe Tang, Wenlong Huang, Yingke Wang, Chengshu Li, Roy Yuan, Ruohan Zhang, Jiajun Wu, Li Fei-Fei

Describir

Este artículo destaca la importancia de comprender las affordances de objetos de grano fino para la manipulación robótica de objetos en entornos no estructurados. Los métodos existentes de predicción de características visuales están limitados por su dependencia de datos anotados manualmente o por sus limitaciones, que los limitan a un conjunto de tareas predefinido. En respuesta, presentamos la Destilación de Affordance No Supervisada (UAD), un método que destila el conocimiento de las características de un modelo base en un modelo de características condicional a la tarea sin ninguna anotación manual. Aprovechando las fortalezas complementarias de los modelos de visión a gran escala y los modelos de visión-lenguaje, UAD anota automáticamente un gran conjunto de datos de pares . Al entrenar un decodificador ligero condicional a la tarea en características fijas, UAD demuestra un rendimiento de generalización notable en entornos robóticos del mundo real y diversas actividades humanas, a pesar de haber sido entrenado únicamente con objetos renderizados en simulaciones. Utilizando las características proporcionadas por UAD como espacio de observación, proponemos una política de aprendizaje por imitación que demuestra un rendimiento de generalización prometedor en instancias de objetos no vistos, categorías de objetos y variaciones en las instrucciones de la tarea, incluso después del entrenamiento con solo 10 ejemplares.

Takeaways, Limitations

Takeaways:
Habilite el aprendizaje automático anotando grandes conjuntos de datos sin anotación manual.
Utilizando el modelo básico para asegurar el rendimiento de generalización a entornos reales utilizando únicamente datos de simulación.
El rendimiento de generalización para objetos nuevos e instrucciones de tareas se demuestra con solo una pequeña cantidad de ensayos de aprendizaje ejemplares.
Sugiere aplicabilidad a la manipulación de robots reales mediante la combinación con una política de aprendizaje por imitación.
Limitations:
Puede haber un problema de brecha de dominio con el entorno real debido a la dependencia de los datos de simulación.
Depende del rendimiento del modelo base, y las limitaciones del modelo base pueden afectar el rendimiento de UAD.
Las limitaciones del rendimiento de generalización en diferentes objetos y tareas requieren más estudios.
👍