Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

UAD : Distillation d'affordance non supervisée pour généralisation en manipulation robotique

Created by
  • Haebom

Auteur

Yihe Tang, Wenlong Huang, Yingke Wang, Chengshu Li, Roy Yuan, Ruohan Zhang, Jiajun Wu, Li Fei-Fei

Contour

Cet article souligne l'importance de comprendre les affordances d'objets à granularité fine pour la manipulation robotique d'objets dans des environnements non structurés. Les méthodes de prédiction de caractéristiques visuelles existantes sont limitées par leur dépendance à des données annotées manuellement ou par leurs limitations, qui les limitent à un ensemble de tâches prédéfini. En réponse, nous présentons la distillation d'affordance non supervisée (UAD), une méthode qui distille la connaissance des caractéristiques d'un modèle de base vers un modèle de caractéristiques conditionnel à la tâche, sans aucune annotation manuelle. Tirant parti des atouts complémentaires des modèles de vision à grande échelle et des modèles vision-langage, l'UAD annote automatiquement un vaste ensemble de données de paires . En entraînant un décodeur conditionnel à la tâche léger sur des caractéristiques fixes, l'UAD démontre des performances de généralisation remarquables dans des environnements robotiques réels et diverses activités humaines, bien qu'elle ne soit entraînée que sur des objets rendus dans les simulations. En utilisant les fonctionnalités fournies par UAD comme espace d'observation, nous proposons une politique d'apprentissage par imitation qui démontre des performances de généralisation prometteuses sur des instances d'objets invisibles, des catégories d'objets et des variations dans les instructions de tâches, même après une formation sur seulement 10 exemples.

Takeaways, Limitations

Takeaways:
Activez l’apprentissage de l’affordance en annotant automatiquement de grands ensembles de données sans annotation manuelle.
Utilisation du modèle de base pour garantir les performances de généralisation aux environnements réels en utilisant uniquement des données de simulation.
Les performances de généralisation à de nouveaux objets et instructions de tâches sont démontrées avec seulement un petit nombre d'essais d'apprentissage exemplaires.
Cela suggère l'applicabilité à la manipulation de robots réels grâce à une combinaison avec une politique d'apprentissage par imitation.
Limitations:
Il peut y avoir un problème d’écart de domaine avec l’environnement réel en raison de la dépendance aux données de simulation.
Cela dépend des performances du modèle de base, et les limitations du modèle de base peuvent affecter les performances de l'UAD.
Les limites des performances de généralisation sur différents objets et tâches nécessitent une étude plus approfondie.
👍