Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Réorganisation personnalisée d'objets robotiques à partir du contexte de la scène

Created by
  • Haebom

Auteur

Kartik Ramachandruni, Sonia Chernova

Contour

Dans cet article, nous présentons un nouveau benchmark PARSEC, qui apprend les préférences des utilisateurs pour placer des objets dans des environnements partiellement organisés afin de résoudre le problème de relocalisation d'objets pour les robots domestiques. PARSEC contient 110 000 exemples de relocalisation participative provenant de 72 utilisateurs, et propose 93 catégories d'objets et 15 environnements. Dans cet article, nous proposons ContextSortLM, un modèle de relocalisation personnalisé basé sur LLM qui gère les préférences flexibles des utilisateurs en considérant les objets pouvant être placés à différents endroits. Nous évaluons ContextSortLM et les approches de relocalisation personnalisée existantes sur le benchmark PARSEC, et évaluons la cohérence des prédictions du modèle avec les préférences des utilisateurs grâce à une évaluation participative réalisée par 108 évaluateurs en ligne. Nous démontrons ainsi que les modèles de relocalisation personnalisés utilisant plusieurs sources de contexte de scène sont plus performants que les modèles reposant sur une source de contexte unique. ContextSortLM reproduit mieux les placements des utilisateurs que les autres modèles et se classe parmi les deux premiers dans toutes les catégories d'environnement par les évaluateurs en ligne. Enfin, nous soulignons les défis liés à la modélisation de la signification environnementale dans différentes catégories environnementales et proposons des recommandations pour les recherches futures.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau benchmark, PARSEC, qui réorganise les objets en apprenant les préférences des utilisateurs, ce qui peut stimuler la recherche connexe.
Nous démontrons que les performances de relocalisation d’objets personnalisés peuvent être améliorées en utilisant le modèle ContextSortLM, qui prend en compte les objets pouvant être placés à différents endroits.
Nous démontrons expérimentalement que l’exploitation de plusieurs sources de contexte de scène surpasse une source de contexte unique.
Limitations:
Nous soulignons les défis liés à la modélisation de la signification environnementale dans diverses catégories environnementales et suggérons des orientations pour les recherches futures.
(Le Limitations spécifique n'est pas explicitement mentionné dans le document, mais la difficulté de modéliser la sémantique environnementale est considérée comme un Limitations majeur)
👍