Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Raisonnement rationnel inverse

Created by
  • Haebom

Auteur

Ben Zandonati, Tom dans le rôle de Lozano- Perez, Leslie Pack Kaelbling

Contour

Cet article soutient que, contrairement à la capacité humaine à apprendre à partir d'exemples isolés, les robots peinent à généraliser, arguant que cela est dû à leur incapacité à retrouver l'explication sous-jacente (programme latent) d'un comportement intelligent. Pour y remédier, nous proposons un cadre de raisonnement inverse rationnel (RIR) qui infère les programmes latents grâce à un modèle génératif hiérarchique du comportement. Le RIR aborde l'imitation par petites touches grâce à une approche bayésienne d'induction de programme, où un modèle vision-langage propose de manière itérative des hypothèses de tâches symboliques structurées, et un système d'inférence basé sur un planificateur évalue chaque hypothèse en fonction de la vraisemblance des exemples observés. Ce processus produit une probabilité a posteriori pour un programme concis et réalisable. Nous évaluons le RIR sur un ensemble de tâches de manipulation continue, en évaluant la généralisation par petites touches et par petites touches sur une variété de poses, de nombres, de formes géométriques et d'agencements d'objets. Nous démontrons que le RIR peut inférer la structure de tâche prévue et se généraliser à de nouveaux contextes à partir d'un seul exemple, surpassant ainsi les modèles vision-langage de référence de pointe.

Takeaways, Limitations

Takeaways:
Nous proposons la possibilité d'améliorer la capacité d'apprentissage à petite échelle du robot grâce au cadre RIR.
La combinaison d’un modèle de langage visuel avec un planificateur permet un apprentissage par imitation plus efficace.
Même une seule démonstration peut contribuer au développement d’un système de contrôle de robot généralisable.
Limitations:
Actuellement, l’évaluation est limitée aux tâches de fonctionnement continu et une vérification des performances dans des domaines de tâches plus divers est requise.
ÉTant donné que les performances du RIR dépendent des performances du planificateur, les limitations de l’algorithme de planification peuvent limiter les performances du RIR.
La généralisation à des tâches complexes ou à des tâches impliquant des interactions multi-objets nécessite des études plus approfondies.
👍