Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Planification hiérarchique orientée objet POMDP pour la réorganisation des objets

Created by
  • Haebom

Auteur

Rajesh Manganvar, Alan Fern, Prasad Tadepalli

Contour

Cet article présente un cadre de planification en ligne et un nouvel ensemble de données de référence pour résoudre le problème de relocalisation multi-objets dans des environnements multispatiaux partiellement observables. Les solutions de relocalisation d'objets existantes, basées sur l'apprentissage par renforcement ou sur des méthodes de planification codées manuellement, manquent souvent d'adaptabilité à divers problèmes. Pour pallier ces limitations, cet article propose une approche de planification par processus de décision markovien hiérarchique orienté objet partiellement observable (HOO-POMDP). Cette approche comprend (a) un planificateur POMDP orienté objet générant des sous-objectifs, (b) un ensemble de politiques de bas niveau pour atteindre ces sous-objectifs, et (c) un système d'abstraction transformant le monde continu de bas niveau en une représentation adaptée à la planification abstraite. Pour permettre une évaluation rigoureuse du problème de relocalisation, nous présentons MultiRoomR, un benchmark complet présentant divers environnements multispatiaux (observabilité partielle de 10 à 30 %, chemins bloqués, cibles occultées et 10 à 20 objets répartis dans 2 à 4 pièces). Les résultats expérimentaux démontrent que le système proposé gère efficacement ces scénarios complexes malgré une perception imparfaite et obtient des résultats prometteurs à la fois sur les benchmarks existants et sur le nouvel ensemble de données MultiRoomR.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau cadre de planification en ligne et un ensemble de données de référence (MultiRoomR) pour les problèmes de relocalisation multi-objets dans des environnements multi-pièces partiellement observables.
Adaptabilité améliorée à divers problèmes grâce à une approche de planification hiérarchique orientée objet POMDP (HOO-POMDP).
Mettre en œuvre un système efficace qui présente des performances robustes même avec une reconnaissance imparfaite.
Des résultats prometteurs ont été obtenus sur les benchmarks existants et sur le nouvel ensemble de données MultiRoomR.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Un examen plus approfondi de la diversité et de la portée de l’ensemble de données MultiRoomR est nécessaire.
Une évaluation des applications et des performances des systèmes robotiques réels est nécessaire.
Une analyse de la complexité informatique et de l’évolutivité est nécessaire.
👍