Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Reconnaissance probabiliste active des objectifs

Created by
  • Haebom

Auteur

Chenyuan Zhang, Cristian Rojas Cardenas, Hamid Rezatofighi, Mor Vered, Buser Say

Contour

Cet article aborde le problème de la reconnaissance d'objectifs dans les environnements multi-agents. Contrairement aux recherches précédentes sur la reconnaissance passive d'objectifs, nous nous concentrons sur la reconnaissance active d'objectifs (AGR) et proposons une méthode stratégique de collecte d'informations pour réduire l'incertitude. Basée sur un cadre probabiliste, nous présentons une solution intégrant un mécanisme conjoint de mise à jour des croyances et un algorithme de recherche arborescente de Monte-Carlo (MCTS). Cela permet une planification et une inférence efficaces des objectifs cachés des agents sans connaissance spécifique du domaine. Les résultats expérimentaux dans un domaine basé sur une grille démontrent que le mécanisme conjoint de mise à jour des croyances proposé surpasse la reconnaissance passive d'objectifs, et que l'algorithme MCTS indépendant du domaine présente des performances similaires à celles des lignes de base gloutonnes spécifiques au domaine. Cela démontre que la solution proposée constitue un cadre d'inférence d'objectifs pratique et robuste, jetant les bases de systèmes multi-agents plus interactifs et adaptatifs.

Takeaways, Limitations

Takeaways:
Nous présentons un cadre efficace et robuste pour la reconnaissance active des objectifs (AGR).
Permet l’inférence d’objectifs sans connaissance spécifique au domaine.
Vérification expérimentale de la supériorité du mécanisme de mise à jour des croyances conjointes.
Contribue à améliorer l'interaction et l'adaptabilité des systèmes multi-agents.
Limitations:
Les expériences ont été menées uniquement dans des domaines basés sur des grilles, ce qui nécessite des recherches supplémentaires sur la généralisabilité.
L'algorithme MCTS peut être complexe sur le plan informatique. Une optimisation supplémentaire est nécessaire pour les applications temps réel.
Il est nécessaire de vérifier les modèles comportementaux de divers agents et leur applicabilité à des environnements complexes.
👍