[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SÉCURISÉ : Conversation incarnée consciente de la sémantique sous l'inconscience pour un apprentissage robotique tout au long de la vie

Created by
  • Haebom

Auteur

Rimvydas Rubacius, Peter David Fagan, Alex Lascarides, Subramanian Ramamoorthy

Contour

Cet article aborde un scénario complexe d'apprentissage interactif appelé « relocalisation aveugle », dans lequel l'agent doit manipuler un environnement rigide sans connaître les concepts clés nécessaires à la résolution de la tâche. Par exemple, un utilisateur peut demander à l'agent de « mettre deux pommes Granny Smith dans un panier », mais l'agent ne peut pas identifier précisément quel objet de l'environnement est une « Granny Smith », car il n'a jamais été exposé à ces concepts. Dans cet article, nous présentons SECURE, une stratégie d'apprentissage interactif conçue pour gérer de tels scénarios. Une caractéristique unique de SECURE est sa capacité à s'engager dans l'analyse sémantique lors du traitement des conversations incarnées et de la prise de décision. Grâce aux conversations incarnées, l'agent SECURE apprend des retours correctifs incarnés de l'utilisateur en cas d'erreur et s'engage stratégiquement dans les conversations pour découvrir des informations utiles sur de nouveaux concepts pertinents pour la tâche. Cette capacité permet à l'agent SECURE de généraliser ses connaissances acquises à de nouvelles tâches. Nous démontrons que les agents SECURE qui résolvent des relocalisations dans un environnement Blocksworld simulé et dans un environnement réel de manipulation de pommes sans connaissance sont plus efficaces en termes de données que les agents qui n'engagent ni conversation ni analyse sémantique.

Takeaways, Limitations_

Takeaways:
Une nouvelle méthode pour résoudre efficacement la tâche de relocalisation dans un état inconscient grâce à un dialogue mis en œuvre et à une analyse sémantique
Preuve expérimentale de l'efficacité des données des agents SECURE
Améliorer la capacité de l'agent à apprendre et à généraliser de nouveaux concepts.
Limitations:
Actuellement évalué uniquement dans des simulations et des environnements réels limités. Une vérification des performances dans des environnements plus diversifiés et complexes est nécessaire.
Forte dépendance aux retours des utilisateurs. Il est nécessaire d'améliorer la gestion des retours vagues ou inexacts.
Vérification de l'évolutivité requise pour les tâches complexes à grande échelle
👍