Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
De la Tabula Rasa aux capacités émergentes : découvrir les compétences des robots grâce à la diversité de qualité non supervisée du monde réel
Created by
Haebom
Auteur
Luca Grillotti (AIRL, Imperial College London), Lisa Coiffard (AIRL, Imperial College London), Oscar Pang (AIRL, Imperial College London), Maxence Faldor (AIRL, Imperial College London), Antoine Cully (AIRL, Imperial College London)
Contour
Cet article vise à permettre la découverte autonome de compétences, permettant aux robots d'acquérir divers comportements sans supervision explicite. Les méthodes QDAC (Qualité-Diversité Acteur-Critique) existantes nécessitent des espaces de compétences définis manuellement et des heuristiques soigneusement ajustées, ce qui limite leur application pratique. Dans cet article, nous proposons l'acquisition non supervisée de compétences en monde réel (URSA), une extension de QDAC, permettant aux robots de découvrir et de maîtriser de manière autonome des compétences diverses et performantes en environnements réels. Nous démontrons qu'URSA découvre avec succès diverses compétences de locomotion pour le robot quadrupède Unitree A1, tant en environnements simulés que réels. Elle prend en charge à la fois la découverte de compétences basée sur des heuristiques et les environnements d'apprentissage entièrement non supervisés, démontrant que les compétences acquises peuvent être réutilisées pour des tâches ultérieures telles que l'adaptation aux dommages en conditions réelles. Nous démontrons qu'URSA surpasse les modèles de base dans des scénarios de dommages réels, présentant un nouveau cadre d'apprentissage robotique en conditions réelles qui permet la découverte continue de compétences avec une intervention humaine limitée.
Takeaways, Limitations
•
Takeaways:
◦
Un nouveau cadre pour la découverte et la maîtrise autonomes de compétences par des robots dans des environnements réels.
◦
Répondre au besoin de définition manuelle de l'espace de compétences et de réglage heuristique dans les QDAC Limitations
◦
Prend en charge les environnements d'apprentissage basés sur l'heuristique et entièrement non supervisés
◦
Preuve de la réutilisabilité des compétences acquises dans des tâches ultérieures, y compris l’adaptation aux dommages du monde réel.
◦
Contribue à améliorer l'autonomie et l'adaptabilité des systèmes robotiques du monde réel
•
Limitations:
◦
Seuls les résultats expérimentaux pour le robot quadrupède Unitree A1 sont présentés, et des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité à d'autres plates-formes robotiques.
◦
L’échelle et la diversité des expériences du monde réel peuvent être limitées.
◦
En raison de la nature de l’apprentissage non supervisé, il existe une possibilité d’imprévisibilité et de problèmes de stabilité dans le processus d’apprentissage.