Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

De la Tabula Rasa aux capacités émergentes : découvrir les compétences des robots grâce à la diversité de qualité non supervisée du monde réel

Created by
  • Haebom

Auteur

Luca Grillotti (AIRL, Imperial College London), Lisa Coiffard (AIRL, Imperial College London), Oscar Pang (AIRL, Imperial College London), Maxence Faldor (AIRL, Imperial College London), Antoine Cully (AIRL, Imperial College London)

Contour

Cet article se concentre sur la découverte autonome de compétences, où les robots acquièrent divers comportements sans supervision explicite. Les méthodes QDAC (Qualité-Diversité Acteur-Critique) existantes reposent sur des espaces de compétences définis manuellement et des heuristiques soigneusement ajustées, ce qui limite leur applicabilité en situation réelle. Dans cet article, nous proposons l'acquisition non supervisée de compétences en situation réelle (URSA), une extension de QDAC. URSA permet aux robots de découvrir et de maîtriser de manière autonome des compétences diverses et performantes en situation réelle. Grâce à des simulations et des expériences en situation réelle utilisant le robot quadrupède Unitree A1, nous démontrons la réussite de la découverte de diverses compétences de locomotion, prenant en charge à la fois la découverte de compétences basée sur des heuristiques et des environnements d'apprentissage entièrement non supervisés. De plus, en réutilisant les compétences acquises pour des tâches en aval, telles que l'adaptation aux dommages en situation réelle, nous démontrons qu'URSA surpasse les méthodes existantes dans cinq scénarios de simulation sur neuf et trois scénarios en situation réelle sur cinq. Cela présente un nouveau cadre pour l’apprentissage robotique du monde réel qui permet une découverte technologique continue avec une intervention humaine limitée, marquant une étape importante vers des systèmes robotiques plus autonomes et adaptatifs.

Takeaways, Limitations_

Takeaways:
Un nouveau cadre pour la découverte et la maîtrise autonomes des compétences des robots dans le monde réel (URSA) est présenté.
Résolution des problèmes de définition manuelle et de réglage heuristique qui constituent des limitations des méthodes QDAC existantes.
Prend en charge les environnements d'apprentissage basés sur l'heuristique et entièrement non supervisés.
A démontré des performances supérieures par rapport aux méthodes existantes dans les tâches en aval telles que l'adaptation aux dommages dans le monde réel.
Une découverte technologique continue possible avec une intervention humaine limitée.
Présentation de résultats expérimentaux utilisant un robot réel (Unitree A1).
Limitations:
Une validation supplémentaire des performances de généralisation d'URSA est nécessaire (évaluation des performances sur diverses plates-formes et environnements robotiques).
Une révision de l’évolutivité est nécessaire pour les tâches complexes ou les découvertes technologiques plus diverses.
Une évaluation de la robustesse est nécessaire pour les situations inattendues qui peuvent survenir dans les applications du monde réel.
Des recherches sont nécessaires pour améliorer l’efficacité du processus d’apprentissage et réduire le temps d’apprentissage.
👍