Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Apprentissage par imitation hors ligne robuste grâce à l'assemblage de trajectoires au niveau de l'état
Created by
Haebom
Auteur
Shuze Wang, Yunpeng Mei, Hongjie Cao, Yetian Yuan, Gang Wang, Jian Sun, Jie Chen
Contour
Cet article présente une méthode d'apprentissage par imitation hors ligne qui exploite des données de faible qualité et non étiquetées pour pallier le manque de données expertes de haute qualité et le changement de covariable en apprentissage par imitation (AI). Plus précisément, nous introduisons un cadre de recherche basé sur les états qui relie les paires état-action à partir de données de démonstration incomplètes, générant ainsi des parcours d'apprentissage diversifiés et riches en informations. Les résultats expérimentaux démontrent que la méthode proposée améliore significativement la généralisation et les performances sur les tests d'AI standard et les tâches robotiques réelles.
Takeaways, Limitations
•
Takeaways:
◦
Nous présentons une nouvelle méthode pour améliorer l’efficacité des données de l’apprentissage par imitation en exploitant des données de faible qualité.
◦
Le cadre de récupération basé sur l’état permet la génération de données de formation plus diversifiées et plus riches en informations.
◦
Prouver la praticité en vérifiant les améliorations de performances dans les tâches robotiques réelles.
•
Limitations:
◦
Les améliorations de performance de la méthode proposée peuvent être limitées à des repères spécifiques et à des tâches robotiques.
◦
Les cadres de recherche basés sur l’état peuvent être coûteux en termes de calcul.
◦
Les évaluations des performances de généralisation sur différents types de données de faible qualité peuvent faire défaut.