Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage de la manipulation pivotante avec retour de force et de vision à l'aide de démonstrations basées sur l'optimisation

Created by
  • Haebom

Auteur

Yuki Shirai, Kei Ota, Devesh K. Jha, Diego Romeres

Contour

Cet article présente un nouveau cadre combinant des approches basées sur des modèles et des approches basées sur l'apprentissage pour résoudre le problème de la manipulation non préhensile. En combinant l'efficacité des approches basées sur des modèles et la robustesse des approches basées sur l'apprentissage, nous obtenons un apprentissage efficace par échantillon en concevant un apprentissage par renforcement profond (RL) guidé par démonstration, basé sur une optimisation implicite de trajectoire de contact (CITO) à haute efficacité computationnelle, qui prend explicitement en compte les points de contact. De plus, nous présentons une approche de transfert de la simulation vers le réel utilisant une stratégie d'apprentissage privilégiée pour permettre à un robot d'effectuer une manipulation de pivot en utilisant uniquement la proprioception, la vision et la détection de force, sans informations privilégiées (par exemple, la masse, la taille ou la pose de l'objet). L'évaluation de plusieurs tâches de pivot démontre la mise en œuvre réussie du transfert de la simulation vers le réel. Pour plus de détails, consultez la vidéo disponible sur YouTube.

Takeaways, Limitations

Takeaways:
En combinant les avantages des approches basées sur les modèles et sur l’apprentissage, nous présentons une solution efficace et robuste au problème de manipulation sans contact.
Réalisez un apprentissage efficace grâce à l'échantillonnage grâce à CITO et au RL guidé par démonstration.
Nous présentons une méthode permettant de réaliser avec succès des transitions de la simulation vers la réalité sans informations privilégiées.
Nous vérifions les performances grâce à des résultats expérimentaux dans un système robotique réel.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer les performances de généralisation de la méthode proposée.
Il est nécessaire d’améliorer encore la robustesse face à une variété d’environnements et d’objets.
La dépendance des stratégies de formation des privilèges peut limiter l’évolutivité du système.
👍