Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

X-Sim : Apprentissage inter-incarnations via la conversion du réel au réel

Created by
  • Haebom

Auteur

Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury

Contour

Cet article propose un cadre de simulation réel-simulation réel-simulation réel, appelé X-Sim. Au lieu d'imiter le mouvement humain, X-Sim extrait le mouvement des objets à partir d'images RGBD afin de définir des récompenses centrées sur l'objet, qui sont ensuite utilisées pour entraîner un agent d'apprentissage par renforcement (RL). La politique apprise est transformée en une politique de diffusion conditionnelle à l'image à l'aide de déploiements synthétiques rendus avec différents points de vue et éclairages. Pour le transfert vers l'environnement réel, nous alignons les observations réelles et simulées grâce à l'adaptation de domaine en ligne. Nous démontrons une amélioration moyenne de 30 % des performances sur cinq tâches de manipulation sans nécessiter de données de téléopération robotique, obtenons les mêmes performances avec un temps d'acquisition de données 10 fois inférieur aux méthodes existantes et démontrons une bonne généralisation à de nouveaux points de vue de caméra et à de nouveaux temps de test.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’apprentissage des politiques de manipulation des robots est possible sans imiter le mouvement humain.
Amélioration des performances de transfert réel-simulation à l'aide d'une compensation centrée sur l'objet.
Augmenter l’applicabilité dans le monde réel grâce à des techniques d’adaptation de domaine en ligne.
Réduisez le temps de collecte des données et améliorez les performances de généralisation.
Limitations:
Dépend des données d'image RGBD.
Ce n’est pas une solution parfaite pour combler l’écart entre les environnements simulés et réels.
Les performances de généralisation à des tâches autres que les cinq tâches de manipulation présentées nécessitent une validation supplémentaire.
👍