Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FFHFlow : Génération de saisie adroite diversifiée et sensible à l'incertitude via l'inférence variationnelle de flux

Created by
  • Haebom

Auteur

Qian Feng, Jianxiang Feng, Zhaopeng Chen, Rudolph Triebel, Alois Knoll

Contour

La synthèse de prises multi-doigts diversifiées et sensibles à l'incertitude à partir d'observations partielles reste un défi majeur pour l'apprentissage robotique. Les modèles génératifs existants peinent à modéliser la distribution complexe de la préhension des mains agiles et génèrent souvent des prises peu fiables ou trop conservatrices, ne prenant pas en compte l'incertitude de forme inhérente aux nuages ​​de points partiels. Dans cet article, nous proposons FFHFlow, un cadre variationnel basé sur l'écoulement qui génère des prises multi-doigts diversifiées et robustes tout en quantifiant explicitement l'incertitude perceptuelle à partir de nuages ​​de points partiels. La méthode proposée surmonte l'effondrement de mode et les contraintes a priori fixes des auto-encodeurs variationnels conditionnels (cVAE) en exploitant un modèle à variables latentes profondes régularisé basé sur l'écoulement pour apprendre une variété de prises hiérarchique. S'appuyant sur la réversibilité de l'écoulement et la vraisemblance précise, FFHFlow sonde en interne l'incertitude de forme à partir d'observations partielles et identifie de nouvelles structures d'objets, permettant ainsi une synthèse de prises sensibles aux aléas. Pour améliorer encore la fiabilité, nous intégrons la vraisemblance de l'écoulement à un estimateur d'adhérence discriminatif afin de développer une stratégie de classement tenant compte de l'incertitude et priorisant les adhérences résistantes à l'ambiguïté de forme. Des expériences approfondies en simulation et en environnement réel démontrent que FFHFlow surpasse les benchmarks de pointe (y compris les modèles de diffusion) en termes de diversité d'adhérence et de taux de réussite, tout en permettant un échantillonnage efficace à l'exécution. De plus, nous démontrons son utilité pratique dans des environnements complexes et contraints, où l'échantillonnage basé sur la diversité atténue les collisions et offre des performances supérieures (page du projet : https://sites.google.com/view/ffhflow/home/ ).

Takeaways, Limitations_

Takeaways:
Nous présentons une nouvelle méthode permettant de générer efficacement des prises multi-doigts diverses et sensibles à l'incertitude à partir d'observations partielles.
Nous surmontons l’effondrement du mode et le problème a priori fixe des méthodes existantes en utilisant un modèle basé sur le flux.
La prise en compte explicite de l’incertitude crée des prises de position plus stables et plus fiables.
Obtenez des performances de pointe dans des environnements simulés et réels.
Il fonctionne efficacement même dans des environnements complexes et contraints.
Limitations:
Les performances de la méthode proposée peuvent dépendre de l’ensemble de données utilisé et de la complexité du modèle.
Il est nécessaire d’améliorer encore les performances de généralisation dans les environnements réels.
Le coût de calcul peut être relativement élevé.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation sur différentes formes d’objets et matériaux.
👍