Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Politique de transformateur de diffusion sur l'appareil pour une manipulation efficace des robots

Created by
  • Haebom

Auteur

Yiming Wu, Huan Wang, Zhenghao Chen, Jianxin Pang, Dong Xu

Contour

Cet article propose LightDP, un nouveau framework conçu pour accélérer le déploiement en temps réel des politiques de diffusion, confronté à des difficultés liées aux ressources limitées des appareils mobiles. LightDP s'attaque aux goulots d'étranglement informatiques grâce à deux stratégies clés : la compression réseau du module de débruitage et la réduction des étapes d'échantillonnage requises. Nous menons une analyse informatique approfondie des architectures de politiques de diffusion existantes afin d'identifier le réseau de débruitage comme principal contributeur à la latence. Pour pallier la dégradation des performances associée aux méthodes d'élagage existantes, nous introduisons un pipeline intégré d'élagage et de réentraînement qui optimise explicitement la résilience post-élagage du modèle. De plus, nous combinons les techniques d'élagage avec la distillation de cohérence afin de réduire efficacement les étapes d'échantillonnage tout en préservant la précision de la prédiction d'actions. Des évaluations expérimentales sur des jeux de données standard tels que PushT, Robomimic, CALVIN et LIBERO démontrent que LightDP atteint des performances compétitives pour la prédiction d'actions en temps réel sur appareils mobiles, ce qui représente une avancée significative vers le déploiement pratique de politiques basées sur la diffusion dans des environnements aux ressources limitées. Des expériences approfondies en situation réelle démontrent que le LightDP proposé atteint des performances comparables à celles des politiques de diffusion de pointe.

Takeaways, Limitations_

Takeaways:
Nous présentons un framework LightDP qui permet la distribution en temps réel des politiques de diffusion sur les appareils mobiles.
Résoudre les goulots d’étranglement informatiques grâce à la compression du réseau et à la réduction des étapes d’échantillonnage.
Atténuer la dégradation des performances après la taille grâce à un pipeline intégré de taille et de recyclage.
Réduisez les étapes d’échantillonnage et maintenez la précision grâce à la distillation de cohérence.
Obtenez une prédiction de mouvement en temps réel et des performances de pointe sur divers ensembles de données (PushT, Robomimic, CALVIN, LIBERO).
Limitations:
Les améliorations des performances de LightDP peuvent dépendre d’ensembles de données et d’architectures spécifiques.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la stratégie d’élagage et de recyclage proposée.
Des expériences supplémentaires sont nécessaires pour prendre en compte la diversité des tâches de manipulation de robots dans des environnements réels.
Manque d'analyse de la consommation énergétique.
👍