Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Cet article vise à doter les modèles robotiques de capacités de réflexion de type humain, en s'inspirant de la façon dont les humains réfléchissent lentement avant d'agir lorsqu'ils effectuent des tâches complexes dans le monde physique. À cette fin, nous proposons Hume, un modèle double système vision-langage-action (VLA) avec une réflexion basée sur les valeurs du Système 2 et un débruitage des actions en cascade. Le Système 2 de Hume utilise une nouvelle tête de requête de valeur pour estimer la valeur état-action des actions prédites et met en œuvre une réflexion guidée par les valeurs qui échantillonne de manière répétée plusieurs actions candidates et en sélectionne une en fonction de cette valeur. Le Système 1 est une stratégie visuo-motrice réactive légère qui reçoit les actions sélectionnées par le Système 2 et effectue un débruitage des actions en cascade pour un contrôle agile du robot. Lors du déploiement, le Système 2 effectue une réflexion guidée par les valeurs à basse fréquence, tandis que le Système 1 reçoit de manière asynchrone les actions candidates sélectionnées par le Système 2 et prédit les actions fluides en temps réel. Les résultats expérimentaux montrent que Hume surpasse les modèles VLA de pointe existants sur plusieurs benchmarks de simulation et déploiements de robots réels.
Takeaways, Limitations
•
Takeaways:
◦
Appliquer le lent processus de pensée humaine au contrôle des robots pour améliorer la capacité à effectuer des tâches complexes.
◦
La réflexion axée sur les valeurs permet une sélection et une planification efficaces des actions.
◦
Maintenir un équilibre entre les performances en temps réel et les capacités de planification grâce à une architecture système double de Système 1 et Système 2.
◦
Excellente vérification des performances dans divers environnements de simulation et de robots réels.
•
Limitations:
◦
Des recherches supplémentaires sont nécessaires sur l’efficacité de l’apprentissage de la fonction de valeur du modèle proposé et ses performances de généralisation.
◦
D’autres évaluations de performance de généralisation sont nécessaires pour divers environnements de tâches complexes.
◦
Il peut y avoir des limites à la gestion parfaite de la complexité et de l’incertitude du monde réel.
◦
Problèmes de retard potentiels dus au fonctionnement à basse fréquence du système 2.