Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

CREStE : Navigation évolutive sans mappage avec priori d'échelle Internet et guidage contrefactuel

Created by
  • Haebom

Auteur

Arthur Zhang, Harshit Sikchi, Amy Zhang, Joydeep Biswas

Contour

CREStE est un framework de navigation non supervisée, évolutif et basé sur l'apprentissage, qui répond aux défis de généralisation et de robustesse en monde ouvert pour la navigation urbaine en extérieur. La clé pour y parvenir réside dans l'apprentissage de représentations perceptuelles généralisables à des éléments d'ensembles ouverts (par exemple, de nouvelles classes sémantiques, des terrains, des objets dynamiques) et dans l'inférence de coûts de navigation cohérents avec les experts à partir de démonstrations limitées. CREStE répond à ces deux défis en introduisant un objectif de distillation de modèles visuels (VFM) pour l'apprentissage de représentations perceptuelles à vol d'oiseau structurées en ensembles ouverts et l'apprentissage par renforcement inverse contrefactuel (IRL). L'apprentissage par renforcement inverse contrefactuel est une nouvelle formule d'apprentissage actif qui utilise des démonstrations de trajectoires contrefactuelles pour déduire les indices les plus importants lors de l'inférence des coûts de navigation. CREStE est évalué sur des tâches de navigation non supervisées à l'échelle du kilomètre dans une variété d'environnements urbains, hors route et résidentiels, et il est démontré qu'il surpasse toutes les approches de pointe, avec une réduction de 70 % de l'intervention humaine et la capacité d'effectuer des missions de 2 km dans des environnements inexplorés avec une seule intervention.

Takeaways, Limitations

Takeaways:
Présentation d'une solution efficace et robuste au problème de l'exploration urbaine en plein air en monde ouvert.
Inférence efficace des coûts d'apprentissage et d'exploration via la distillation de modèles visuels et l'apprentissage par renforcement inverse contrefactuel
Efficacité élevée démontrée avec une intervention humaine réduite de 70 % par rapport aux méthodes existantes
Exploration longue distance réussie dans un environnement inconnu (mission de 2 km, 1 intervention)
Limitations:
Le __T4150_____ spécifique n'est pas explicitement mentionné dans l'article. Des expériences supplémentaires et des évaluations des performances dans divers environnements pourraient être nécessaires.
Des analyses plus approfondies sont nécessaires sur les performances de généralisation de la distillation VFM et de l'IRL contrefactuel.
La possibilité de vulnérabilité à un environnement ou à une situation spécifique.
👍