CREStE est un framework de navigation non supervisée, évolutif et basé sur l'apprentissage, qui répond aux défis de généralisation et de robustesse en monde ouvert pour la navigation urbaine en extérieur. La clé pour y parvenir réside dans l'apprentissage de représentations perceptuelles généralisables à des éléments d'ensembles ouverts (par exemple, de nouvelles classes sémantiques, des terrains, des objets dynamiques) et dans l'inférence de coûts de navigation cohérents avec les experts à partir de démonstrations limitées. CREStE répond à ces deux défis en introduisant un objectif de distillation de modèles visuels (VFM) pour l'apprentissage de représentations perceptuelles à vol d'oiseau structurées en ensembles ouverts et l'apprentissage par renforcement inverse contrefactuel (IRL). L'apprentissage par renforcement inverse contrefactuel est une nouvelle formule d'apprentissage actif qui utilise des démonstrations de trajectoires contrefactuelles pour déduire les indices les plus importants lors de l'inférence des coûts de navigation. CREStE est évalué sur des tâches de navigation non supervisées à l'échelle du kilomètre dans une variété d'environnements urbains, hors route et résidentiels, et il est démontré qu'il surpasse toutes les approches de pointe, avec une réduction de 70 % de l'intervention humaine et la capacité d'effectuer des missions de 2 km dans des environnements inexplorés avec une seule intervention.