Dans cet article, nous proposons un cadre de récupération centrée sur l'objet (OCR) pour relever les défis des situations hors distribution (OOD) dans l'apprentissage des politiques visuomotrices. Alors que les méthodes de réplication d'actions (BC) existantes s'appuient fortement sur une grande quantité de données étiquetées et échouent dans des conditions spatiales inhabituelles, l'OCR apprend une politique de récupération consistant en une politique inverse déduite des gradients de la variété des points clés de l'objet des données d'apprentissage originales, sans collecte de données supplémentaires. Cette politique de récupération agit comme un simple complément à toute politique BC visuomotrice de base, quelle que soit la méthode utilisée, et ramène le système à la distribution d'apprentissage afin de garantir la réussite de la tâche, même dans les situations hors distribution. Dans les simulations et les expériences sur robot réel, nous démontrons une amélioration allant jusqu'à 77,7 % par rapport à la politique de base en OOD, et démontrons également la capacité de l'OCR à collecter de manière autonome des démos pour un apprentissage continu. Nous soutenons que ce cadre représente une avancée vers l'amélioration de la robustesse des politiques visuomotrices en environnements réels.