Trong bài báo này, chúng tôi đề xuất một khuôn khổ phục hồi lấy đối tượng làm trung tâm (OCR) để giải quyết những thách thức của các tình huống ngoài phân phối (OOD) trong học chính sách thị giác vận động. Trong khi các phương pháp sao chép hành động (BC) hiện tại phụ thuộc rất nhiều vào một lượng lớn dữ liệu được gắn nhãn và thất bại trong các điều kiện không gian không quen thuộc, OCR học một chính sách phục hồi bao gồm một chính sách nghịch đảo được suy ra từ các gradient đa tạp điểm chính của đối tượng trong dữ liệu huấn luyện ban đầu mà không cần thu thập thêm dữ liệu. Chính sách phục hồi này hoạt động như một phần bổ sung đơn giản cho bất kỳ chính sách BC thị giác vận động cơ sở nào, bất kể phương pháp cụ thể nào, và hướng dẫn hệ thống trở lại phân phối huấn luyện để đảm bảo thành công của nhiệm vụ ngay cả trong các tình huống OOD. Trong cả mô phỏng và thí nghiệm robot thực tế, chúng tôi chứng minh được sự cải thiện lên đến 77,7% so với chính sách cơ sở trong OOD, đồng thời chứng minh khả năng OCR tự động thu thập các bản demo để học liên tục. Chúng tôi lập luận rằng khuôn khổ này đại diện cho một bước tiến hướng tới việc cải thiện tính mạnh mẽ của các chính sách thị giác vận động trong môi trường thực tế.