본 논문은 로봇의 지속적 학습에서 변화하는 환경과 과제에 지속적으로 적응하는 시스템을 구현하는 것을 목표로 합니다. 기존의 접근 방식과 달리, 잘못 정렬된 모델을 사용하여 탐색하는 대신, 계획된 행동 자체를 변환하여 모델과의 정렬을 개선하는 생성적 프레임워크를 제시합니다. 이는 흐름 일치(flow matching)를 활용하여 온라인으로 로봇 역학 모델을 정렬합니다. 이를 통해 로봇은 더 효율적으로 정보가 풍부한 데이터를 수집하여 학습 속도를 높이고, 진화하고 불완전할 수 있는 모델을 처리하며, 리플레이 버퍼 또는 기존 모델 스냅샷에 대한 의존성을 줄일 수 있습니다. 무인 지상 차량과 쿼드로터를 사용한 실험 결과, 기존 방식보다 34.2% 높은 작업 성공률을 달성하여 방법의 적응성과 효율성을 입증했습니다.