Pullback Flow Matching (PFM)은 데이터 다양체 상에서의 생성 모델링을 위한 새로운 프레임워크입니다. 기존의 Riemannian Flow Matching (RFM) 모델 훈련을 위해 제한적인 폐쇄형 다양체 매핑을 가정하거나 학습하는 방법과 달리, PFM은 풀백 기하학과 등거리 학습을 활용하여 기저 다양체의 기하학을 보존하면서 효율적인 생성과 잠재 공간에서의 정밀한 보간을 가능하게 합니다. 이러한 접근 방식은 데이터 다양체 상에서 폐쇄형 매핑을 용이하게 할 뿐만 아니라, 데이터와 잠재 다양체 모두에서 가정된 메트릭을 사용하여 설계 가능한 잠재 공간을 허용합니다. Neural ODE를 통해 등거리 학습을 향상시키고 확장 가능한 훈련 목표를 제안함으로써, 보간에 더 적합한 잠재 공간을 달성하여 향상된 다양체 학습 및 생성 성능을 얻습니다. 합성 데이터, 단백질 역학 및 단백질 서열 데이터에 대한 응용을 통해 PFM의 효과를 보여주며, 특정 특성을 가진 새로운 단백질을 생성합니다. 이 방법은 특정 특성을 가진 새로운 샘플을 생성하는 것이 중요한 약물 발견 및 재료 과학 분야에 강력한 잠재력을 보여줍니다.