Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models

Created by
  • Haebom

저자

Runqian Wang, Yilun Du

개요

Equilibrium Matching (EqM)은 평형 동역학 관점에서 구축된 생성 모델링 프레임워크입니다. 전통적인 확산 및 흐름 기반 생성 모델의 비평형, 시간 조건부 동역학을 버리고 암묵적 에너지 랜드스케이프의 평형 기울기를 학습합니다. 이 접근 방식을 통해, 조절 가능한 스텝 크기, 적응형 옵티마이저, 적응형 연산을 사용하여 학습된 랜드스케이프에서 경사 하강법을 통해 샘플을 얻는 최적화 기반 샘플링 프로세스를 추론 시간에 채택할 수 있습니다. EqM은 ImageNet 256$\times$256에서 FID 1.90을 달성하여, 경험적으로 확산/흐름 모델의 생성 성능을 능가합니다. 또한 EqM은 데이터 매니폴드에서 학습하고 샘플링하는 것으로 이론적으로 정당화됩니다. 생성 외에도, EqM은 부분적으로 노이즈가 있는 이미지 디노이징, OOD 감지, 이미지 구성을 포함한 작업을 자연스럽게 처리하는 유연한 프레임워크입니다. 시간 조건부 속도를 통합된 평형 랜드스케이프로 대체함으로써, EqM은 흐름 및 에너지 기반 모델 간의 더 강력한 연결고리를 제공하며, 최적화 기반 추론으로의 간단한 경로를 제시합니다.

시사점, 한계점

시사점:
확산/흐름 모델보다 우수한 생성 성능을 달성했습니다 (ImageNet 256x256에서 FID 1.90).
데이터 매니폴드에서 학습하고 샘플링하는 것이 이론적으로 정당화되었습니다.
부분 노이즈 이미지 디노이징, OOD 감지, 이미지 구성과 같은 다양한 작업에 적용 가능합니다.
흐름 및 에너지 기반 모델 간의 연결고리를 강화하고, 최적화 기반 추론 방식을 제시합니다.
한계점:
논문에서 구체적인 한계점에 대한 언급은 없습니다. (논문 요약 내용에는 포함되어 있지 않습니다.)
👍