Sign In

LeMiCa: Lexicographic Minimax Path Caching for Efficient Diffusion-Based Video Generation

Created by
  • Haebom
Category
Empty

저자

Huanlin Gao, Ping Chen, Fuyuan Shi, Chao Tan, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian

개요

LeMiCa는 확산 기반 비디오 생성을 위한 훈련이 필요 없고 효율적인 가속 프레임워크입니다. 기존 캐싱 전략이 국부적인 휴리스틱 오류 감소에 집중하는 반면, 전역 오류 축적을 간과하여 가속 비디오와 원본 비디오 간 콘텐츠 저하를 야기하는 문제를 해결합니다. 이를 위해, 캐시 스케줄링을 오류 가중치 엣지를 갖는 방향 그래프로 구성하고, 최악의 경우의 경로 오류를 명시적으로 제한하는 렉시코그래픽 미니맥스 경로 최적화 전략을 도입했습니다. LeMiCa는 추론 속도와 생성 품질 모두에서 향상을 제공하며, Latte 모델에서 2.9배 속도 향상, Open-Sora에서 0.05의 LPIPS 점수를 달성했습니다.

시사점, 한계점

시사점:
확산 기반 비디오 생성을 위한 훈련이 필요 없는 가속 프레임워크 제시.
전역 오류 축적 문제를 해결하여 일관성 있는 비디오 생성 가능.
속도와 생성 품질 모두 향상 (Latte 모델 2.9배 속도 향상, Open-Sora LPIPS 0.05).
기존 캐싱 기술보다 우수한 성능.
최소한의 지각적 품질 저하로 견고하고 일반화 가능한 패러다임 제시.
한계점:
논문 자체에서 명시된 한계점은 없음. (코드 공개)
👍