본 논문은 긴 비디오 생성 시 발생하는 KV 캐시 증가, 시간적 반복, 오류 누적 문제를 해결하기 위해 PackForcing이라는 통합 프레임워크를 제안합니다. PackForcing은 Sink, Mid, Recent 토큰으로 구성된 3분할 KV 캐시 전략을 사용하여 비디오 히스토리를 효율적으로 관리하며, 특히 Mid 토큰은 32배의 시공간 압축을 통해 메모리 사용량을 크게 줄입니다. 이를 통해 짧은 비디오 클립으로만 학습해도 2분 길이의 고품질 긴 비디오를 효율적으로 생성할 수 있습니다.