본 논문은 기존의 이산 토큰화 기법의 불안정한 학습, 낮은 코드북 활용률, 제한적인 재구성 품질 문제를 해결하기 위해, 연속 VAE를 이산 토큰화 기법으로 변환하는 CODA(Continuous-to-Discrete Adaptation) 프레임워크를 제안합니다. CODA는 압축과 이산화 과정을 분리하여, 이미 시각적 압축에 최적화된 연속 VAE를 활용함으로써 안정적이고 효율적인 학습을 가능하게 합니다. ImageNet 256x256 벤치마크에서 VQGAN보다 6배 적은 학습 비용으로 100%의 코드북 활용률과 8배 및 16배 압축에서 각각 0.43과 1.34의 뛰어난 rFID(재구성 FID)를 달성했습니다.