Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression
Created by
Haebom
저자
Hanyue Tu, Siqi Wu, Li Li, Wengang Zhou, Houqiang Li
개요
본 논문은 오토인코더 기반 학습 이미지 압축 방식의 한계점인 고비트율에서의 성능 저하 및 유연한 비트율 적응의 어려움을 극복하기 위해, 가역 변환 기반의 가변 비트율 이미지 압축 모델을 제시합니다. 경량화된 다중 스케일 가역 신경망을 설계하여 입력 이미지를 다중 스케일 잠재 표현으로 일대일 매핑하고, 확장 게인 유닛을 포함한 다중 스케일 공간-채널 컨텍스트 모델을 사용하여 잠재 표현의 엔트로피를 효율적으로 추정합니다. 실험 결과, 제시된 방법은 기존 가변 비트율 방식들보다 우수한 성능을 달성하며, 최근 다중 모델 접근 방식들과도 경쟁력을 유지합니다. 특히, 단일 모델로 매우 넓은 비트율 범위에서 VVC를 능가하는 최초의 학습 기반 이미지 압축 방식이며, 고비트율에서 특히 그 성능이 뛰어납니다. 소스 코드는 https://github.com/hytu99/MSINN-VRLIC 에서 확인 가능합니다.