본 논문은 제한된 동적 범위를 가진 기존 이미지 센서의 문제를 해결하기 위해 고안된 모듈로 카메라의 신호 복원 기술에 초점을 맞춘다. 특히, 기존의 HDR 복원 방식이 모듈로 복원에 적합하지 않음을 지적하고, Transformer 기반의 새로운 딥러닝 프레임워크인 Selective Spatiotemporal Vision Transformer (SSViT)를 제안한다. SSViT는 토큰 선택 전략을 통해 효율성을 높이고 중요한 영역에 집중하여 8비트 접힌 비디오로부터 고품질의 복원을 수행하며, 모듈로 비디오 복원에서 최첨단 성능을 달성한다.