본 논문은 심우주 탐사, 전장 정보, 복잡한 환경에서의 로봇 항해 등 통신 대역폭이 매우 낮은 환경에서 원격 시각 분석, 인간 상호 작용 및 제어를 위한 초저 비트 전송률 시각 통신 문제를 다룹니다. 기존 코딩 방식에서 비트 전송률의 극히 작은 부분만을 사용하여 시각 장면을 정확하게 재구성하면서도 시각 분석 정확도와 인간 상호 작용 성능을 유지할 수 있는지 질문합니다. 텍스트-이미지 생성 모델의 한계를 극복하기 위해, 이미지 생성을 딥 이미지 압축과 원활하게 통합하여 텍스트 및 코딩 잠재 변수를 사용하여 시각 장면을 정밀하게 생성하는 rectified flow 모델을 제안합니다. 실험 결과는 제안된 방법이 기존 방법에 비해 훨씬 적은 대역폭을 사용하면서도 동일한 이미지 재구성 품질과 시각 분석 정확도를 달성함을 보여줍니다.