본 논문은 다양한 분야(의료, 도시 환경 분석, 원격 감지)에서 활용 가능성이 높은 분광 이미징의 한계점을 해결하기 위해, 카메라 종류에 상관없이 사용 가능한(Camera-Agnostic) 모델 CARL을 제안합니다. CARL은 RGB, 다중분광, 초분광 이미징 모드를 아우르는 카메라 독립적인 표현 학습 모델이며, 파장 위치 인코딩과 자기-교차 주의 메커니즘을 통해 다양한 채널 차원의 분광 이미지를 카메라에 독립적인 임베딩으로 변환합니다. 또한, JEPA(Joint Embedding Predictive Architecture)에서 영감을 받은 새로운 분광 자기 지도 학습 전략을 통해 대규모 데이터셋으로 사전 학습을 수행합니다. 의료 영상, 자율 주행, 위성 영상 등 다양한 분야에서의 실험 결과, CARL은 다양한 분광 카메라 간의 차이에도 강건한 성능을 보이며 기존 모델들을 능가하는 결과를 보여줍니다. 이러한 확장성과 다양성을 바탕으로 CARL은 향후 분광 기반 모델의 기본 모델로 자리매김할 것으로 기대됩니다.