본 논문은 나노광학 분야에서 파운데이션 모델의 발전을 제한하는 대규모 데이터셋 부족 문제를 해결하기 위해, 메타표면 기하학 및 스펙트럼 정보를 통합하는 MOCLIP(Metasurface Optics Contrastive Learning Pretrained) 모델을 제시합니다. MOCLIP은 실험적으로 획득한 데이터셋을 사용하여 기하학적 표현과 스펙트럼 표현을 공유 잠재 공간에 정렬하는 대조 학습을 활용합니다. 이 모델은 초당 0.2백만 개의 샘플 속도로 고속 제로샷 예측을 수행하여, 4인치 웨이퍼에 고밀도 메타표면을 분 단위로 설계할 수 있게 합니다. 또한, 생성적 잠재 공간 최적화를 통해 97%의 정확도를 달성하며, 상업적 광학 매체를 능가하는 0.1 Gbit/mm² 밀도의 광학 정보 저장 개념을 제시합니다.