USAM-Net은 자율 주행 및 증강 현실 분야의 정확한 심도 추정을 위해 설계된 새로운 합성곱 신경망입니다. 입력으로 스테레오 이미지와 의미론적 분할 맵을 사용하며, 어텐션 메커니즘을 통합하여 성능을 향상시킵니다. 이중 경로 아키텍처를 사용하여 사전 훈련된 분할 모델(SAM)과 심도 추정 모델을 결합합니다. 분할 경로는 스테레오 이미지를 전처리하여 의미론적 마스크를 생성하고, 이 마스크는 스테레오 이미지와 함께 심도 추정 경로의 입력으로 사용됩니다. DrivingStereo 데이터셋에서 기존 모델들(CFNet, SegStereo, iResNet)보다 우수한 성능(GD 3.61%, EPE 0.88)을 보였습니다.