본 논문은 약지도 단안 3D 객체 검출을 위한 새로운 방법인 CA-W3D를 제안합니다. 기존 방법들이 객체 중심 특징에 집중하여 복잡한 장면에서 중요한 상황적 의미 관계를 무시하는 한계를 극복하기 위해, 두 단계의 학습 과정을 제시합니다. 첫 번째 단계에서는 Region-wise Object Contrastive Matching (ROCM)을 이용하여 단안 3D 인코더와 고정된 개방형 어휘 2D 시각적 근거 모델 간의 지역적 객체 임베딩을 정렬하여, 단안 인코더가 장면 특정 속성을 식별하고 풍부한 상황적 지식을 획득하도록 합니다. 두 번째 단계에서는 Dual-to-One Distillation (D2OD) 메커니즘을 사용한 의사 레이블 학습 과정을 통해 상황적 사전 정보를 단안 인코더에 효과적으로 전달하면서 공간 정확도를 유지하고 추론 과정의 계산 효율성을 유지합니다. KITTI 벤치마크 실험 결과, 제안된 방법이 기존 최고 성능(SoTA) 방법을 모든 지표에서 능가함을 보여주며, 약지도 단안 3D 객체 검출에서 상황 인식 지식의 중요성을 강조합니다.