G-CUT3R은 사전 정보를 통합하여 CUT3R 모델을 향상시키는 가이드 3D 장면 재구성을 위한 새로운 피드-포워드 접근법을 제시합니다. 입력 이미지에만 의존하는 기존 피드-포워드 방식과 달리, 깊이, 카메라 캘리브레이션, 카메라 위치 등 실제 시나리오에서 흔히 사용되는 보조 데이터를 활용합니다. 각 모달리티에 대한 전용 인코더를 통합하고, 제로 컨볼루션을 통해 RGB 이미지 토큰과 융합하는 CUT3R에 대한 경량화된 수정 사항을 제안합니다. 이러한 유연한 설계를 통해 추론 중 모든 사전 정보 조합을 원활하게 통합할 수 있습니다. 3D 재구성을 포함한 여러 벤치마크 및 다중 뷰 작업에서 평가한 결과, 제안된 접근 방식은 상당한 성능 향상을 보이며, 사용 가능한 사전 정보를 효과적으로 활용하고 다양한 입력 모달리티와 호환성을 유지할 수 있음을 보여줍니다.