Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Segment Any Vehicle: Semantic and Visual Context Driven SAM and A Benchmark

Created by
  • Haebom

저자

Xiao Wang, Ziwen Wang, Wentao Wu, Anjie Wang, Jiashu Wu, Yantao Pan, Chenglong Li

개요

본 논문은 자율주행을 위한 정밀한 차량 부품 분할을 목표로, Segment Anything Model (SAM)의 한계를 극복하는 새로운 프레임워크 SAV를 제안합니다. SAV는 SAM 기반 인코더-디코더, 차량 부품 지식 그래프, 그리고 컨텍스트 샘플 검색 인코딩 모듈의 세 가지 핵심 구성 요소로 이루어져 있습니다. 지식 그래프는 차량 부품 간의 공간적 및 기하학적 관계를 명시적으로 모델링하여 사전 구조적 지식을 효과적으로 인코딩하고, 컨텍스트 검색 모듈은 훈련 데이터에서 시각적으로 유사한 차량 인스턴스를 식별하고 활용하여 일반화 성능을 향상시킵니다. 또한, 다양한 장면과 관점에 걸쳐 11,665개의 고품질 픽셀 수준 주석이 포함된 새로운 대규모 벤치마크 데이터셋 VehicleSeg10K를 소개하며, 여러 기준 모델에 대한 종합적인 실험 결과를 제시합니다.

시사점, 한계점

시사점:
SAM의 한계를 극복하여 정밀한 차량 부품 분할을 가능하게 하는 새로운 프레임워크 SAV 제시.
차량 부품 간의 공간적 및 기하학적 관계를 모델링하는 지식 그래프와 컨텍스트 정보 활용으로 성능 향상.
대규모 차량 부품 분할 데이터셋 VehicleSeg10K 공개를 통한 연구 활성화.
향후 연구 및 비교를 위한 견고한 기반 마련.
한계점:
VehicleSeg10K 데이터셋과 소스 코드는 논문 수락 후 공개 예정.
SAM의 text-prompted segmentation 기능 미활용. (공개되지 않은 기능에 대한 의존성)
다양한 기상 조건이나 밤과 같은 특수한 조명 환경에 대한 로버스트 성능 평가 부족 가능성.
실제 자율주행 환경에서의 실시간 성능 평가 부족 가능성.
👍