Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Leveraging Text-Driven Semantic Variation for Robust OOD Segmentation

Created by
  • Haebom
Category
Empty

저자

Seungheon Song, Jaekoo Lee

개요

자율 주행 및 로봇 분야에서 OOD(Out-of-Distribution) 세분화를 위한 새로운 접근 방식을 제시합니다. 본 논문은 시각-언어 공간을 활용하여 복잡한 자율 주행 환경에서 OOD 객체를 효과적으로 감지하는 Text-Driven OOD Segmentation 모델을 제안합니다. 이 모델은 비전-언어 모델의 인코더와 변환기 디코더를 결합하고, 거리 기반 OOD 프롬프트와 OOD 의미론적 증강을 사용하여 시각적 정보와 텍스트 정보를 정렬합니다. 공개된 OOD 세분화 데이터셋에서 실험을 수행하여 픽셀 수준 및 객체 수준 평가 모두에서 SOTA(state-of-the-art) 성능을 달성하여 자율 주행 시스템의 안전성과 신뢰성을 향상시킬 가능성을 보여줍니다.

시사점, 한계점

시각-언어 모델을 활용하여 OOD 세분화 문제 해결
자율 주행 시스템의 안전성과 신뢰성 향상에 기여
다양한 OOD 세분화 데이터셋에서 SOTA 성능 달성
비전-언어 모델의 성능에 의존하며, 모델의 한계가 성능에 영향을 미칠 수 있음
실제 자율 주행 환경에서의 적용 가능성은 추가적인 연구가 필요함
계산 복잡성 및 모델의 배포와 관련된 문제점이 있을 수 있음
👍