Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

NERVE: Neighbourhood & Entropy-guided Random-walk for training free open-Vocabulary sEgmentation

Created by
  • Haebom
Category
Empty

저자

Kunal Mahatha, Jose Dolz, Christian Desrosiers

개요

Nerve (Neighbourhood & Entropy-guided Random-walk for open-Vocabulary sEgmentation)는 계산 비용이 많이 드는 친화도 개선 전략, 동일 가중치 또는 고정 크기 가우시안 커널에 의존하는 변환기 어텐션 맵의 비효율적인 융합, 등방성 이웃 강요 등의 한계를 극복하고자 제안된 훈련이 필요 없는 OVSS(Open-Vocabulary Semantic Segmentation)의 강력한 기준선입니다. Stable diffusion 모델의 셀프 어텐션 레이어에서 이웃 구조를 활용하여 전역 및 세분화된 로컬 정보를 통합하며, 로컬 컨텍스트에 고정 크기 가우시안 커널을 사용하는 대신 확률적 랜덤 워크를 도입하여 친화도를 개선합니다. 또한, 엔트로피 기반 불확실성을 사용하여 가장 관련 있는 맵을 선택합니다. CRF(Conditional Random Fields) 또는 PAMR(Pixel-Adaptive Mask Refinement)과 같은 기존의 후처리 기술이 필요하지 않습니다. 7개의 인기 있는 시맨틱 분할 벤치마크에서 실험을 수행하여 전반적으로 최첨단 제로샷 분할 성능을 달성합니다.

시사점, 한계점

훈련이 필요 없는 OVSS 분야에서 강력한 기준선을 제시.
전역 및 세분화된 로컬 정보를 통합하는 새로운 접근 방식 제시.
고정 크기 가우시안 커널 대신 확률적 랜덤 워크를 사용하여 친화도 개선.
엔트로피 기반 불확실성을 활용하여 가장 관련 있는 어텐션 맵 선택.
CRF 또는 PAMR과 같은 추가 후처리 기술 불필요.
7개의 벤치마크에서 최첨단 제로샷 성능 달성.
논문에서 한계점은 명시되지 않음.
👍