Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

State Space Model Meets Transformer: A New Paradigm for 3D Object Detection

Created by
  • Haebom
Category
Empty

저자

Chuxin Wang, Wenfei Yang, Xiang Liu, Tianzhu Zhang

개요

본 논문은 3D 실내 객체 탐지에서 DETR 기반 방법의 성능 향상을 위해 상호 작용적 상태 공간 모델(Interactive State Space Model, ISSM)을 활용한 새로운 패러다임인 DEST(DEtection with an interactive STate space model)를 제안합니다. 기존 DETR 기반 방법의 한계인 고정된 장면 점 특징을 해결하기 위해, ISSM의 효율적인 맥락 모델링 능력을 활용하여 장면 점 특징과 쿼리 특징을 선형 복잡도로 동시에 업데이트합니다. 이를 위해 상태 의존적 SSM 매개변수화 방법, 직렬화 및 양방향 스캐닝 전략, 상태 간 어텐션 메커니즘, 게이트된 피드포워드 네트워크 등의 설계를 도입하여 ScanNet V2 및 SUN RGB-D 데이터셋에서 우수한 성능을 달성했습니다. 본 논문은 최초로 쿼리를 시스템 상태로, 장면 점을 시스템 입력으로 모델링하는 방법을 제시합니다.

시사점, 한계점

시사점:
3D 실내 객체 탐지에서 DETR 기반 방법의 성능 향상을 위한 새로운 패러다임 제시.
ISSM을 활용하여 선형 복잡도로 장면 점 특징과 쿼리 특징을 효율적으로 업데이트.
ScanNet V2 및 SUN RGB-D 데이터셋에서 SOTA 성능 달성.
GroupFree 및 VDETR 기준 성능 개선 (+5.3, +3.2 AP50 향상).
한계점:
제안된 방법의 일반화 성능에 대한 추가적인 연구 필요.
다른 3D 객체 탐지 방법과의 비교 분석이 더욱 심도 있게 필요.
ISSM의 매개변수 설정에 대한 민감도 분석 및 최적화 전략 연구 필요.
👍