Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

State Space Model Meets Transformer: A New Paradigm for 3D Object Detection

Created by
  • Haebom
Category
Empty

저자

Chuxin Wang, Wenfei Yang, Xiang Liu, Tianzhu Zhang

개요

본 논문은 3D 실내 객체 탐지에서 DETR 기반 방법의 성능 향상을 위해 상호작용적 상태 공간 모델(Interactive State Space Model, ISSM)을 활용한 새로운 패러다임, DEST를 제안합니다. 기존 DETR 기반 방법의 한계인 고정된 장면 점 특징을 해결하기 위해, ISSM을 통해 장면 점과 쿼리의 반복적인 상호작용을 통해 효율적인 문맥 모델링을 수행합니다. 특히, 상태 의존적 SSM 매개변수화 방법을 설계하여 시스템 상태가 3D 실내 객체 탐지 작업에서 쿼리 역할을 효과적으로 수행하도록 합니다. 또한, 점 구름과 SSM의 특성에 맞춘 직렬화 및 양방향 스캔 전략, 상태 간 어텐션 메커니즘, 게이트가 있는 피드포워드 네트워크 등 네 가지 핵심 설계를 도입하여 시스템 상태와 시스템 입력으로서 쿼리와 장면 점을 동시에 선형 복잡도로 업데이트합니다. ScanNet V2와 SUN RGB-D 데이터셋에서의 실험 결과, 제안된 방법이 기존 방법들에 비해 성능 향상을 보임을 보여줍니다.

시사점, 한계점

시사점:
3D 실내 객체 탐지에서 DETR 기반 방법의 성능 향상을 위한 새로운 패러다임 제시
ISSM을 이용한 효율적인 문맥 모델링 및 선형 복잡도 달성
상태 의존적 SSM 매개변수화를 통한 시스템 상태의 효과적인 쿼리 활용
ScanNet V2 및 SUN RGB-D 데이터셋에서 SOTA 성능 달성
점 구름 및 SSM 특성에 맞춘 다양한 설계 기법 제시
한계점:
제안된 방법의 계산 복잡도에 대한 더 자세한 분석 필요
다양한 3D 실내 환경 및 객체 유형에 대한 일반화 성능 평가 필요
다른 3D 객체 탐지 방법들과의 더욱 포괄적인 비교 분석 필요
👍