본 논문은 3D 실내 객체 탐지에서 DETR 기반 방법의 성능 향상을 위해 상호 작용적 상태 공간 모델(Interactive State Space Model, ISSM)을 활용한 새로운 패러다임인 DEST(DEtection with an interactive STate space model)를 제안합니다. 기존 DETR 기반 방법의 한계인 고정된 장면 점 특징을 해결하기 위해, ISSM의 효율적인 맥락 모델링 능력을 활용하여 장면 점 특징과 쿼리 특징을 선형 복잡도로 동시에 업데이트합니다. 이를 위해 상태 의존적 SSM 매개변수화 방법, 직렬화 및 양방향 스캐닝 전략, 상태 간 어텐션 메커니즘, 게이트된 피드포워드 네트워크 등의 설계를 도입하여 ScanNet V2 및 SUN RGB-D 데이터셋에서 우수한 성능을 달성했습니다. 본 논문은 최초로 쿼리를 시스템 상태로, 장면 점을 시스템 입력으로 모델링하는 방법을 제시합니다.