Sign In

FASTer: Focal Token Acquiring-and-Scaling Transformer for Long-term 3D Object Detection

Created by
  • Haebom
Category
Empty

저자

Chenxu Dang, Zaipeng Duan, Pei An, Xinmin Zhang, Xuzhong Hu, Jie Ma

개요

본 논문은 Lidar 기반의 최신 고성능 시계열 3D 검출기들이 영역 기반 패러다임을 채택하면서 발생하는 문제점을 해결하기 위해 Focal Token Acquring-and-Scaling Transformer (FASTer)를 제안합니다. 기존 방법들의 무분별한 샘플링 및 융합으로 인한 복잡성 증가와 제한적인 전역 정보 추출 문제를 해결하고자, FASTer는 역동적인 focal token 선택과 token 시퀀스 압축을 통해 효율성을 높입니다. Adaptive Scaling 메커니즘을 통해 개별 token의 기여도를 강조하고 기하학적 맥락을 포착하며, Grouped Hierarchical Fusion 전략을 통해 전역 공간 및 시간 정보 교환을 용이하게 합니다. Waymo Open Dataset 실험 결과, FASTer는 성능과 효율성 면에서 기존 최첨단 검출기를 능가하며 유연성과 강건성을 향상시켰음을 보여줍니다.

시사점, 한계점

시사점:
Lidar 기반 시계열 3D 검출에서 효율성과 성능을 동시에 향상시키는 새로운 아키텍처 제시
Adaptive Scaling 및 Grouped Hierarchical Fusion 전략을 통해 기존 방법의 한계점 극복
Waymo Open Dataset에서 SOTA 성능 달성 및 코드 공개를 통한 재현성 확보
한계점:
제안된 방법의 성능 향상이 Waymo Open Dataset에 국한될 가능성
다른 Lidar 데이터셋이나 sensor modality에 대한 일반화 성능 검증 필요
Adaptive Scaling 및 Grouped Hierarchical Fusion 전략의 매개변수 최적화에 대한 추가 연구 필요
👍