자율 주행에서의 3D 객체 탐지는 차량의 움직임과 객체의 움직임으로 인해 발생하는 시공간적 불일치 문제로 어려움을 겪습니다. 본 논문은 현재 프레임을 중심으로 과거 프레임의 정보를 선택적으로 융합하고 시공간적 일관성을 보존하는 Co-Fusion4D 프레임워크를 제안하여 이러한 문제를 해결합니다. Co-Fusion4D는 듀얼 어텐션 융합 모듈을 통해 프레임 간 특징 상호작용을 강화하고, nuScenes 데이터셋에서 최신 성능을 달성했습니다.
🔑 시사점 및 한계
•
시공간적 일관성 강화: Co-Fusion4D는 현재 프레임 중심 전략과 시공간 필터링을 통해 프레임 간 특징의 불일치와 노이즈 전파를 효과적으로 억제하여 일관된 BEV(Bird's Eye View) 특징 표현을 생성합니다.
•
어텐션 기반 융합: 듀얼 어텐션 융합 모듈은 공간 및 시간적 어텐션을 공동으로 활용하여 모션과 일치하는 영역을 강조하고 잘못된 상관관계를 억제함으로써 BEV 표현의 시간적 안정성과 분별력을 크게 향상시킵니다.
•
향후 연구 과제: 제안된 방법론이 특정 데이터셋에서 뛰어난 성능을 보였으나, 다양한 환경 및 복잡한 시나리오에서의 일반화 성능 및 실시간 처리 속도 개선에 대한 추가적인 연구가 필요할 수 있습니다.