[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

HeCoFuse: Cross-Modal Complementary V2X Cooperative Perception with Heterogeneous Sensors

Created by
  • Haebom

저자

Chuheng Wei, Ziye Qin, Walter Zimmer, Guoyuan Wu, Matthew J. Barth

개요

본 논문은 이기종 센서 구성에서 동작하는 실세계 차량-사물 통신(V2X) 협력적 지각 시스템의 문제점을 해결하기 위해 HeCoFuse라는 통합 프레임워크를 제안합니다. HeCoFuse는 카메라(C)와 라이다(L)를 모두 사용하는 노드를 포함하여 다양한 센서 설정에서 협력적 지각을 위해 설계되었습니다. 채널별 및 공간적 어텐션의 조합을 통해 특징을 적응적으로 가중하는 계층적 융합 메커니즘을 도입하여 다양한 모달리티 특징의 정렬 오류 및 불균형 표현 품질과 같은 문제를 해결합니다. 또한, 계산 비용과 융합 효율성 간의 균형을 맞추기 위해 적응적 공간 해상도 조정 모듈을 사용합니다. 다양한 구성에 대한 강력성을 높이기 위해 사용 가능한 모달리티에 따라 융합 유형을 동적으로 조정하는 협력적 학습 전략을 구현합니다. 실제 세계 TUMTraf-V2X 데이터셋에 대한 실험 결과, HeCoFuse는 모든 센서 구성(LC+LC)에서 43.22%의 3D mAP를 달성하여 CoopDet3D 기준 모델보다 1.17% 향상되었으며, L+LC 시나리오에서는 43.38%의 3D mAP에 도달했습니다. 9가지 이기종 센서 구성에서 21.74%~43.38%의 3D mAP를 유지하며 CVPR 2025 DriveX 챌린지에서 1위를 차지했습니다.

시사점, 한계점

시사점:
이기종 센서 구성에서의 V2X 협력적 지각을 위한 효과적인 통합 프레임워크인 HeCoFuse 제시.
계층적 융합 메커니즘과 적응적 공간 해상도 조정 모듈을 통해 다양한 센서 설정에서 강력한 성능을 달성.
TUMTraf-V2X 데이터셋에서 최첨단 성능 달성 및 CVPR 2025 DriveX 챌린지 1위 수상.
다양한 센서 배포 환경에서 뛰어난 로버스트 성능을 보여줌.
한계점:
TUMTraf-V2X 데이터셋에 대한 성능 평가에 국한되어 다른 데이터셋으로의 일반화 성능은 추가적인 검증이 필요함.
실제 도로 환경의 복잡성을 완벽하게 반영하지 못할 가능성 존재.
계산 비용에 대한 자세한 분석 및 최적화 방안에 대한 추가적인 연구 필요.
👍