Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Pedestrian Crossing Intention Prediction Using Multimodal Fusion Network

Created by
  • Haebom
Category
Empty

저자

Yuanzhe Li, Steffen Muller

개요

자율주행차의 보행자 관련 사고를 줄이기 위해 보행자 횡단 의도 예측은 필수적입니다. 본 논문은 시각 및 모션 정보를 활용하는 7가지 모달리티 특징을 융합하는 다중 모달 네트워크를 제안합니다. Transformer 기반 추출 모듈, 깊이 정보를 활용한 어텐션 모듈, 모달리티 및 시간적 어텐션을 통해 다양한 모달리티 간의 상호 작용과 중요성을 효과적으로 포착합니다. JAAD 데이터셋 실험 결과, 기존 방법보다 우수한 성능을 달성했습니다.

시사점, 한계점

시사점:
다중 모달리티 융합을 통한 보행자 횡단 의도 예측 성능 향상.
Transformer 기반 추출 모듈을 활용한 특징 추출.
깊이 정보 기반 어텐션 모듈을 통한 공간적 특징 상호 작용.
모달리티 및 시간적 어텐션을 통한 정보 선택적 강조 및 시간적 의존성 포착.
한계점:
제안된 네트워크의 일반화 성능에 대한 추가 연구 필요.
다른 데이터셋에 대한 성능 검증 필요.
계산 복잡성 및 실시간 처리에 대한 추가 고려 필요.
👍