V2X-UniPool: Unifying Multimodal Perception and Knowledge Reasoning for Autonomous Driving
Created by
Haebom
저자
Xuewen Luo, Fengze Yang, Fan Ding, Xiangbo Gao, Shuo Xing, Yang Zhou, Zhengzhong Tu, Chenxi Liu
개요
본 논문은 자율주행(AD)의 한계를 극복하기 위해 차량 간 통신(V2X)과 언어 모델 기반 추론을 통합하는 V2X-UniPool 프레임워크를 제안한다. 이 프레임워크는 V2X 데이터를 구조화된 언어 기반 지식으로 변환하고, 시계열적으로 일관된 추론을 위해 시간 색인화된 지식 풀에 저장하며, Retrieval-Augmented Generation (RAG)을 사용하여 실시간 컨텍스트에 기반한 결정을 내린다. 실제 DAIR-V2X 데이터셋을 사용한 실험 결과, V2X-UniPool은 최첨단 계획 정확도와 안전성을 달성했으며 통신 비용을 80% 이상 절감했다.