Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

E3AD: An Emotion-Aware Vision-Language-Action Model for Human-Centric End-to-End Autonomous Driving

Created by
  • Haebom
Category
Empty

저자

Yihong Tang, Haicheng Liao, Tong Nie, Junlin He, Ao Qu, Kehua Chen, Wei Ma, Zhenning Li, Lijun Sun, Chengzhong Xu

개요

본 논문은 자율주행(AD) 시스템이 승객의 감정 상태를 무시하는 문제를 해결하기 위해, 자유 형식의 자연어 명령을 해석하고, 감정을 추론하며, 물리적으로 가능한 궤적을 계획하는 Open-Domain End-to-End (OD-E2E) 자율주행을 제시한다. 이를 위해 감정 인식 VLA 프레임워크인 E3AD를 제안하며, 연속적인 VAD 감정 모델과 듀얼 경로 공간 추론 모듈을 활용하여 감정 정보를 통합한다. 또한, 일관성 지향적 훈련 방식을 통해 감정적 의도와 주행 동작 간의 일관성을 강화한다. E3AD는 실제 데이터셋에서 시각적 근거 및 웨이포인트 계획을 개선하고, 감정 추정을 위한 SOTA VAD 상관 관계를 달성했다.

시사점, 한계점

시사점:
감정 정보를 자율주행에 통합하여 인간 중심적인 주행을 구현.
VAD 감정 모델과 듀얼 경로 공간 추론 모듈을 활용한 새로운 프레임워크 제시.
실제 데이터셋에서 우수한 성능을 입증.
인간 중심적인 피드백 제공 가능성.
한계점:
구체적인 한계점은 논문 내용에 명시되지 않음.
👍