CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting
Created by
Haebom
Category
Empty
저자
Haicheng Liao, Hanlin Kong, Bonan Wang, Chengyue Wang, Wang Ye, Zhengbing He, Chengzhong Xu, Zhenning Li
개요
본 논문은 자율 주행의 안전을 위해 필수적인 정확한 움직임 예측을 개선하는 새로운 방법인 CoT-Drive를 제안합니다. CoT-Drive는 대규모 언어 모델(LLM)과 사고 과정(CoT) 프롬프팅 기법을 활용하여 움직임 예측을 향상시킵니다. 경량 언어 모델(LM)로 LLM의 고급 장면 이해 능력을 효과적으로 전이하는 교사-학생 지식 증류 전략을 도입하여, 실시간 에지 장치에서 작동하면서도 포괄적인 장면 이해 및 일반화 능력을 유지합니다. 추가적인 훈련 없이 LLM에 대한 CoT 프롬프팅 기법을 활용하여 복잡한 교통 환경에 대한 이해를 크게 향상시키는 의미론적 주석을 생성함으로써 예측의 정확성과 강건성을 높입니다. 또한, 경량 LM을 미세 조정하여 컨텍스트 특정 의미론적 주석을 생성하도록 설계된 두 개의 새로운 장면 설명 데이터 세트인 Highway-Text와 Urban-Text를 제시합니다. 5개의 실제 데이터 세트에 대한 포괄적인 평가는 CoT-Drive가 기존 모델을 능가함을 보여주며, 복잡한 교통 시나리오를 처리하는 데 있어 효과성과 효율성을 강조합니다. 전반적으로 이 연구는 이 분야에서 LLM의 실제 응용을 고려한 최초의 연구이며, 움직임 예측을 위한 경량 LLM 대리 모델의 훈련과 사용을 개척하여 새로운 기준을 설정하고 AD 시스템에 LLM을 통합할 가능성을 보여줍니다.
시사점, 한계점
•
시사점:
◦
대규모 언어 모델(LLM)을 활용하여 자율 주행의 움직임 예측 정확도를 향상시키는 새로운 방법 제시.
◦
경량 언어 모델(LM)을 통해 실시간 에지 장치에서 작동 가능하도록 효율성 확보.
◦
사고 과정(CoT) 프롬프팅 기법을 통해 복잡한 교통 환경 이해도 향상.
◦
새로운 장면 설명 데이터 세트(Highway-Text, Urban-Text) 제공.
◦
기존 모델 대비 우수한 성능 검증.
◦
자율 주행 시스템에 LLM 통합 가능성 제시.
•
한계점:
◦
제시된 새로운 데이터셋(Highway-Text, Urban-Text)에 대한 자세한 정보 부족.