Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios

Created by
  • Haebom

저자

Mingxing Peng, Yuting Xie, Xusen Guo, Ruoyu Yao, Hai Yang, Jun Ma

개요

본 논문은 자율 주행 시스템의 안전성 및 견고성 평가를 위한 새로운 프레임워크인 LD-Scene을 제안합니다. LD-Scene은 대규모 언어 모델(LLM)과 잠재 확산 모델(LDM)을 통합하여 사용자 제어 가능한 적대적 시나리오 생성을 자연어를 통해 구현합니다. LDM은 현실적인 주행 궤적 분포를 포착하고, LLM 기반 가이드 모듈은 사용자 질의를 적대적 손실 함수로 변환하여 사용자 질의에 맞는 시나리오 생성을 가능하게 합니다. LLM 기반 Chain-of-Thought(CoT) 코드 생성기와 LLM 기반 코드 디버거를 통합하여 가이드 함수 생성의 제어 가능성과 견고성을 향상시킵니다. nuScenes 데이터셋을 사용한 실험 결과, LD-Scene은 현실적이고 다양하며 효과적인 적대적 시나리오 생성에서 최첨단 성능을 달성함을 보여줍니다. 또한, 적대적 행동에 대한 세분화된 제어를 제공하여 특정 주행 시나리오에 맞춘 효과적인 테스트를 가능하게 합니다.

시사점, 한계점

시사점:
자연어 기반의 사용자 제어 가능한 적대적 시나리오 생성으로 자율 주행 시스템의 안전성 평가를 효과적으로 수행할 수 있습니다.
LLM과 LDM의 통합을 통해 현실적이고 다양하며 효과적인 적대적 시나리오 생성이 가능합니다.
세분화된 제어 기능을 제공하여 특정 시나리오에 맞춘 테스트를 가능하게 합니다.
기존 방법의 한계점인 전문 지식 의존성을 낮추고 사용자 친화성을 높였습니다.
한계점:
LLM과 LDM의 성능에 의존적이며, 모델의 한계가 시나리오 생성의 품질에 영향을 미칠 수 있습니다.
nuScenes 데이터셋에 대한 의존성이 존재하며, 다른 데이터셋으로의 일반화 가능성을 추가적으로 검증해야 합니다.
LLM 기반 가이드 모듈의 해석력에 대한 한계가 존재하며, 예상치 못한 결과물을 생성할 가능성이 있습니다.
실제 도로 환경에서의 일반화 가능성에 대한 추가적인 연구가 필요합니다.
👍