Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

AED: Automatic Discovery of Effective and Diverse Vulnerabilities for Autonomous Driving Policy with Large Language Models

Created by
  • Haebom
Category
Empty

저자

Le Qiu, Zelai Xu, Qixin Tan, Wenhao Tang, Chao Yu, Yu Wang

개요

본 논문은 자율 주행 정책의 안전성 평가를 위해 강화 학습(Reinforcement Learning, RL) 기반 취약점 발견 방법의 한계를 극복하고자 대규모 언어 모델(Large Language Model, LLM)을 활용한 새로운 프레임워크 AED를 제안합니다. AED는 LLM을 이용하여 RL 훈련을 위한 보상 함수를 자동으로 설계하고, 다양한 사고 유형을 고려하여 적대적 정책을 병렬적으로 훈련합니다. 마지막으로, 선호도 기반 학습을 통해 비효과적인 사고를 걸러내고 각 취약점의 효과를 향상시킵니다. 실험 결과, AED는 전문가가 설계한 보상 함수보다 더 광범위한 취약점을 발견하고 공격 성공률을 높여 수동적인 보상 함수 설계의 필요성을 줄이며, 발견되는 취약점의 다양성과 효과성을 향상시킨다는 것을 보여줍니다.

시사점, 한계점

시사점:
LLM을 활용하여 자율 주행 정책의 취약점을 효과적이고 다양하게 발견하는 새로운 방법 제시
수동적인 보상 함수 설계의 필요성 감소 및 효율 향상
다양한 사고 유형에 대한 취약점 발견 및 공격 성공률 증가
자율 주행 시스템의 안전성 평가 및 향상에 기여
한계점:
LLM의 성능에 의존적이며, LLM이 생성한 보상 함수의 적절성 검증 필요
시뮬레이션 환경에 의존적이며, 실제 환경에서의 일반화 성능 검증 필요
선호도 기반 학습의 주관성 및 편향성 문제 고려 필요
다양한 사고 유형을 포괄적으로 고려하지 못할 가능성 존재
👍