Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Path Planning through Multi-Agent Reinforcement Learning in Dynamic Environments

Created by
  • Haebom
Category
Empty

저자

Jonas De Maeyer, Hossein Yarahmadi, Moharram Challenger

개요

동적 환경에서의 경로 계획 문제를 해결하기 위해, 지역 기반의 환경 변화를 활용하는 확장 가능한 강화 학습(RL) 프레임워크를 제안한다. 환경을 계층적으로 분해하고 분산된 RL 에이전트를 배치하여 지역적으로 변화에 적응하도록 설계했다. 또한, 부분 환경 성공률에 기반한 정책 업데이트 재훈련 메커니즘을 제안한다. 단일 에이전트 Q-러닝과 다중 에이전트 연합 Q-러닝의 두 가지 학습 패러다임을 탐구하고, 연합 학습 방식이 더 나은 성능을 보임을 확인했다.

시사점, 한계점

시사점:
동적 환경에서의 경로 계획을 위한 확장 가능한 RL 프레임워크 제시.
지역적인 환경 변화를 활용하여 효율적인 적응성을 확보.
단일 에이전트보다 연합 학습 방식이 우수한 성능을 보임.
A* Oracle에 근접하는 성능과 빠른 적응 시간, 확장성을 입증.
전역 플래너의 필요성을 제거하고, 딥 RL 및 유연한 환경 분해를 위한 기반 마련.
한계점:
대규모 환경에서 초기 학습 시간이 오래 걸림.
향후 딥 RL과 유연한 환경 분해를 통한 개선 필요.
👍