GRAM: Generalization in Deep RL with a Robust Adaptation Module
Created by
Haebom
저자
James Queeney, Xiaoyi Cai, Alexander Schperberg, Radu Corcodel, Mouhacine Benosman, Jonathan P. How
개요
본 논문은 심층 강화 학습(Deep Reinforcement Learning) 에이전트의 다양한 상황(훈련 중 관찰된 분포 내 시나리오와 새로운 분포 외 시나리오 포함)에 대한 일반화 능력을 향상시키는 프레임워크 GRAM을 제시합니다. GRAM은 분포 내 및 분포 외 환경 역학을 식별하고 반응하는 강력한 적응 모듈과, 분포 내 적응 및 분포 외 강건성 목표를 결합하는 공동 훈련 파이프라인을 포함합니다. 4족 보행 로봇을 이용한 시뮬레이션 및 실제 로봇 실험을 통해 분포 내 및 분포 외 시나리오 모두에서 강력한 일반화 성능을 보임을 입증합니다.
시사점, 한계점
•
시사점:
◦
심층 강화 학습 에이전트의 분포 내 및 분포 외 일반화 문제를 통합적으로 해결하는 새로운 프레임워크 제시.