ARC-RL: A Reinforcement Learning Playground Inspired by ARC Raiders

작성자

Haebom

카테고리

Empty

저자

Carlo Romeo, Andrew D. Bagdanov

💡 개요

본 논문은 기존의 실제 로봇 하드웨어에 기반한 강화학습 환경에서 벗어나, 독특한 외형을 가진 게임 NPC를 모방한 네 가지 새로운 MuJoCo 연속 제어 환경인 ARC-RL을 제안합니다. 이 환경들은 공통된 관찰 템플릿, 행동 규칙, 시뮬레이션 방식, 그리고 다양한 강점과 약점을 가진 단일 보상 함수를 공유하여, 형태학적 다양성에 따른 강화학습 알고리즘의 성능을 비교 분석하는 데 중점을 둡니다.

🔑 시사점 및 한계

•

독창적인 연구 환경 제공: 실제 로봇 하드웨어 제약을 벗어나 게임 NPC와 같은 비현실적인 로봇 형태를 위한 강화학습 연구 환경을 제공함으로써, 다양한 로봇 형태에 대한 일반화 성능을 향상시킬 수 있는 가능성을 제시합니다.

•

강화학습 알고리즘 비교 및 분석: 다양한 온라인 및 오프라인 강화학습 알고리즘을 ARC-RL 환경에서 비교 평가하여, 각 알고리즘의 형태학적 다양성과 애니메이션 스타일 제약에 대한 대처 능력을 체계적으로 분석하고 새로운 접근 방식을 탐구할 수 있습니다.

•

한계점: 새로운 환경에서의 알고리즘 성능 평가가 이루어졌지만, 실제 로봇으로의 전이(transfer) 가능성에 대한 추가적인 검증이 필요하며, 제안된 보상 함수의 모든 구성 요소가 모든 형태학적 특징에 최적화되었는지에 대한 추가 연구가 필요합니다.

PDF 보기

Made with Slashpage