Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

Created by

Haebom

저자

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge

💡 개요

본 논문은 기존 스타크래프트 II 게임 환경과 미니게임 환경 사이의 복잡성 격차를 해소하기 위해 새로운 중간 수준의 벤치마크인 Two-Bridge Map Suite를 제안합니다. 경제 시스템을 제거하여 장거리 이동 및 근접 전투와 같은 핵심 전술 능력에 집중함으로써, 연구자들은 현실적인 컴퓨팅 예산으로도 효율적인 강화학습 알고리즘 연구를 수행할 수 있습니다.

🔑 시사점 및 한계

•

기존 스타크래프트 II 연구의 현실적인 컴퓨팅 제약을 완화하고, 더 많은 연구자들이 참여할 수 있도록 접근성을 높였습니다.

•

중간 수준의 벤치마크 환경을 제공하여 강화학습 커리큘럼 설계 및 다양한 알고리즘 실험을 용이하게 합니다.

•

본 벤치마크는 경제 및 기타 복잡한 시스템을 제거하였으므로, 실제 스타크래프트 II 게임의 전체적인 복잡성을 반영하지는 못합니다.

PDF 보기

Made with Slashpage