Board Game Arena 라이브러리는 Google OpenSpiel 라이브러리에 구현된 전략 보드 게임을 통해 대규모 언어 모델(LLM)의 의사결정 능력을 평가하기 위한 프레임워크를 제공합니다. 이 프레임워크는 여러 보드 게임과 행렬 게임을 통합하고 다양한 에이전트 유형을 지원함으로써 LLM 기반 에이전트와 다른 에이전트(무작위, 인간, 강화 학습 에이전트 등) 간의 다양한 게임 시나리오에서 체계적인 비교를 가능하게 합니다. LiteLLM을 통한 모델에 대한 API 접근, vLLM을 통한 로컬 모델 배포, Ray를 통한 분산 실행을 통합합니다. 또한 LLM 추론 추적을 위한 광범위한 분석 도구를 제공합니다. 본 논문은 이 저장소의 구조, 주요 특징 및 동기를 요약하고 LLM의 추론 및 게임 이론적 행동의 경험적 평가에 어떻게 기여하는지 강조합니다.