본 논문은 다자간 역학, 불완전 정보, 불확실성 하에서의 추론이 특징인 환경에 대한 테스트베드로써 포커와 유사한 게임에 집중해온 AI 연구의 맥락에서, 다자간 참여가 광범위하게 이루어지는 Reduced-format Liar's Poker에서 엘리트 인간 수준의 플레이를 달성한 최초의 AI 에이전트 Solly를 제시한다. Solly는 모델 프리, 액터-크리틱 딥 강화 학습 알고리즘을 사용한 자기-플레이를 통해 훈련되었으며, 승률과 수익률 측면에서 엘리트 인간 수준의 플레이를 보여주었고, 추론 능력을 갖춘 LLM보다도 우수한 성능을 보였다. Solly는 새로운 입찰 전략을 개발하고, 효과적으로 무작위 플레이를 수행했으며, 세계적인 수준의 인간 플레이어에게 쉽게 공략당하지 않았다.