본 논문은 다중 플레이어 게임에서 안정적인 공동 행동을 찾는 데 중요한 역할을 하는 내쉬 균형과 같은 게임 이론적 해법 개념이, 간단한 2인 게임에서조차 에이전트 상호 작용의 역학이 내쉬 균형에 도달하지 못하고 복잡하고 예측할 수 없는 행동을 보이는 한계를 지적합니다. 대신, 진화적 접근 방식은 에이전트 상호 작용의 장기적 역학을 설명하면서 장기간 지속되는 전략을 설명하고 일시적인 전략을 걸러낼 수 있습니다. 본 논문은 에이전트의 보상을 고려하면서 변화에 강한 안정적인 행동을 초래하는 에이전트의 공동 전략을 식별하는 것을 목표로 합니다. 이를 위해 에이전트의 행동 대신 에이전트의 전략을 고려하여 동적 게임을 경험적 형태로 변환하고, 진화적 방법론인 α-Rank를 적용하여 장기적 역학에 따라 전략 프로파일을 평가하고 순위를 매기는 방법을 제안합니다. 이 방법론은 에이전트의 장기적 상호 작용을 통해 강력한 공동 전략을 식별할 뿐만 아니라, 이러한 전략의 높은 순위에 대한 설명적이고 투명한 프레임워크를 제공합니다. 실험은 에이전트가 그래프 색칠 문제의 확률적 버전을 공동으로 해결하려고 시도하는 것을 보여줍니다. 다양한 플레이 스타일을 전략으로 간주하여 경험적 게임을 정의하고 DQN 알고리즘을 사용하여 이러한 전략을 실현하는 정책을 훈련합니다. 그런 다음 시뮬레이션을 실행하여 α-Rank가 공동 전략의 순위를 매기는 데 필요한 보상 행렬을 생성합니다.