축구와 같은 침략형 팀 스포츠는 많은 선수들이 공유된 필드에서 지속적으로 상호 작용하며 고차원적이고 강하게 결합된 상태 공간을 생성하여 정량적 전술 분석에 어려움을 줍니다. 본 논문에서는 데이터로부터 선수 수준의 에이전트 모델을 구축하는 방법을 제시하며, 학습된 가치와 정책이 전술적으로 해석 가능하고 이질적인 데이터 소스에서 견고하도록 합니다. Expandable Decision-Making States (EDMS)라는 의미론적으로 풍부한 상태 표현을 제안하며, 이는 원시 위치 및 속도에 공간 점수, 패스, 득점과 같은 관계형 변수를 추가하고, 볼 소유 및 볼 미소유 에이전트에게 별개의 의사 결정 집합을 제공하는 액션 마스킹 방식을 결합합니다. EDMS는 학습된 가치 함수와 액션 정책을 원시 좌표 특징 대신 인간이 해석 가능한 전술 개념(예: 마킹 압박, 패스 레인, 볼 접근성)에 매핑하고, 에이전트의 선택을 플레이 규칙과 일치시킵니다. 실험에서 EDMS는 액션 마스킹을 통해 기준선에 비해 액션 예측 손실과 시간차(TD) 오류를 일관적으로 줄였습니다. 또한 고위험, 고보상 전술 패턴(예: 빠른 역습 및 방어 돌파)을 강조합니다. 또한 오픈 소스 라이브러리에 접근 방식을 통합하고 여러 상업적 및 오픈 데이터 세트와의 호환성을 입증하여 교차 공급자 평가 및 재현 가능한 실험을 가능하게 합니다.