본 논문은 다중 에이전트 시스템에서 효과적인 정책 개발을 위해 에이전트 모델링의 중요성을 강조하며, 다른 에이전트의 에피소드 기록에 대한 접근 없이 제어되는 에이전트의 지역 궤적만을 기반으로 다른 에이전트의 정책을 학습하는 실용적인 방법을 제시합니다. Transformer 기반의 새로운 에이전트 모델링 접근 방식인 TransAM을 제안하여, 지역 궤적을 효과적으로 다른 에이전트의 정책을 포착하는 임베딩 공간으로 인코딩합니다. 협력적, 경쟁적, 혼합 다중 에이전트 환경에서의 실험 결과를 통해 TransAM이 강력한 정책 표현을 생성하고 에이전트 모델링을 개선하며 더 높은 에피소드 수익을 가져온다는 것을 보여줍니다.