다양한 환경에서 상대와 팀원이 지속적으로 변화하는 다중 에이전트 시스템의 어려움을 해결하기 위해, 본 논문은 역방향 어텐션 메커니즘을 사용하는 역 어텐션 에이전트를 제안합니다. 이 에이전트는 마음 이론(Theory of Mind, ToM)의 개념을 도입하여, 어텐션 메커니즘을 통해 각 에이전트의 목표에 대한 어텐션 가중치를 명시적으로 표현합니다. 역 어텐션 네트워크는 다른 에이전트의 행동과 관찰을 바탕으로 그들의 ToM을 추론하여 어텐션 상태를 유추하고, 이를 통해 에이전트의 최종 행동을 조정합니다. 협력, 경쟁, 혼합 환경에서의 실험을 통해 역 어텐션 네트워크가 다른 에이전트의 어텐션을 성공적으로 추론하고, 이 정보가 에이전트 성능을 향상시킨다는 것을 보여줍니다. 추가적인 인간 참여 실험은 기준 에이전트 모델과 비교하여 역 어텐션 에이전트가 인간과의 협력이 우수하고 인간 행동을 더 잘 모방함을 보여줍니다.