본 논문은 게임의 정적 규칙과 콘텐츠가 동적 플레이어 행동으로 어떻게 변환되는지를 이해하는 데 초점을 맞춘 자동화된 게임 디자인 반복 프레임워크를 제시합니다. 강화 학습(RL) 에이전트가 게임을 플레이 테스트하고, 대규모 다중 모드 모델(LMM)이 에이전트의 행동을 기반으로 게임을 수정하는 방식으로 작동합니다. RL 에이전트는 여러 에피소드를 완료하여 수치적 플레이 지표 또는 최근 비디오 프레임을 요약한 이미지 스트립을 생성합니다. LMM은 게임플레이 목표와 현재 게임 구성을 받아 플레이 추적을 분석하고 미래 행동을 목표 방향으로 유도하도록 구성을 수정합니다. 실험 결과, LMM이 RL 에이전트가 제공하는 행동 추적을 통해 게임 메커니즘을 반복적으로 개선할 수 있음을 보여주며, AI 지원 게임 디자인을 위한 실용적이고 확장 가능한 도구를 제시합니다.