본 논문은 대규모 언어 모델(LLM)의 물리적 상호작용 모델링의 한계를 해결하기 위해 APEX(Anticipatory Physics-Enhanced Execution) 프레임워크를 제시합니다. APEX는 환경 내의 관련 동적 상호작용을 식별하고 모델링하는 구조화된 그래프를 구성하여 LLM에 명시적인 물리적 상태 업데이트를 제공합니다. 또한, 물리적으로 가능한 행동에 대한 저지연 전방 시뮬레이션을 제공하여 LLM이 정적 관찰이 아닌 예측 결과를 바탕으로 최적의 전략을 선택할 수 있도록 합니다. 물리적 추론, 퍼즐 게임, 동적 장애물 회피 등 세 가지 벤치마크를 통해 APEX가 기존 LLM 및 VLM 기반 모델보다 우수한 성능을 보임을 입증하고, 언어 기반 지능과 실제 작업 실행 간의 간극을 메우는 데 명시적인 물리적 추론의 필요성을 강조합니다.