본 논문은 GPT 모델이 단순히 다음 토큰을 예측하는 것 이상으로, 세계 모델을 암묵적으로 학습하여 순차적으로 토큰을 생성하는지 여부를 조사합니다. GPT의 어텐션 메커니즘에 대한 인과적 해석을 도출하고, 이 해석에서 발생하는 인과적 세계 모델을 제안합니다. 추론 시 GPT 모델을 이용하여 분포 내 시퀀스에 대한 제로샷 인과 구조 학습이 가능함을 제시합니다. 오델로 게임의 규칙과 설정을 사용한 제어된 합성 환경에서 실험적 평가를 수행합니다. 승리라는 목표와 무관하게 게임 규칙만 준수하는 합성 데이터에 대해, 실제 게임 데이터로 사전 훈련된 GPT 모델을 테스트합니다. 그 결과, 어텐션 메커니즘에 인과 구조가 높은 확신으로 인코딩된 시퀀스에 대해서는 GPT 모델이 게임 규칙을 준수하는 움직임을 생성할 가능성이 높다는 것을 발견했습니다. 일반적으로 GPT 모델이 게임 규칙을 준수하지 않는 움직임을 생성하는 경우에는 인과 구조를 포착하지 못했습니다.