STICA(Slot Transformer Imagination with CAusality-aware reinforcement learning)는 객체 중심 Transformer를 세계 모델로 사용하고, 인과 관계를 인식하는 정책 및 가치 네트워크를 활용하는 통합 프레임워크입니다. STICA는 각 관측을 객체 중심 토큰 세트로 표현하여 세계 모델이 토큰 수준의 동역학과 상호 작용을 예측할 수 있도록 합니다. 정책 및 가치 네트워크는 토큰 수준의 인과 관계를 추정하고 이를 어텐션 레이어에서 사용하여 인과 관계에 기반한 의사 결정을 수행합니다. 객체가 풍부한 벤치마크에서 STICA는 최첨단 에이전트보다 샘플 효율성과 최종 성능 측면에서 모두 뛰어난 결과를 보입니다.