본 논문은 강화학습(RL) 에이전트의 의사결정 향상을 위해 전역 작업 공간(GW) 이론과 세계 모델을 결합한 시스템을 제안하고 평가합니다. 기존의 세계 모델이 환경 변수(예: 픽셀, 물리적 속성)를 직접 사용하여 학습 속도가 느리고 복잡한 문제를 해결하기 위해, 다중 모달 변수를 포착하는 고차원 잠재 공간에서 작동하는 세계 모델을 제시합니다. GW 이론을 기반으로 구현된 GW-Dreamer는 기존 PPO 및 Dreamer 알고리즘과 비교하여 환경 단계 수를 줄이면서 학습 효율을 높였으며, 한 모달리티(이미지 또는 시뮬레이션 속성)가 없더라도 강건한 성능을 보이는 것을 확인했습니다. 이는 GW와 세계 모델의 결합이 RL 에이전트의 의사결정 향상에 큰 잠재력을 가지고 있음을 시사합니다.