Understanding World or Predicting Future? A Comprehensive Survey of World Models
Created by
Haebom
Category
Empty
저자
Jingtao Ding, Yunke Zhang, Yu Shang, Yuheng Zhang, Zefang Zong, Jie Feng, Yuan Yuan, Hongyuan Su, Nian Li, Nicholas Sukiennik, Fengli Xu, Yong Li
개요
본 논문은 인공 일반 지능(AGI) 연구의 핵심인 멀티모달 대형 언어 모델(LLM)과 비디오 생성 모델의 발전에 따라 주목받는 '월드 모델'에 대한 문헌 조사를 제공한다. 월드 모델은 현재 세계 상태를 이해하거나 미래 역학을 예측하는 도구로 간주되며, 본 논문은 월드 모델을 체계적으로 분류하고 두 가지 주요 기능, 즉 (1) 세계의 메커니즘을 이해하기 위한 내부 표현 구성과 (2) 시뮬레이션 및 의사 결정을 위한 미래 상태 예측에 중점을 둔다. 본 논문은 두 가지 범주의 현재 진행 상황을 검토하고, 생성 게임, 자율 주행, 로봇 공학 및 사회적 시뮬라크라와 같은 주요 도메인에서 월드 모델의 응용을 탐구한다. 마지막으로 주요 과제를 제시하고 잠재적인 미래 연구 방향에 대한 통찰력을 제공한다. 논문 관련 코드는 https://github.com/tsinghua-fib-lab/World-Model 에서 확인할 수 있다.