Identifiable Token Correspondence for World Models

Author

Haebom

저자

Youngin Kim, Ray Sun, Inho Kim, Bumsoo Park, Hyun Oh Song

💡 개요

본 논문은 시각적 강화학습에서 토큰 기반 트랜스포머 월드 모델의 시간적 불일치 문제를 해결하기 위해 '식별 가능한 토큰 대응(Identifiable Token Correspondence, ITC)'이라는 새로운 디코딩 단계를 제안합니다. ITC는 다음 프레임 예측을 이전 프레임의 토큰을 복사하거나 새로운 토큰을 생성하는 구조적 할당 문제로 재정의하여, 토큰의 지속성을 명시적으로 고려합니다. 이를 통해 기존 트랜스포머 구조나 학습 절차를 변경하지 않고도 적용 가능하며, 4가지 까다로운 벤치마크에서 최첨단 성능을 달성했습니다.

🔑 시사점 및 한계

•

토큰 기반 월드 모델에서 발생하는 시간적 불일치 문제(객체 중복, 소실, 변이)를 효과적으로 완화할 수 있습니다.

•

기존 트랜스포머 월드 모델에 쉽게 통합될 수 있는 모듈식 접근 방식을 제공하여 연구의 확장성을 높입니다.

•

Craftax-classic 벤치마크에서 기존 최고 성능을 크게 뛰어넘는 우수한 실험 결과를 보였습니다.

•

ITC는 다음 프레임 예측을 구조적 할당 문제로 공식화하는 데 중점을 두지만, 토큰의 생성 및 유지 메커니즘 자체를 근본적으로 바꾸는 것은 아니므로, 복잡하거나 동적인 환경에서의 토큰 관리에는 추가적인 개선이 필요할 수 있습니다.

PDF 보기

Made with Slashpage