Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

When Object-Centric World Models Meet Policy Learning: From Pixels to Policies, and Where It Breaks

Created by
  • Haebom
Category
Empty

저자

Stefano Ferraro, Akihiro Nakano, Masahiro Suzuki, Yutaka Matsuo

개요

본 논문은 객체 중심 세계 모델(OCWM)이 강화 학습에서 구성적 일반화 및 데이터 효율성을 향상시킬 수 있다는 가설을 검증한다. 구체적으로, 픽셀로부터 객체 수준 잠재 변수를 직접 학습하는 완전 비지도 분리형 객체 중심 세계 모델인 DLPWM을 제안한다. DLPWM은 강력한 재구성 및 예측 성능을 보이지만, 다운스트림 모델 기반 제어에 사용될 때 DreamerV3보다 성능이 떨어진다. 잠재 궤적 분석을 통해 다중 객체 상호 작용 중 표현 시프트가 불안정한 정책 학습의 주요 원인임을 밝힌다.

시사점, 한계점

객체 중심 인식은 견고한 시각적 모델링을 지원하지만, 안정적인 제어를 위해서는 잠재 변동 완화가 필요하다.
DLPWM은 강력한 재구성 및 예측 성능을 달성했지만, 다운스트림 제어 작업에서 DreamerV3보다 성능이 낮다.
다중 객체 상호 작용 시 나타나는 표현 시프트는 불안정한 정책 학습을 야기하는 주요 문제점이다.
👍