AXIOM: Learning to Play Games in Minutes with Expanding Object-Centric Models
Created by
Haebom
저자
Conor Heins, Toon Van de Maele, Alexander Tschantz, Hampus Linander, Dimitrije Markovic, Tommaso Salvatori, Corrado Pezzato, Ozan Catal, Ran Wei, Magnus Koudahl, Marco Perin, Karl Friston, Tim Verbelen, Christopher Buckley
개요
본 논문은 데이터 효율성이 낮다는 기존 심화 강화 학습(DRL)의 한계를 극복하기 위해 능동 추론(active inference) 프레임워크를 활용한 새로운 아키텍처 AXIOM을 제안합니다. AXIOM은 객체 중심 역학 및 상호 작용에 대한 최소한의 사전 지식을 통합하여 저데이터 환경에서 학습 속도를 높입니다. 장면을 객체의 조합으로 표현하고, 객체의 역동성을 분할 선형 궤적으로 모델링하여 객체 간의 희소 상호 작용을 포착합니다. 생성 모델의 구조는 단일 이벤트로부터 혼합 모델을 성장 및 학습하여 온라인으로 확장되고, 베이지안 모델 축소를 통해 주기적으로 개선되어 일반화를 유도합니다. 경사 기반 최적화 없이도 DRL보다 적은 매개변수로 다양한 게임을 10,000번의 상호 작용 단계 내에 숙달합니다.
시사점, 한계점
•
시사점:
◦
저데이터 환경에서의 강화학습 효율 향상 가능성 제시
◦
베이지안 접근 방식의 데이터 효율성 및 해석 가능성과 DRL의 다양한 작업에 대한 일반화 능력을 결합