Sign In

Vectorized Online POMDP Planning

Created by
  • Haebom
Category
Empty

저자

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati

개요

자율 로봇의 중요한 능력인 부분 관측 환경에서의 계획 문제를 해결하기 위해, 확률적 행동과 관측의 불확실성을 모델링하는 POMDP(Partially Observable Markov Decision Process)를 활용한다. 기존 POMDP 솔버는 병렬화의 어려움이 있었으나, 본 논문에서는 계산의 병렬화를 극대화하는 새로운 온라인 솔버 VOPP(Vectorized Online POMDP Planner)를 제안한다. VOPP는 POMDP의 최적화 단계를 분석적으로 해결하고, 기대값 추정만을 수치 계산으로 남겨 병렬 처리를 가능하게 한다. 모든 계획 관련 데이터를 텐서로 표현하고, 모든 계획 단계를 완전 벡터화된 계산으로 구현하여 병렬 처리 과정에서 의존성 및 동기화 병목 현상을 제거했다. 실험 결과, VOPP는 기존의 최첨단 병렬 온라인 솔버보다 최소 20배 이상 효율적으로 준최적 해를 계산한다.

시사점, 한계점

시사점:
POMDP 문제 해결을 위한 새로운 병렬 온라인 솔버 VOPP 제안.
병렬화의 어려움을 극복하고 대규모 병렬 처리를 통해 계산 효율성 향상.
기존 솔버 대비 20배 이상의 효율성 달성.
한계점:
논문에서 구체적인 한계점 언급 없음.
👍