Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Extreme Value Monte Carlo Tree Search for Classical Planning

Created by
  • Haebom
Category
Empty

저자

Masataro Asai, Stephen Wissow

개요

MCTS와 MAB를 결합한 기존 연구의 한계를 극복하기 위해, 비용-대-이동 추정치의 범위를 좁히고 Full Bellman backup의 이론적 근거를 제시하는 새로운 MAB 알고리즘(UCB1-Uniform)을 제안합니다. Peaks-Over-Threshold Extreme Value Theory를 활용하여 UCB1-Uniform의 후회(regret) bound를 증명하고, 고전 계획(classical planning) 문제에서 성능을 입증합니다.

시사점, 한계점

시사점:
고전 계획 문제에서 MAB 알고리즘의 성능 향상을 위한 새로운 접근 방식 제시.
비용-대-이동 추정치의 범위를 좁히고 Full Bellman backup에 대한 이론적 근거 제공.
UCB1-Uniform 알고리즘의 후회 bound 증명 및 실질적인 성능 입증.
한계점:
논문에서 구체적으로 언급된 한계점은 없음. (단, 연구의 범위를 벗어나는 부분에 대한 논의는 생략되어 있을 수 있음)
👍