Sign In

Leveraging Action Relational Structures for Integrated Learning and Planning

Created by
  • Haebom
Category
Empty

저자

Ryan Xiao Wang, Felipe Trevizan

개요

본 논문은 기존 계획 알고리즘과 학습 시스템의 통합에 초점을 맞춰, PDDL 액션 스키마의 관계 구조를 활용하는 새로운 계획 검색 공간인 부분 공간 탐색(partial-space search)을 제안합니다. 부분 공간 탐색은 기존 상태 공간 탐색보다 더 세분화된 검색 공간을 제공하여 비효율적인 액션을 조기에 제거할 수 있도록 합니다. 이를 위해 액션 집합 휴리스틱(action set heuristics)을 도입하여 상태에서 액션 집합을 평가하고, 기존 휴리스틱을 자동으로 액션 집합 휴리스틱으로 변환하는 방법과 부분 공간 탐색으로부터 대규모 학습 데이터셋을 이용하여 액션 집합 휴리스틱을 학습하는 방법을 제시합니다. 새롭게 제안된 계획 시스템 LazyLifted는 개선된 검색 및 학습 휴리스틱을 활용하여 IPC 2023 학습 트랙(LT) 벤치마크에서 최첨단 ML 기반 휴리스틱을 능가하며, 고 분기 계수 작업에서도 LAMA보다 우수한 성능을 보입니다.

시사점, 한계점

시사점:
PDDL 액션 스키마의 관계 구조를 활용하여 계획 검색 공간을 효율적으로 탐색하는 새로운 방법 제시.
기존 휴리스틱을 액션 집합 휴리스틱으로 변환하고, 학습 데이터를 통해 액션 집합 휴리스틱을 학습하는 효과적인 방법 제시.
IPC 2023 벤치마크에서 기존 최고 성능의 ML 기반 계획 시스템을 능가하는 성능을 달성.
고 분기 계수 작업에서도 우수한 성능을 보임.
한계점:
제안된 방법의 일반적인 적용 가능성에 대한 추가적인 연구가 필요할 수 있음.
특정 벤치마크에 대한 최적화가 이루어졌을 가능성이 있으며, 다른 유형의 계획 문제에 대한 성능 평가가 추가적으로 필요함.
액션 집합 휴리스틱 학습에 사용된 데이터셋의 크기 및 품질이 성능에 미치는 영향에 대한 분석이 필요할 수 있음.
👍