Agentic LLM Planning via Step-Wise PDDL Simulation: An Empirical Characterisation

Created by

Haebom

저자

Kai Gobel, Pierrick Lorang, Patrik Zips, Tobias Gluck

💡 개요

본 연구는 자율 로봇 시스템의 핵심 역량인 작업 계획(task planning) 분야에서 대규모 언어 모델(LLM)의 가능성을 탐구합니다. LLM이 PDDL(Planning Domain Definition Language) 시뮬레이션 엔진과 상호작용하여 단계별로 행동을 선택하고 상태를 관찰하는 '에이전트적 LLM 계획(agentic LLM planning)' 방식을 제안합니다. 실험 결과, 에이전트적 LLM 계획은 직접적인 LLM 계획보다 약간 높은 성공률을 보였으며, 특히 난이도 있는 문제에서 더 짧은 계획을 생성하는 경향을 확인했습니다.

🔑 시사점 및 한계

•

LLM이 PDDL 시뮬레이션 엔진과 결합하여 기존 기호 계획 방식과 경쟁할 수 있는 잠재력을 보여줍니다.

•

에이전트적 접근 방식은 단계별 환경 피드백을 통해 LLM의 계획 능력을 향상시킬 수 있음을 시사합니다.

•

PDDL과 같이 자체 평가적인 피드백만으로는 에이전트적 학습의 실질적인 이점을 제한할 수 있으며, 이는 외부적으로 검증 가능한 신호의 중요성을 강조합니다.

•

LLM 기반 계획은 현재까지는 훈련 데이터의 기억에 의존하는 경향이 강하며, 일반화 가능한 계획 능력 확보가 향후 과제입니다.

•

에이전트적 LLM 계획은 토큰 비용이 더 높다는 한계가 있습니다.

PDF 보기

Made with Slashpage