Generating Symbolic World Models via Test-time Scaling of Large Language Models
Created by
Haebom
Category
Empty
저자
Zhouliang Yu, Yuhuan Yuan, Tim Z. Xiao, Fuxiang Frank Xia, Jie Fu, Ge Zhang, Ge Lin, Weiyang Liu
개요
본 논문은 대규모 언어 모델(LLM)이 복잡한 계획 문제를 해결하는 데 있어 자연어의 모호성으로 인한 어려움을 극복하기 위해 Planning Domain Definition Language (PDDL)을 활용하는 방법을 제시합니다. PDDL을 이용하여 명확하고 형식적인 상태 설명을 가능하게 함으로써 A*와 같은 고전적인 탐색 알고리즘을 적용하여 최적 계획을 찾을 수 있습니다. 기존 LLM들이 PDDL 도메인 생성에 어려움을 겪는 점을 해결하기 위해, 본 논문은 LLM의 테스트 시간 계산을 확장하여 PDDL 추론 능력을 향상시키는 방법을 제안합니다. Best-of-N 샘플링과 verbalized machine learning을 활용하여 초기 해결책의 질을 높이고 세밀하게 수정하는 알고리즘을 통해 자연어 설명이나 PDDL 문제로부터 PDDL 도메인을 생성하는 과제에서 50% 이상의 성공률을 달성하였으며, 추가적인 훈련 없이 경쟁 수준의 계획 작업에서 최첨단 방법들을 능가하는 성능을 보였습니다.
시사점, 한계점
•
시사점:
◦
LLM의 PDDL 추론 능력 향상을 위한 효과적인 방법 제시
◦
추가적인 훈련 없이도 성능 향상을 달성
◦
Best-of-N 샘플링과 verbalized machine learning의 효과적인 결합