StateAct: Enhancing LLM Base Agents via Self-prompting and State-tracking
Created by
Haebom
저자
Nikolai Rozanov, Marek Rei
개요
본 논문은 로봇 공학부터 웹 탐색까지 다양한 작업을 수행하는 자율 에이전트로서 대규모 언어 모델(LLM)의 사용이 증가함에 따라, 기존 방법들이 장문맥 추론과 목표 준수에 어려움을 겪는다는 점을 지적합니다. 이에 본 논문에서는 매 단계마다 작업 목표를 강화하는 자체 프롬프트(self-prompting)와 시간에 따른 상태 정보를 추적하는 상태 사슬(chain-of-states)을 통해 의사 결정을 향상시키는 새로운 효율적인 기본 에이전트인 StateAct를 제시합니다. StateAct는 여러 최첨단 LLM 에이전트에서 Alfworld, Textcraft, Webshop에서 기존 최고 기본 에이전트인 ReAct보다 각각 10%, 30%, 7% 이상 성능이 향상됨을 보여줍니다. 또한, StateAct는 테스트 시간 스케일링과 같은 고급 LLM 에이전트 방법에서 ReAct의 대체재로 사용될 수 있으며, Textcraft에서 추가로 12%의 성능 향상을 제공합니다. 추가적인 훈련이나 검색 없이 효율성과 장거리 추론을 개선함으로써, StateAct는 LLM 에이전트를 위한 확장 가능한 기반을 제공합니다. 소스 코드는 https://github.com/ai-nikolai/stateact 에서 공개됩니다.