Sign In

ATLAS: Actor-Critic Task-Completion with Look-ahead Action Simulation

Created by
  • Haebom
Category
Empty

저자

Jiali Cheng, Anjishnu Kumar, Roshan Lal, Rishi Rajasekaran, Hani Ramezani, Omar Zia Khan, Oleg Rokhlenko, Sunny Chiu-Webster, Gang Hua, Hadi Amiri

ATLAS: Actor-Critic Task-completion with Look-ahead Action Simulation

개요

본 논문은 최신 웹 에이전트가 새로운 환경에 적응하는 데 있어 신경망 미세 조정 없이 비효율적인 실행 계획을 생성하는 문제를 해결하고자 한다. 이를 위해 ATLAS (Actor-Critic Task-completion with Look-ahead Action Simulation)라는 기억 보조 에이전트를 제안한다. ATLAS는 환경의 구조와 역학을 인지하지 못해 발생하는 기존 에이전트의 한계를 극복하기 위해, 인지 공간에서 행동의 결과를 시뮬레이션하여 환경 모델에 기반한 계획을 세운다. 에이전트는 가벼운 호기심 기반 탐색을 통해 "인지 지도"를 구축하고, 계획자는 후보 행동을 제안하며, 시뮬레이터는 인지 공간에서 결과를 예측한다. 비평가는 최적의 롤아웃을 선택하고 원래 계획을 업데이트하며, 브라우저 실행자는 선택된 행동을 수행한다. WebArena-Lite 벤치마크에서 ATLAS는 이전 최고 성능보다 높은 63%의 성공률을 달성했으며, 웹사이트별 LLM 미세 조정 없이도 작동한다.

시사점, 한계점

시사점:
신경망 미세 조정 없이 새로운 환경에 효과적으로 적응하는 웹 에이전트 개발.
인지 공간에서의 시뮬레이션을 통해 환경 모델을 구축하고 계획을 수립하는 새로운 접근 방식 제시.
WebArena-Lite 벤치마크에서 기존 최고 성능을 능가하는 성공률 달성.
모듈식 아키텍처를 통해 웹사이트별 LLM 미세 조정의 필요성 제거.
월드 모델, 계층적 계획자, 룩-어헤드 기반 재계획자의 중요성 입증.
한계점:
논문에 구체적인 한계점에 대한 직접적인 언급은 없음. (추가 연구를 통해 밝혀질 수 있음.)
👍