Agent-Environment Alignment via Automated Interface Generation
Created by
Haebom
저자
Kaiming Liu, Xuanyu Lei, Ziyue Wang, Peng Li, Yang Liu
개요
본 논문은 대규모 언어 모델(LLM) 에이전트의 상호작용적 의사결정 과제에서의 추론 능력에 주목하며, 에이전트의 행동과 환경의 실제 상태 변화 간의 불일치, 즉 에이전트-환경 불일치 문제를 다룹니다. 기존 연구가 에이전트 전략 및 환경 설계 개선에 집중한 반면, 본 논문은 인터페이스의 중요성을 강조하며, 에이전트-환경 불일치가 에이전트 성능의 주요 병목 현상임을 실험적으로 입증합니다. 이를 해결하기 위해, 본 논문은 인터페이스를 풍부하게 하여 불일치를 완화하는 ALIGN(Auto-Aligned Interface Generation) 프레임워크를 제안합니다. ALIGN은 에이전트 논리나 환경 코드를 수정하지 않고도 경량 래퍼로 구현되어 환경의 정적 정보와 에이전트에 반환되는 단계별 관찰을 향상시킵니다. 실험 결과, ALFWorld에서 최대 45.67%의 성공률 향상을 포함하여 다양한 도메인(구현된 작업, 웹 탐색, 도구 사용)에서 일관된 성능 향상을 보였으며, 다양한 에이전트 아키텍처와 LLM 백본에 일반화될 수 있음을 보여줍니다. 코드와 실험 결과는 https://github.com/THUNLP-MT/ALIGN 에서 확인할 수 있습니다.