Latent Action Reparameterization for Efficient Agent Inference

작성자

Haebom

카테고리

Empty

저자

Wenhao Huang, Qingwen Zeng, Qiyue Chen, Zijie Guo, Yu Sun, Cheng Yang, Siru Ouyang, Jiri Gesi, Fang Wu, Jiayi Zhang, Huaming Chen, Bang Liu, Xiangru Tang, Chenglin Wu

💡 개요

이 논문은 LLM 에이전트의 긴 텍스트 액션 시퀀스로 인한 높은 추론 비용 문제를 해결하기 위해, 다단계 의미론적 행동을 나타내는 압축된 잠재 액션 공간을 학습하는 Latent Action Reparameterization (LAR) 프레임워크를 제안합니다. LAR는 에이전트의 행동을 잠재 단위로 재매개변수화하여 효과적인 의사결정 범위를 단축시키면서도 원래 액션 공간의 표현력을 유지합니다.

🔑 시사점 및 한계

•

LLM 에이전트 추론 효율성을 높이기 위해 액션 공간의 표현 학습이 중요하다는 것을 보여줍니다.

•

LAR는 고정된 컴퓨팅 예산 하에서 에이전트의 효과적인 액션 범위를 줄이고 추론 효율성을 향상시키며, 동시에 작업 성공률을 유지하거나 개선합니다.

•

수작업 매크로 또는 계층적 제어 방식과 달리, LAR는 에이전트 궤적에서 직접 잠재 액션을 학습하고 모델에 통합하여 추상적인 액션 표현으로 계획 및 실행을 가능하게 합니다.

PDF 보기

Made with Slashpage