Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization

작성자

Haebom

카테고리

Empty

저자

Shan He, Runze Wang, Zhuoyun Du, Huiyu Bai, Zouying Cao, Yu Cheng, Bo Zheng

💡 개요

본 논문은 복잡한 다중 에이전트 시스템(MAS)의 설계 및 최적화 문제를 해결하기 위해 텍스트 기반 파라미터 그래프 최적화(TPGO)라는 새로운 프레임워크를 제안합니다. TPGO는 MAS를 구조화된 텍스트 파라미터 그래프(TPG)로 모델링하고, 실행 흔적에서 얻은 텍스트 기반 그래디언트를 활용하여 에이전트의 성능을 개선합니다. 핵심은 과거 최적화 경험을 통해 스스로를 개선하는 메타 학습 전략인 Group Relative Agent Optimization(GRAO)입니다.

🔑 시사점 및 한계

•

기존의 평면적인 프롬프트 튜닝 방식으로는 파악하기 어려웠던 MAS의 복잡한 상호작용을 구조적으로 이해하고 개선할 수 있습니다.

•

메타 학습을 통해 최적화 전략 자체를 학습하여, 시간이 지남에 따라 더욱 효율적이고 자동화된 MAS 성능 향상을 달성할 수 있습니다.

•

현재 제안된 TPGO는 복잡한 벤치마크에서 우수한 성능을 보였지만, 실제 적용을 위해서는 더 다양한 MAS 환경에서의 검증과 함께 텍스트 그래디언트의 정확성 및 효율성 향상에 대한 연구가 필요합니다.

PDF 보기

Made with Slashpage