본 논문은 최소한의 사전 정의와 최대한의 자기 진화를 통해 확장 가능한 에이전트 추론을 가능하게 하는 일반적인 에이전트 Alita를 소개한다. Alita는 직접적인 문제 해결을 위한 단일 구성 요소만을 갖추어 기존의 복잡한 도구와 워크플로우에 의존하는 접근 방식보다 훨씬 단순하고 깔끔하다. Alita는 오픈소스에서 작업 관련 모델 컨텍스트 프로토콜(MCP)을 생성하여 외부 기능을 자율적으로 구성, 개선 및 재사용할 수 있는 일반 목적 구성 요소 세트를 제공하여 창의성을 가능하게 한다. GAIA 벤치마크 검증 데이터셋에서 상위권의 성능(pass@1 75.15%, pass@3 87.27%)을 달성했으며, Mathvista와 PathVQA에서도 기존 에이전트 시스템보다 우수한 성능을 보였다.
시사점, 한계점
•
시사점:
◦
최소한의 사전 정의를 통해 일반화 능력이 뛰어난 에이전트 설계의 가능성을 제시한다.
◦
자기 진화를 통한 확장 가능한 에이전트 추론의 새로운 패러다임을 제시한다.
◦
GAIA, Mathvista, PathVQA 등 다양한 벤치마크에서 우수한 성능을 달성하여 실용성을 입증한다.