Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SMART: Self-Aware Agent for Tool Overuse Mitigation

Created by
  • Haebom

저자

Cheng Qian, Emre Can Acikgoz, Hongru Wang, Xiusi Chen, Avirup Sil, Dilek Hakkani-Tur, Gokhan Tur, Heng Ji

개요

본 논문은 대규모 언어 모델(LLM) 에이전트의 도구 과다 사용 문제를 해결하기 위해, 인간의 메타인지에서 영감을 받은 SMART(Strategic Model-Aware Reasoning with Tools) 패러다임을 제시한다. SMART 패러다임은 에이전트의 자기 인식 능력을 향상시켜 작업 처리를 최적화하고 도구 과다 사용을 줄이는 것을 목표로 한다. 이를 위해, 매개변수 지식과 도구 기반 단계를 번갈아 사용하는 세 가지 영역을 포함하는 SMART-ER 데이터셋을 구축하고, 도구 사용의 필요성을 설명하는 근거를 각 단계에 추가했다. 감독 학습을 통해 개발된 SMARTAgent는 매개변수 지식과 도구 사용 간의 균형을 동적으로 조절한다. 실험 결과, SMARTAgent는 도구 사용을 24% 줄이면서 성능을 37% 이상 향상시켰고, 70B 모델과 동등한 성능을 7B 모델에서 달성하며 GPT-4o를 능가하는 결과를 보였다. 또한, GSM8K 및 MINTQA와 같은 분포 외 테스트 데이터에서도 도구 호출 횟수를 5분의 1로 줄이면서 정확도를 유지하는 일반화 능력을 보였다. 이는 전략적인 도구 사용이 추론 향상, 과다 사용 완화, 모델 크기와 성능 간의 격차 해소에 기여하여 지능적이고 자원 효율적인 에이전트 설계를 발전시킬 수 있음을 시사한다.

시사점, 한계점

시사점:
LLM 에이전트의 도구 과다 사용 문제를 해결하는 새로운 패러다임(SMART)과 데이터셋(SMART-ER) 제시.
SMARTAgent를 통해 도구 사용 감소 및 성능 향상을 동시에 달성.
7B 모델이 70B 모델 및 GPT-4o 수준의 성능 달성 가능성 제시.
분포 외 데이터에 대한 우수한 일반화 능력 확인.
자원 효율적인 지능형 에이전트 설계에 대한 새로운 가능성 제시.
한계점:
SMART-ER 데이터셋의 범위 및 일반화 가능성에 대한 추가 연구 필요.
다양한 도구 및 작업 환경에서 SMARTAgent의 성능 평가 필요.
SMART 패러다임의 적용 가능성 및 한계에 대한 심층적인 분석 필요.
현재 결과가 특정 데이터셋과 모델에 편향될 가능성에 대한 고려 필요.
👍