Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play

Created by
  • Haebom

저자

Wei Fang, Yang Zhang, Kaizhi Qian, James Glass, Yada Zhu

개요

본 논문은 대규모 언어 모델(LLM)과 특수화된 외부 도구의 통합이 증가하는 가운데, 최소한의 또는 잡음이 많은 문서만으로 제로샷 도구 사용을 요구하는 많은 작업들을 다룹니다. 기존 솔루션은 수동 재작성 또는 레이블이 지정된 데이터에 의존하여 진정한 제로샷 설정에서는 적용할 수 없습니다. 이러한 문제를 해결하기 위해, 본 논문에서는 각 도구의 입력-출력 동작을 탐색하기 위해 체계적으로 "플레이"하는 자동화된 프레임워크인 PLAY2PROMPT를 제안합니다. 이 반복적인 시행착오 과정을 통해 PLAY2PROMPT는 도구 문서를 개선하고 레이블이 지정된 데이터 없이 사용 예를 생성합니다. 이러한 예는 LLM 추론을 안내할 뿐만 아니라 도구 활용을 더욱 향상시키는 검증 역할도 합니다. 실제 작업에 대한 광범위한 실험은 PLAY2PROMPT가 개방형 및 폐쇄형 모델 모두에서 제로샷 도구 성능을 크게 향상시켜 도메인별 도구 통합을 위한 확장 가능하고 효과적인 솔루션을 제공함을 보여줍니다.

시사점, 한계점

시사점:
레이블이 지정된 데이터 없이 제로샷 도구 사용 성능을 향상시키는 새로운 프레임워크 PLAY2PROMPT 제안.
자동화된 시행착오 과정을 통해 도구 문서 개선 및 사용 예 생성.
개방형 및 폐쇄형 모델 모두에서 제로샷 도구 성능 향상을 실험적으로 검증.
도메인 특정 도구 통합을 위한 확장 가능하고 효과적인 솔루션 제공.
한계점:
PLAY2PROMPT의 성능은 도구의 복잡성 및 다양성에 따라 달라질 수 있음. 특정 도구에 대한 최적화가 필요할 수 있음.
"플레이" 과정의 효율성 향상 및 시행착오 횟수 최소화에 대한 추가 연구 필요.
다양한 도메인 및 작업에 대한 일반화 성능 평가가 더 필요함.
도구의 부작용이나 예상치 못한 동작에 대한 처리 방안이 명확하지 않을 수 있음.
👍