[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ToolSpectrum : Towards Personalized Tool Utilization for Large Language Models

Created by
  • Haebom

저자

Zihao Cheng, Hongru Wang, Zeming Liu, Yuhang Guo, Yuanfang Guo, Yunhong Wang, Haifeng Wang

개요

본 논문은 대규모 언어 모델(LLM)에 외부 도구를 통합하는 기존 연구들이 사용자 지시에 따른 도구 선택에만 초점을 맞춰, 맥락 인식적 개인화된 도구 선택을 간과하고 있다는 점을 지적합니다. 이러한 간과는 특히 중복되는 도구 집합을 맥락에 따라 선택해야 하는 경우 사용자 만족도 저하와 비효율적인 도구 활용으로 이어집니다. 이를 해결하기 위해, 본 논문은 개인화된 도구 활용 능력을 평가하기 위한 벤치마크인 ToolSpectrum을 제시합니다. ToolSpectrum은 사용자 프로필과 환경 요소라는 두 가지 개인화 차원을 공식화하고, 이들의 개별적 및 상승적 영향을 분석합니다. 실험 결과, 개인화된 도구 활용은 다양한 시나리오에서 사용자 경험을 크게 향상시키지만, 최첨단 LLM조차도 사용자 프로필과 환경 요소를 함께 고려하는 능력이 제한적이며, 한쪽 차원을 다른 쪽보다 우선시하는 경향을 보임을 보여줍니다. 따라서 맥락 인식적 개인화가 도구 증강형 LLM에 필수적임을 강조하고, 현재 모델의 중요한 한계점을 밝힙니다. 데이터와 코드는 https://github.com/Chengziha0/ToolSpectrum 에서 제공됩니다.

시사점, 한계점

시사점:
맥락 인식적 개인화가 도구 증강형 LLM의 성능 향상에 필수적임을 제시.
개인화된 도구 활용이 사용자 경험을 향상시킨다는 것을 실험적으로 증명.
ToolSpectrum 벤치마크를 통해 LLM의 개인화된 도구 활용 능력을 평가할 수 있는 기준 제시.
한계점:
최첨단 LLM조차 사용자 프로필과 환경 요소를 모두 고려하는 데 어려움을 보임.
LLM이 한 차원을 다른 차원보다 우선시하는 경향이 있음.
ToolSpectrum 벤치마크의 일반화 가능성에 대한 추가 연구 필요.
👍