Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ICL-Router: In-Context Learned Model Representations for LLM Routing

Created by
  • Haebom
Category
Empty

저자

Chenxu Wang, Hao Li, Yiqun Zhang, Linyao Chen, Jianhao Chen, Ping Jian, Peng Ye, Qiaosheng Zhang, Shuyue Hu

개요

대규모 언어 모델(LLM)은 종종 상호 보완적인 강점을 보입니다. 모델 라우팅은 후보 모델 풀이 주어졌을 때 각 쿼리를 가장 적합한 모델로 동적으로 전달하여 이러한 강점을 활용합니다. 하지만, 라우팅 성능은 정확한 모델 표현에 의존하며, 새로운 모델을 추가하려면 일반적으로 재학습이 필요하여 확장성에 제한이 있습니다. 이러한 문제를 해결하기 위해, 본 논문에서는 문맥 내 벡터를 사용하여 모델의 능력을 표현하는 새로운 라우팅 방법을 제안합니다. 이 방법은 두 단계로 진행됩니다. 첫째, 쿼리는 임베딩되고 벡터로 투영되며, 투영기 및 LLM 기반 라우터는 원래 쿼리를 재구성하도록 훈련되어 벡터 표현을 라우터의 의미 공간에 정렬합니다. 둘째, 각 후보 모델은 쿼리 세트에 대해 프로파일링되며, 라우터는 쿼리 및 모델 성능의 문맥 내 벡터를 기반으로 각 모델이 새로운 쿼리에 정확하게 답변할 수 있는지 예측하는 법을 배웁니다. 광범위한 실험을 통해 본 방법이 분포 내 및 분포 외 작업 모두에서 최첨단 라우팅 성능을 달성함을 입증했습니다. 또한, 본 방법은 라우터를 재학습하지 않고도 새로운 모델을 원활하게 통합할 수 있습니다.

시사점, 한계점

상태-of-the-art 라우팅 성능 달성 (분포 내 및 분포 외 작업)
라우터 재학습 없이 새로운 모델을 쉽게 통합 가능
👍