Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Causal LLM Routing: End-to-End Regret Minimization from Observational Data

Created by
  • Haebom

저자

Asterios Tsiourvas, Wei Sun, Georgia Perakis

개요

본 논문은 다양한 언어 모델들 중 질의에 가장 적합한 모델을 선택하는 LLM 라우팅 문제를 다룬다. 기존의 접근 방식은 정확도와 비용과 같은 경쟁적인 성능 지표를 먼저 예측하고 그 예측에 기반하여 모델을 선택하는 분리된 전략을 채택하여 오류 누적 및 전체 피드백 데이터 의존(모든 후보 모델에 대한 각 질의 평가 필요)이라는 한계점을 가진다. 본 논문에서는 실제 배포된 모델의 결과만 기록하는 관측 데이터를 활용하여 의사결정 후회를 최소화하는 인과적 엔드투엔드 프레임워크를 제안한다. 효율적인 최적화를 위해 분류 기반 상한선과 소프트맥스 가중치 후회 근사치라는 두 가지 이론적으로 근거한 대리 목적 함수를 도입하며, 최적 정책을 회복함을 보인다. 구간 조건 아키텍처를 통해 이종 비용 기호를 처리하도록 프레임워크를 확장하며, 공개 벤치마크 실험에서 기존 기준보다 우수한 성능을 달성한다.

시사점, 한계점

시사점: 관측 데이터만으로 LLM 라우팅 문제를 효과적으로 해결하는 새로운 인과적 엔드투엔드 프레임워크 제시. 분류 기반 상한선 및 소프트맥스 가중치 후회 근사치를 통한 효율적인 최적화 가능. 이종 비용 기호 처리를 위한 구간 조건 아키텍처 확장. 다양한 임베딩 모델에서 최첨단 성능 달성.
한계점: 본 논문에서 제시된 방법의 일반화 성능에 대한 추가적인 연구 필요. 다양한 유형의 질의 및 언어 모델에 대한 확장성 검증 필요. 실제 환경에서의 적용 및 유지보수 비용에 대한 평가 필요.
👍