본 논문은 다양한 고품질 언어 모델을 제공하는 오픈-웨이트 LLM 동물원에서 특정 작업에 적합한 모델을 선택하는 것이 어렵다는 문제를 해결하기 위해 MESS+ 알고리즘을 제시합니다. MESS+는 사용자의 요구 사항 만족도 확률을 실시간으로 학습하여 비용 최적화된 LLM 요청 라우팅을 제공하며, 서비스 수준 계약(SLA) 준수를 보장합니다. 가상 큐와 요청 만족도 예측을 결합하여 비용 최적화와 제약 조건 만족에 대한 이론적 분석을 포함하며, 기존 LLM 라우팅 기술 대비 평균 2배의 비용 절감 효과를 보입니다.