Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards
Created by
Haebom
저자
Shirley Wu, Parth Sarthi, Shiyu Zhao, Aaron Lee, Herumb Shandilya, Adrian Mladenic Grobelnik, Nurendra Choudhary, Eddie Huang, Karthik Subbian, Linjun Zhang, Diyi Yang, James Zou, Jure Leskovec
개요
Optimas는 대규모 언어 모델, 특수 도구, 전통적인 머신 러닝 모델과 같은 여러 구성 요소를 통합하는 복합 AI 시스템의 효과적인 최적화를 위한 통합 프레임워크입니다. Optimas는 각 구성 요소의 로컬 보상이 전체 시스템 성능과 연관되는 로컬 보상 함수(LRF)를 유지하여, 비분화 구조와 다양한 구성 유형으로 인해 발생하는 복합 시스템 최적화의 어려움을 해결합니다. Optimas는 각 반복에서 LRF를 효율적으로 조정하여 이 속성을 유지하는 동시에 각 구성 요소의 로컬 보상을 최대화합니다. 이를 통해 이질적인 구성을 독립적으로 업데이트하면서, 로컬 개선이 지속적으로 성능 향상으로 이어진다는 것을 보장합니다. Optimas는 5개의 실제 복합 시스템에서 강력한 베이스라인보다 평균 11.92% 향상된 성능을 보였습니다.