Optimas 是一个统一的框架,用于有效优化集成多个组件(例如大规模语言模型、专用工具和传统机器学习模型)的复杂 AI 系统。Optimas 通过维护局部奖励函数 (LRF) 来应对复杂系统因其架构单一、配置类型多样而带来的优化挑战,其中每个组件的局部奖励与系统整体性能相关。Optimas 在每次迭代中高效调整 LRF,以在保持 LRF 属性的同时最大化每个组件的局部奖励。这确保了局部改进能够持续带来性能提升,同时独立更新异构配置。在五个真实复杂系统中,Optimas 的性能比稳健基线平均高出 11.92%。