Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

Created by
  • Haebom

作者

Gohar Irfan Chaudhry, Esha Choukse, Haoran Qiu, I nigo Goiri, Rodrigo Fonseca, Adam Belay, Ricardo Bianchini

概要

Murakkabは、エージェントベースのワークフローのためのリソース効率的なサービングシステムです。既存のフレームワークは、エージェントのロジックとモデルとハードウェアの選択を密接に組み合わせて、ワークフローを不透明なモデルとツールの呼び出しシーケンスとして公開して、非効率的な問題を引き起こします。 Murakkabは、ワークフロー仕様と実行構成を分離する宣言的抽象化を導入しています。プロファイルベースのオプティマイザと適応ランタイムは、ワークフローコンポーネントのオーケストレーション、モデルとハードウェアへのマッピング、カスタムSLOを満たすための動的再構成など、スタック全体を管理します。エージェントワークフローの内部構造を公開し、既存のフレームワークとクラウドスケジューラが達成できないクロスレイヤ最適化を可能にします。様々なワークフローに対する評価の結果、MurakkabはSLOを維持しながら、GPU使用量を最大2.8倍、エネルギー消費量を3.7倍、コストを4.3倍まで減らすことが分かった。

Takeaways、Limitations

Takeaways:
エージェントベースのワークフローのリソース効率を大幅に向上させることができます。 (GPU使用量、エネルギー消費量、コスト削減)
宣言的抽象化により、ワークフロー仕様と実行構成を分離し、柔軟性と管理の容易さを高めました。
クロスレイヤの最適化により、既存のシステムよりも効率的なリソース管理が可能です。
SLOを満足しながら資源使用量を削減することが可能であることを実験的に証明した。
Limitations:
Murakkabのパフォーマンスの向上は、特定のワークフローとハードウェア環境によって異なります。
さまざまな種類のエージェントワークフローの一般化の可能性に関する追加の研究が必要です。
宣言的抽象化の複雑さは、特定のユーザーにとって難しいかもしれません。
実際の運用環境における長期的な安定性と拡張性の検証が必要です。
👍