Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Pareto Actor-Critic for Communication and Computation Co-Optimization in Non-Cooperative Federated Learning Services

Created by
  • Haebom

作者

Renxuan Tan, Rongpeng Li, Xiaoxue Yu, Xianfu Chen, Xing Xu, Zhifeng Zhao

概要

本論文は、多数のサービスプロバイダー(SP)エコシステムにおける連合学習(FL)の非協調的なダイナミクスを解決するためのゲーム理論的マルチエージェント強化学習(MARL)フレームワークであるPAC-MCoFLを提示します。 PAC-MCoFLはサービスプロバイダをエージェントと見なし、クライアント割り当て、適応量子化、リソース割り当てを共同で最適化します。 Pareto Actor-Critic(PAC)原則と予測回帰を統合して、パレート最適平衡を達成し、異種リスクプロファイルをモデル化し、三項カテシアン分解(TCAD)メカニズムを介して高次元行動空間を効率的に管理します。また、計算の複雑さを大幅に削減するパラメータ化された推測ジェネレータを特徴とする拡張可能なバリエーションであるPAC-MCoFL-pを開発し、誤差を境界に制限します。理論的収束を保証する幅広いシミュレーションにより、既存の最新のMARLソリューションと比較して、総報酬と超体積指標(HVI)をそれぞれ約5.8%と4.2%向上させる卓越性を検証します。

Takeaways、Limitations

Takeaways:
多数のサービスプロバイダー環境における連合学習の効率性を向上させる新しいゲーム理論的MARLフレームワークの提示
PAC原則と予測回帰を利用したパレート最適平衡達成と異種リスクプロファイルのモデリング
TCADメカニズムによる高次元行動空間の効率的な管理
スケーラブルな変形PAC-MCoFL-pによる計算の複雑さの低減と誤差境界の制限
総報酬とHVI強化による既存の方法に対する優秀性の検証
さまざまなデータの不均一性と拡張展開で個々のSPとシステムパフォーマンスの効果的なバランスを実現
Limitations:
実際の多数のサービスプロバイダ環境での実験的検証の欠如(シミュレーション結果に依存)
PAC-MCoFL-pのパラメータ化された推測発生器の最適パラメータ設定に関するさらなる研究が必要
さまざまなネットワークトポロジと通信遅延のロバスト性検証が必要
👍