Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Pareto Actor-Critic for Communication and Computation Co-Optimization in Non-Cooperative Federated Learning Services

Created by
  • Haebom

저자

Renxuan Tan, Rongpeng Li, Xiaoxue Yu, Xianfu Chen, Xing Xu, Zhifeng Zhao

개요

본 논문은 다수의 서비스 제공자(SP) 생태계에서 연합 학습(FL)의 비협조적 역학을 해결하기 위해 게임 이론적 다중 에이전트 강화 학습(MARL) 프레임워크인 PAC-MCoFL을 제시합니다. PAC-MCoFL은 서비스 제공자들을 에이전트로 간주하여 클라이언트 할당, 적응적 양자화, 자원 할당을 공동으로 최적화합니다. Pareto Actor-Critic(PAC) 원칙과 예측 회귀를 통합하여 파레토 최적 평형을 달성하고 이종 위험 프로파일을 모델링하며, 삼항 카테시안 분해(TCAD) 메커니즘을 통해 고차원 행동 공간을 효율적으로 관리합니다. 또한 계산 복잡성을 크게 줄이는 매개변수화된 추측 생성기를 특징으로 하는 확장 가능한 변형인 PAC-MCoFL-p를 개발하여 오차를 경계 있게 제한합니다. 이론적 수렴 보장과 함께 광범위한 시뮬레이션을 통해 기존 최신 MARL 솔루션 대비 총 보상과 초부피 지표(HVI)를 각각 약 5.8%와 4.2% 향상시키는 우수성을 검증합니다.

시사점, 한계점

시사점:
다수 서비스 제공자 환경에서 연합 학습의 효율성을 향상시키는 새로운 게임 이론적 MARL 프레임워크 제시
PAC 원칙과 예측 회귀를 활용하여 파레토 최적 평형 달성 및 이종 위험 프로파일 모델링
TCAD 메커니즘을 통해 고차원 행동 공간 효율적으로 관리
확장 가능한 변형 PAC-MCoFL-p를 통해 계산 복잡성 감소 및 오차 경계 제한
총 보상 및 HVI 향상을 통한 기존 방법 대비 우수성 검증
다양한 데이터 이질성과 확장된 배포 환경에서 개별 SP와 시스템 성능 간의 효과적인 균형 달성
한계점:
실제 다수 서비스 제공자 환경에서의 실험적 검증 부족 (시뮬레이션 결과에 의존)
PAC-MCoFL-p의 매개변수화된 추측 생성기의 최적 매개변수 설정에 대한 추가 연구 필요
다양한 네트워크 토폴로지 및 통신 지연에 대한 로버스트성 검증 필요
👍