Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Actor-Crítico de Pareto para la cooptimización de la comunicación y la computación en servicios de aprendizaje federado no cooperativo

Created by
  • Haebom

Autor

Renxuan Tan, Rongpeng Li, Xiaoxue Yu, Xianfu Chen, Xing Xu, Zhifeng Zhao

Describir

Este artículo presenta PAC-MCoFL, un marco de aprendizaje por refuerzo multiagente (MARL) basado en teoría de juegos para abordar la dinámica no cooperativa del aprendizaje federado (AF) en un ecosistema multiproveedor de servicios (PS). PAC-MCoFL considera a los proveedores de servicios como agentes y optimiza conjuntamente la asignación de clientes, la cuantificación adaptativa y la asignación de recursos. Integra el principio Pareto Actor-Crítico (PAC) y la regresión predictiva para lograr un equilibrio óptimo de Pareto, modela perfiles de riesgo heterogéneos y gestiona eficientemente espacios de acción de alta dimensión mediante un mecanismo de descomposición cartesiana trinomial (TCAD). Además, desarrollamos una variante escalable, PAC-MCoFL-p, que incorpora un generador de conjeturas parametrizado que reduce significativamente la complejidad computacional y limita considerablemente el error. Amplias simulaciones, junto con garantías de convergencia teórica, demuestran su superioridad sobre las soluciones MARL de última generación existentes, mejorando la recompensa total y el índice de hipervolumen (HVI) en aproximadamente un 5,8% y un 4,2%, respectivamente.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco MARL de teoría de juegos para mejorar la eficiencia del aprendizaje federado en entornos de múltiples proveedores de servicios.
Lograr el equilibrio óptimo de Pareto y modelar perfiles de riesgo heterogéneos utilizando el principio PAC y regresión predictiva.
Gestión eficiente de espacios de acción de alta dimensión mediante mecanismos TCAD.
Complejidad computacional reducida y error acotado mediante variantes escalables de PAC-MCoFL-p.
Demostrando superioridad sobre los métodos existentes a través de la compensación total y la mejora del HVI.
Lograr un equilibrio efectivo entre el SP individual y el rendimiento del sistema en entornos de implementación escalables y con heterogeneidad de datos diversos.
Limitations:
Falta de validación experimental en entornos reales de proveedores multiservicio (basándose en resultados de simulación)
Se necesitan más investigaciones para determinar los parámetros óptimos del generador de estimaciones parametrizadas de PAC-MCoFL-p.
Se requiere verificación de robustez para diversas topologías de red y retrasos de comunicación.
👍