Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Generalización de dominio federado con gradiente de coincidencia en servidor sin datos

Created by
  • Haebom

Autor

Trong-Binh Nguyen, Minh-Duong Nguyen, Jinsun Park, Quoc-Viet Pham, Won Joo Hwang

Describir

En este artículo, proponemos un enfoque novedoso, el Aprendizaje Federado mediante Gradiente de Coincidencia en Servidor (FedOMG), para resolver el problema de Generalización de Dominio Federado (FDG) en un entorno distribuido. FedOMG utiliza eficientemente datos de diversos dominios distribuidos a cada cliente para aprender representaciones invariantes en el dominio. A diferencia de los métodos convencionales de aprendizaje de representaciones invariantes en el dominio, el servidor central encuentra la dirección del gradiente invariante entre dominios utilizando el gradiente local de cada cliente. Esto agrega las características del modelo distribuido sin costos de comunicación adicionales y mejora el rendimiento mediante la integración con métodos FL/FDG existentes. Logra un rendimiento SOTA en diversos conjuntos de datos de referencia como MNIST, EMNIST, CIFAR-10, CIFAR-100, PACS, VLCS y OfficeHome.

Takeaways, Limitations

Takeaways:
Presentando una solución eficiente al problema de generalización de dominio en un entorno distribuido
Aproveche las características de un modelo distribuido sin costos de comunicación adicionales
Compatibilidad con los métodos FL/FDG existentes y potencial para mejoras de rendimiento
Lograr el rendimiento SOTA en varios conjuntos de datos de referencia
Limitations:
Falta de análisis de la complejidad computacional del método propuesto.
Se necesita más investigación sobre la robustez ante diversos entornos distribuidos y distribuciones de datos.
Falta de aplicabilidad y evaluación del rendimiento para aplicaciones del mundo real
👍