Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FBFL : une approche de coordination basée sur le terrain pour l'hétérogénéité des données dans l'apprentissage fédéré

Created by
  • Haebom

Auteur

Davide Domini, Gianluca Aguzzi, Lukas Esterle, Mirko Viroli

Contour

Cet article propose l'apprentissage fédéré basé sur le champ (FBFL), une nouvelle méthode d'apprentissage fédéré (FL) pour l'entraînement de modèles d'apprentissage automatique dans des environnements distribués. Pour remédier à l'évolutivité et à la dégradation des performances des FL existants, notamment celles causées par des distributions de données non indépendantes et identiquement distribuées (non-IID), FBFL s'appuie sur la macroprogrammation et la coordination de champ. Plus précisément, il atténue le problème des données non-IID en effectuant une personnalisation via l'élection de leaders spatialement distribués et construit une structure hiérarchique auto-organisée pour remédier aux goulots d'étranglement et aux points de défaillance uniques dans les architectures centralisées. Les résultats expérimentaux obtenus avec les jeux de données MNIST, FashionMNIST et Extended MNIST démontrent que FBFL offre des performances similaires à FedAvg dans des conditions de données IID et surpasse les méthodes de pointe existantes telles que FedProx et Scaffold dans des conditions de données non-IID. De plus, nous démontrons la robustesse de l'architecture hiérarchique auto-organisée de FBFL face aux pannes de serveur.

Takeaways, Limitations

Takeaways:
Une nouvelle méthodologie d’apprentissage fédéré est présentée pour résoudre efficacement le problème de distribution de données non IID.
Une architecture hiérarchique auto-organisée qui surmonte les limites des architectures centralisées.
Construire un système qui démontre une grande résilience aux pannes de serveur
Suggérant la possibilité de développer des modèles spécialisés adaptés à la distribution des données des différentes régions.
Des performances supérieures, vérifiées expérimentalement, par rapport aux méthodes de pointe existantes
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer les performances et l’évolutivité de la méthode proposée dans un environnement de déploiement à grande échelle dans le monde réel.
Des expériences supplémentaires et une validation sur divers ensembles de données du monde réel sont nécessaires.
Manque possible de descriptions détaillées des stratégies spécifiques de mise en œuvre et d'optimisation pour la programmation macro et les ajustements sur le terrain.
Une analyse de l’efficacité en termes de consommation d’énergie et de frais de communication est nécessaire.
👍