Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage fédéré robuste et byzantin utilisant des réseaux antagonistes génératifs

Created by
  • Haebom

Auteur

Usama Zafar, André Teixeira, Salman Toor

Contour

Cet article présente une méthode visant à améliorer la robustesse de l'apprentissage fédéré (AF), qui permet l'apprentissage collaboratif de modèles entre clients distribués sans partage de données brutes. Les techniques de défense existantes souffrent de limitations fondamentales, telles que le recours à des règles d'agrégation ou à des heuristiques robustes dont les bornes inférieures d'erreur augmentent avec l'hétérogénéité des clients, ou à des méthodes basées sur la détection qui nécessitent un jeu de données externe fiable pour la validation. Dans cet article, nous présentons un cadre de défense qui synthétise des données représentatives pour valider les mises à jour des clients sur le serveur à l'aide d'un réseau antagoniste génératif conditionnel (cGAN). Cette méthode élimine la dépendance aux jeux de données externes, s'adapte à diverses stratégies d'attaque et s'intègre parfaitement aux workflows d'AF standard. Des expériences approfondies sur des jeux de données de référence démontrent que le cadre proposé distingue précisément les clients malveillants des clients bénins tout en préservant la précision globale du modèle. Outre la robustesse byzantine, nous étudions la représentativité des données synthétiques, le coût de calcul de l'apprentissage du cGAN, ainsi que la transparence et l'évolutivité de l'approche.

Takeaways, Limitations

Takeaways:
Un nouveau cadre de défense d’apprentissage fédéré capable de vérifier les mises à jour des clients sans ensembles de données externes est présenté.
Adaptable à diverses attaques byzantines et s'intègre aux flux de travail FL standard.
Maintenez la précision du modèle tout en distinguant avec précision les clients malveillants et bénins.
Fournit une analyse sur la représentativité des données synthétiques, le coût de formation des cGAN et la transparence et l'évolutivité de l'approche.
Limitations:
Des recherches supplémentaires sont nécessaires sur les coûts de calcul de la formation cGAN et la représentativité des données synthétiques.
D’autres expériences sont nécessaires pour déterminer les performances de généralisation sur différents types d’attaques.
L’évolutivité et l’évaluation des performances dans des environnements réels sont nécessaires.
👍