Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Optimisation des erreurs : surmonter la décroissance exponentielle du signal dans les réseaux de codage prédictif profond

Created by
  • Haebom

Auteur

Cédric Goemaere, Gaspard Oliviers, Rafal Bogacz, Thomas Demeester

Contour

Le codage prédictif (PC) est une alternative biologiquement plausible à la rétropropagation pour l'entraînement des réseaux neuronaux, mais il rencontre des difficultés avec les architectures plus profondes. Cet article identifie la cause profonde comme un problème inhérent d'atténuation du signal, où les gradients décroissent exponentiellement avec la profondeur, les rendant négligeables sur le plan informatique en raison de contraintes de précision numérique. Pour remédier à cette limitation fondamentale, cet article présente l'optimisation des erreurs (EO), une nouvelle reparamétrisation qui supprime l'atténuation du signal tout en préservant les propriétés théoriques du PC. En optimisant les erreurs de prédiction plutôt que les états, l'EO permet aux signaux d'atteindre simultanément toutes les couches sans atténuation, ce qui entraîne une convergence beaucoup plus rapide que le PC standard. Des expériences sur plusieurs architectures et jeux de données montrent que l'EO égale les performances de la rétropropagation, même dans les modèles plus profonds où le PC conventionnel peine. Outre des améliorations pratiques, ces travaux apportent des éclairages théoriques sur la dynamique du PC et posent les bases de l'extension de l'apprentissage d'inspiration biologique aux architectures plus profondes sur matériel numérique et au-delà.

Takeaways, Limitations_

Takeaways:
La cause profonde du problème d’atténuation du signal dans le codage prédictif est identifiée.
Nous proposons une nouvelle méthode pour résoudre le problème d’atténuation du signal, appelée optimisation d’erreur (EO).
Des performances au niveau de la rétropropagation ont été obtenues même dans les réseaux neuronaux profonds grâce à l'EO.
Nous fournissons une base pour étendre l’apprentissage d’inspiration biologique à des architectures plus profondes.
Limitations:
Des recherches supplémentaires sont nécessaires sur la généralité de l’EO et son applicabilité à diverses architectures et ensembles de données.
Une analyse plus détaillée de la complexité informatique et de l’efficacité de l’EO est nécessaire.
👍