Cet article propose Hyperflux, une technique d'élagage de réseau visant à réduire la latence d'inférence et la consommation énergétique des réseaux neuronaux. Alors que les méthodes d'élagage existantes reposent principalement sur des résultats empiriques, Hyperflux est une approche d'élagage L0 conceptuellement robuste qui estime l'importance de chaque pondération comme réponse du gradient (flux) à la suppression de la pondération. Un terme de pression globale guide en permanence toutes les pondérations vers l'élagage, et les pondérations critiques pour la précision se régénèrent automatiquement en fonction du flux. Dans cet article, nous présentons et validons expérimentalement plusieurs propriétés naturellement dérivées du cadre Hyperflux et concevons un ordonnanceur contrôlé par parcimonie en dérivant une équation de loi d'échelle généralisée décrivant la relation entre parcimonie finale et pression. Les résultats expérimentaux démontrent des résultats de pointe sur les jeux de données CIFAR-10 et CIFAR-100 en utilisant ResNet-50 et VGG-19.