Este artículo propone Hyperflux, una técnica de poda de redes para reducir la latencia de inferencia y el consumo de energía de las redes neuronales. Si bien los métodos de poda existentes se basan principalmente en resultados empíricos, Hyperflux es un enfoque de poda L0 conceptualmente robusto que estima la importancia de cada peso como respuesta de gradiente (flujo) a la eliminación de pesos. Un término de presión global guía continuamente todos los pesos hacia la poda, y los pesos críticos para la precisión se regeneran automáticamente según el flujo. En este artículo, presentamos y validamos experimentalmente varias propiedades derivadas naturalmente del marco Hyperflux y diseñamos un programador controlado por escasez mediante la derivación de una ecuación de ley de escala generalizada que describe la relación entre la escasez final y la presión. Los resultados experimentales demuestran resultados de vanguardia en los conjuntos de datos CIFAR-10 y CIFAR-100 utilizando ResNet-50 y VGG-19.