Bài báo này đề xuất Hyperflux, một kỹ thuật cắt tỉa mạng nhằm giảm độ trễ suy luận và mức tiêu thụ điện năng của mạng nơ-ron. Trong khi các phương pháp cắt tỉa hiện có chủ yếu dựa vào kết quả thực nghiệm, Hyperflux là một phương pháp cắt tỉa L0 mạnh mẽ về mặt khái niệm, ước tính tầm quan trọng của mỗi trọng số như là phản ứng gradient (thông lượng) đối với việc loại bỏ trọng số. Một thuật ngữ áp suất toàn cục liên tục hướng dẫn tất cả các trọng số đến việc cắt tỉa, và các trọng số quan trọng đối với độ chính xác sẽ tự động tăng trở lại theo thông lượng. Trong bài báo này, chúng tôi trình bày và xác thực thực nghiệm một số tính chất có nguồn gốc tự nhiên từ khuôn khổ Hyperflux và thiết kế một bộ lập lịch được kiểm soát bởi độ thưa thớt bằng cách đưa ra một phương trình quy luật tỷ lệ tổng quát mô tả mối quan hệ giữa độ thưa thớt cuối cùng và áp suất. Kết quả thực nghiệm chứng minh các kết quả tiên tiến trên các tập dữ liệu CIFAR-10 và CIFAR-100 sử dụng ResNet-50 và VGG-19.