Bài báo này đề xuất kỹ thuật gấp mô hình (model folding), một kỹ thuật nén mô hình không dữ liệu mới. Kỹ thuật này hợp nhất các nơ-ron có cấu trúc tương tự trên nhiều lớp, giúp giảm đáng kể kích thước mô hình mà không cần tinh chỉnh hay truy cập dữ liệu huấn luyện. Không giống như các phương pháp hiện có, kỹ thuật này sử dụng phân cụm k-means và một kỹ thuật không dữ liệu mới để ngăn ngừa sự sụp đổ hoặc bùng nổ phương sai, bảo toàn số liệu thống kê dữ liệu trong quá trình nén. Thông qua các khuôn khổ lý thuyết và thử nghiệm trên các chuẩn mực, bao gồm ResNet18 và LLaMA-7B, chúng tôi chứng minh rằng kỹ thuật gấp mô hình đạt hiệu suất tương đương với các kỹ thuật nén dựa trên dữ liệu và vượt trội hơn các phương pháp không dữ liệu được đề xuất gần đây, đặc biệt là ở mức độ thưa thớt cao. Phương pháp này đặc biệt hiệu quả cho việc nén mô hình quy mô lớn, phù hợp để triển khai trong các môi trường hạn chế về tài nguyên.