본 논문은 양자화된 심층 신경망(DNN)에서 비트 단위의 sparsity를 활용하여 Multiply-Accumulate (MAC) 연산을 최적화하는 방법을 제시합니다. 기존의 비트 직렬 방식은 두 인수의 sparsity를 동시에 활용하지 못하고, dual-factor sparsity를 활용하는 방법 또한 부분 곱의 폭발 문제에 직면하는 한계를 지닙니다. 본 논문에서는 particlization 기반 접근 방식을 이용하여 dual-factor sparsity를 활용하는 MAC unit을 제안합니다. 단순한 제어 로직을 통해 부분 곱 폭발 문제를 해결하고, 덜 중요한 중간 결과를 버림으로써 하드웨어를 단순화하고 에너지 효율을 높입니다. 또한, 비트 단위 sparsity의 변동으로 인한 MAC 연산의 가변적인 cycle count 문제를 해결하기 위해 quasi-synchronous 스케줄링 기법을 도입하여 MAC unit 활용도를 향상시킵니다. 제안된 MAC array 아키텍처는 기존 최고 성능 아키텍처에 비해 면적 효율을 29.2% 향상시키고, 근사적인 변형은 에너지 효율을 추가로 7.5% 향상시킵니다.