본 논문은 에지 디바이스의 실시간 음성 인식을 위해 초저전력 설계를 강조한 71.2 μW의 음성 인식 가속기를 제안합니다. 알고리즘 및 하드웨어의 공동 최적화를 통해 두 개의 순환층, 하나의 완전 연결층 및 낮은 시간 단계(1 또는 2)를 가진 소형 순환 스파이킹 신경망을 제안합니다. 2.79MB 모델은 가지치기 및 4비트 고정 소수점 양자화를 거쳐 크기가 96.42% 감소하여 0.1MB가 됩니다. 하드웨어 측면에서는 혼합 레벨 가지치기, 제로 스키핑 및 병합 스파이크 기법을 활용하여 복잡도를 90.49% 감소시켜 13.86 MMAC/S를 달성합니다. 병렬 시간 단계 실행은 시간 단계 간 데이터 종속성을 해결하고 가중치 공유를 통한 가중치 버퍼 전력 절약을 가능하게 합니다. 희소 스파이크 활동을 활용하는 입력 브로드캐스팅 방식은 제로 연산을 제거하여 전력을 더욱 절약합니다. TSMC 28nm 공정으로 구현된 이 설계는 100kHz로 실시간으로 작동하며 71.2 μW를 소비하여 최첨단 설계를 능가합니다. 500MHz에서 에너지 효율은 28.41 TOPS/W, 면적 효율은 1903.11 GOPS/mm²입니다.