aTENNuate는 효율적인 실시간 원시 음성 향상을 위해 설계된 간단한 심층 상태 공간 오토인코더입니다. 네트워크 성능은 주로 원시 음성 잡음 제거에 대해 평가되었으며, 초고해상도 및 양자화 해제와 같은 추가 작업에 대한 평가도 포함됩니다. VoiceBank + DEMAND 및 Microsoft DNS1 합성 테스트 세트에서 aTENNuate를 벤치마킹했습니다. 이 네트워크는 PESQ 점수, 매개변수 수, MAC 및 대기 시간 측면에서 이전 실시간 잡음 제거 모델보다 성능이 뛰어납니다. 원시 파형 처리 모델이지만 청각적 인공물이 최소화된 상태에서 깨끗한 신호에 대한 높은 충실도를 유지합니다. 또한, 잡음이 포함된 입력이 4000Hz 및 4비트로 압축된 경우에도 성능이 유지되어 저자원 환경에서 일반적인 음성 향상 기능을 나타냅니다. pip install attenuate를 통해 사용해 볼 수 있습니다.