본 논문은 주의 기반 아키텍처(예: Conformer)의 확장성 한계를 극복하기 위해, 선형 확장성을 제공하는 xLSTM 아키텍처를 단일 채널 음성 향상 시스템에 처음으로 적용한 xLSTM-SENet을 제안합니다. VoiceBank+Demand 데이터셋을 사용한 비교 분석 결과, xLSTM 기반 모델(심지어 LSTM 기반 모델조차)이 다양한 모델 크기에서 최첨단 Mamba 및 Conformer 기반 시스템과 비슷하거나 더 나은 성능을 보임을 확인했습니다. 특히, 지수 게이팅과 양방향성이 성능에 중요하게 기여함을 ablation study를 통해 밝혔으며, 최적화된 xLSTM-SENet2 모델은 유사한 복잡도를 가진 최첨단 Mamba 및 Conformer 기반 시스템을 능가하는 성능을 보였습니다.