본 논문은 노래 멜로디 추출(SME) 과제를 해결하기 위해 효율성과 정확성을 향상시킨 SpectMamba라는 새로운 방법을 제안합니다. 기존 방법들의 한계점인 transformer 기반 모델의 계산 복잡도, 주파수 기반의 f0 추정, 그리고 부족한 라벨링 데이터 문제를 해결하기 위해, SpectMamba는 vision mamba를 이용하여 선형 시간 복잡도를 달성하고, 음표 기반의 f0 디코더와 confidence binary regularization(CBR) 모듈을 도입하여 음악적 성능을 더 잘 모방하고 라벨 없는 데이터를 활용합니다. 여러 공개 데이터셋에서의 실험 결과는 제안된 방법의 효과를 보여줍니다.