본 논문은 오디오 손상 복구를 위한 새로운 접근 방식을 제시한다. 사전 훈련된 오디오 토크나이저에서 얻은 토큰화된 음악 표현에 이산 확산 방식을 적용하여, 긴 간격의 손상된 오디오를 안정적이고 의미 있게 복원하는 것을 목표로 한다. 특히, 시간적 동역학을 부드럽게 유지하는 파생 기반 정규화 손실과, 확산 과정에서 구조화된 손상을 제공하는 스팬 기반 흡수 전이를 도입했다. MusicNet 및 MAESTRO 데이터셋에서 최대 750ms 간격의 손상에 대한 실험 결과, 제안하는 방법이 150ms 이상의 간격에서 강력한 기준선을 일관되게 능가하는 성능을 보였다.