본 논문은 식별 가능한 실제 세계의 사운드 이벤트를 청취자에게 드러내지 않는 추상적인 사운드에 대해 논의합니다. 사운드 융합을 통해 원본 사운드와 참조 사운드를 합성하여 단순한 덧셈적 중첩을 넘어서는 청각적 특징을 보이는 새로운 사운드를 생성하는 것을 목표로 합니다. 이를 위해 원본 샘플의 필수적인 특징을 보존하면서 제어 가능한 합성을 가능하게 하는 역변환 기법을 사용합니다. DPMSolver++ 샘플러를 기반으로 하는 새로운 SDE 및 ODE 역변환 모델을 제안하여, 모델 출력을 상수로 구성함으로써 샘플링 과정을 역전시키고 노이즈 예측 항에 의한 순환적 의존성을 제거합니다. 본 논문의 역변환 방식은 샘플링 중 유연한 안내를 유지하면서 프롬프트 조건 지정이 필요하지 않습니다.