본 논문은 식별 가능한 실제 세계의 사운드 이벤트를 청취자에게 공개하지 않는 추상적인 사운드를 정의하고, 원본 사운드와 참조 사운드를 합성하여 단순한 덧셈보다 뛰어난 청각적 특징을 갖는 새로운 사운드를 생성하는 사운드 융합 기술을 제안합니다. DPMSolver++ 샘플러 기반의 새로운 SDE 및 ODE 역변환 모델을 사용하여 원본 샘플의 필수적인 특징을 유지하면서 제어 가능한 합성을 가능하게 합니다. 노이즈 예측 항으로 인한 순환적 의존성을 제거하기 위해 모델 출력을 상수로 설정하여 샘플링 과정을 역전시키는 역변환 기법을 제시하며, 이는 프롬프트 조건 없이도 유연한 가이드를 제공합니다.