ImprovNet은 변환기 기반 아키텍처를 사용하여 표현력 있고 제어 가능한 음악 즉흥 연주를 생성하는 모델입니다. 자기 지도 학습 방식인 손상-개선 전략을 통해 훈련되며, 멜로디, 화성, 리듬 등 하나 이상의 음악 요소에 대한 의미 있는 수정을 통해 장르 간 및 장르 내 즉흥 연주, 장르 특정 스타일을 사용한 멜로디 화성화, 짧은 프롬프트 연속 및 채우기 작업을 수행할 수 있습니다. 반복적인 생성 프레임워크를 통해 사용자는 스타일 전환 정도와 원곡과의 구조적 유사성을 제어할 수 있습니다. 객관적 및 주관적 평가 결과, ImprovNet은 음악적으로 일관성 있는 즉흥 연주를 생성하는 동시에 원곡과의 구조적 관계를 유지하는 데 효과적임을 보여줍니다. 특히 짧은 연속 및 채우기 작업에서 Anticipatory Music Transformer를 능가하며, 79%의 참가자가 클래식 악곡의 재즈 스타일 즉흥 연주를 정확하게 식별했습니다.