Cet article étudie les techniques de réglage fin paramétriquement efficace (PEFT), en particulier les méthodes basées sur des adaptateurs, pour les modèles de génération musicale à grande échelle tels que MusicGen et Mustango. Nous explorons des conceptions d'adaptateurs optimales en comparant différentes configurations (architecture, disposition et taille) pour deux genres musicaux peu gourmands en ressources : la musique classique hindoustanie et la musique makam turque. Nous constatons que les adaptateurs basés sur la convolution excellent dans les détails musicaux fins, tandis que les adaptateurs basés sur des transformateurs préservent mieux les dépendances à long terme. De plus, nous constatons qu'un adaptateur de taille moyenne (40 millions de paramètres) offre un équilibre optimal entre expressivité et qualité. Mustango (un modèle basé sur la diffusion) offre une excellente diversité mais souffre d'instabilité, tandis que MusicGen (un modèle autorégressif) s'entraîne rapidement et produit des artefacts de haute qualité, mais génère des artefacts quelque peu redondants.