यह शोधपत्र बड़े पैमाने पर संगीत निर्माण मॉडल, जैसे कि MusicGen और Mustango, के लिए पैरामीटर-कुशल फ़ाइन-ट्यूनिंग (PEFT) तकनीकों, विशेष रूप से एडाप्टर-आधारित विधियों का अध्ययन करता है। हम दो संसाधन-विरल संगीत शैलियों: हिंदुस्तानी शास्त्रीय संगीत और तुर्की मकम संगीत, के लिए विभिन्न एडाप्टर कॉन्फ़िगरेशन (आर्किटेक्चर, लेआउट और आकार) की तुलना करके इष्टतम एडाप्टर डिज़ाइनों का पता लगाते हैं। हम पाते हैं कि कन्वोल्यूशन-आधारित एडाप्टर सूक्ष्म संगीत विवरणों में उत्कृष्ट होते हैं, जबकि ट्रांसफ़ॉर्मर-आधारित एडाप्टर दीर्घकालिक निर्भरताओं को बेहतर ढंग से संरक्षित करते हैं। इसके अलावा, हम पाते हैं कि एक मध्यम आकार का एडाप्टर (40M पैरामीटर) अभिव्यक्ति और गुणवत्ता के बीच इष्टतम संतुलन प्रदान करता है। Mustango (एक प्रसार-आधारित मॉडल) उत्कृष्ट विविधता प्रदान करता है लेकिन अस्थिरता से ग्रस्त है, जबकि MusicGen (एक ऑटोरिग्रैसिव मॉडल) तेज़ी से प्रशिक्षित होता है और उच्च-गुणवत्ता वाले आर्टिफ़ैक्ट उत्पन्न करता है लेकिन कुछ हद तक अनावश्यक आर्टिफ़ैक्ट उत्पन्न करता है।