Bài báo này nghiên cứu các kỹ thuật tinh chỉnh hiệu quả tham số (PEFT), đặc biệt là các phương pháp dựa trên bộ điều hợp, cho các mô hình tạo nhạc quy mô lớn như MusicGen và Mustango. Chúng tôi khám phá các thiết kế bộ điều hợp tối ưu bằng cách so sánh các cấu hình bộ điều hợp khác nhau (kiến trúc, bố cục và kích thước) cho hai thể loại nhạc thưa thớt tài nguyên: nhạc cổ điển Hindustani và nhạc Makam của Thổ Nhĩ Kỳ. Chúng tôi thấy rằng các bộ điều hợp dựa trên tích chập vượt trội về các chi tiết âm nhạc chi tiết, trong khi các bộ điều hợp dựa trên bộ biến áp bảo tồn tốt hơn các phụ thuộc dài hạn. Hơn nữa, chúng tôi thấy rằng một bộ điều hợp cỡ trung bình (40 triệu tham số) cung cấp sự cân bằng tối ưu giữa khả năng biểu đạt và chất lượng. Mustango (một mô hình dựa trên khuếch tán) cung cấp tính đa dạng tuyệt vời nhưng lại gặp phải tình trạng không ổn định, trong khi MusicGen (một mô hình tự hồi quy) đào tạo nhanh chóng và tạo ra các hiện vật chất lượng cao nhưng tạo ra các hiện vật hơi dư thừa.