यह शोधपत्र सिम्फनी नामक एक वितरित बहु-एजेंट प्रणाली का प्रस्ताव करता है, जो मौजूदा केंद्रीकृत बड़े पैमाने के भाषा मॉडल (एलएलएम)-आधारित एजेंट ढाँचों की उच्च परिनियोजन लागत, अनम्य संचार टोपोलॉजी और सीमित अनुकूलनशीलता को संबोधित करती है। सिम्फनी उपभोक्ता-स्तरीय GPU पर हल्के एलएलएम के समन्वय को सक्षम बनाता है और तीन प्रमुख तंत्र प्रस्तुत करता है: विशेषताओं को रिकॉर्ड करने के लिए एक वितरित लेज़र, गतिशील कार्य आवंटन के लिए एक बीकन चयन प्रोटोकॉल, और CoT-आधारित भारित-परिणाम मतदान। यह डिज़ाइन एक कम-ओवरहेड समन्वय प्रणाली बनाता है जो गोपनीयता-संरक्षण, मापनीय और दोष-सहिष्णु है। प्रयोगात्मक रूप से, सिम्फनी अनुमान बेंचमार्क पर मौजूदा बेसलाइन से बेहतर प्रदर्शन करती है, और मॉडल क्षमताओं की एक विस्तृत श्रृंखला में महत्वपूर्ण सटीकता लाभ और मजबूत प्रदर्शन प्रदर्शित करती है।