दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बड़े भाषा मॉडल को एकीकृत करने वाले ऑन-रैंप मर्जिंग नियंत्रण के लिए एक कैस्केडिंग सहकारी बहु-एजेंट फ्रेमवर्क

Created by
  • Haebom

लेखक

मियाओ झांग, जेनलोंग फांग, तियान्यी वांग, कियान झांग, शुआई लू, जुनफेंग जिओ, तियान्यू शि

रूपरेखा

इस पत्र में, हम पारंपरिक सुदृढीकरण अधिगम (RL) की सीमाओं, जैसे मानव-समान व्यवहारों की प्रतिकृति बनाने में कठिनाई, बहु-एजेंट परिवेशों में प्रभावी सामान्यीकरण, और व्याख्यात्मकता संबंधी समस्याओं, को दूर करने के लिए एक पदानुक्रमित सहकारी बहु-एजेंट (CCMA) ढाँचा प्रस्तावित करते हैं। CCMA व्यक्तिगत एजेंट अंतःक्रियाओं के लिए RL, स्थानीय सहयोग के लिए परिष्कृत LLM, वैश्विक अनुकूलन के लिए एक पुरस्कार फलन, और जटिल ड्राइविंग परिदृश्यों में गतिशील निर्णय अनुकूलन के लिए एक खोज-संवर्धित उत्पादन तंत्र को एकीकृत करता है। प्रायोगिक परिणाम दर्शाते हैं कि CCMA पारंपरिक RL विधियों की तुलना में जटिल ड्राइविंग परिवेशों में सूक्ष्म और वृहद, दोनों स्तरों पर प्रदर्शन में उल्लेखनीय सुधार करता है।

Takeaways, Limitations

Takeaways:
एक नया बहु-एजेंट सहयोग ढांचा प्रस्तुत किया गया है जो मौजूदा आरएल के __T5315__ पर काबू पाता है।
एलएलएम का उपयोग करके मल्टी-एजेंटों के सहयोग और सामान्यीकरण प्रदर्शन में सुधार
जटिल ड्राइविंग परिदृश्यों में बेहतर सूक्ष्म और स्थूल प्रदर्शन
खोज संवर्द्धन निर्माण तंत्र के माध्यम से गतिशील निर्णय अनुकूलन
Limitations:
प्रस्तावित ढांचे की वास्तविक दुनिया में प्रयोज्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
एलएलएम में फाइन-ट्यूनिंग और रिवॉर्ड फंक्शन डिज़ाइन की जटिलता
विशिष्ट ड्राइविंग वातावरण के लिए प्रदर्शन का मूल्यांकन करके सामान्यीकरण की आगे की पुष्टि की आवश्यकता है।
अन्य बहु-एजेंट प्रणालियों के लिए मापनीयता पर और अधिक शोध की आवश्यकता है।
👍