दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

पॉलीमैथ: गतिशील पदानुक्रमित वर्कफ़्लो वाला एक स्व-अनुकूलन एजेंट

Created by
  • Haebom

लेखक

चिया-तुंग हो, जिंग गोंग, जुफेंग याओ, युनशेंग बाई, अभिषेक बी अक्कुर, हाओक्सिंग रेन

रूपरेखा

बड़े पैमाने के भाषा मॉडल (एलएलएम) पर आधारित एजेंट प्रणालियों की दक्षता और मापनीयता की सीमाओं को संबोधित करने के लिए, यह शोधपत्र पॉलीमैथ का प्रस्ताव करता है, जो स्व-अनुकूलन क्षमताओं वाला एक बहुस्तरीय वर्कफ़्लो एजेंट है। पॉलीमैथ, वर्कफ़्लो ग्राफ़ के लचीलेपन और कोड-आधारित वर्कफ़्लो की अभिव्यंजक शक्ति का लाभ उठाकर विभिन्न प्रकार की वास्तविक दुनिया की समस्याओं को हल करता है। यह लेबल किए गए डेटा के बिना भी, बहु-ग्रिड-आधारित ग्राफ़ अनुकूलन और स्व-प्रतिबिंब-आधारित विकासवादी एल्गोरिदम को एकीकृत करके वर्कफ़्लो को बेहतर बनाता है। कोडिंग, गणित और बहु-दौर प्रश्न-उत्तर सहित छह बेंचमार्क डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि पॉलीमैथ, अत्याधुनिक बेसलाइन मॉडलों से औसतन 8.1% बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
हम एक स्व-अनुकूलन एजेंट प्रस्तुत करते हैं जो लेबल किए गए डेटा के बिना वास्तविक दुनिया की समस्याओं को हल करने में सक्षम है।
अधिक लचीलेपन और अभिव्यक्ति के लिए वर्कफ़्लो ग्राफ़ और कोड-आधारित वर्कफ़्लो के लाभों को संयोजित करें।
बहु-ग्रिड-आधारित ग्राफ अनुकूलन और आत्म-प्रतिबिंब-आधारित विकासवादी एल्गोरिदम का उपयोग करके प्रभावी वर्कफ़्लो अनुकूलन।
विभिन्न क्षेत्रों में बेंचमार्क में मौजूदा मॉडलों की तुलना में प्रदर्शन में सुधार प्रदर्शित किया गया।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन और विभिन्न प्रकार की समस्याओं पर इसकी प्रयोज्यता का मूल्यांकन करने के लिए आगे अनुसंधान की आवश्यकता है।
प्रयोग केवल छह बेंचमार्क डेटासेट का उपयोग करके किए गए, जिसके लिए अधिक विविध और व्यापक प्रयोगों की आवश्यकता थी।
आत्म-प्रतिबिंब आधारित विकासवादी एल्गोरिदम की जटिलता और कम्प्यूटेशनल लागत पर विचार किया जाना चाहिए।
👍