दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

CODA: द्वि-मस्तिष्क कंप्यूटर उपयोग एजेंट के लिए सेरेब्रम और सेरिबैलम का समन्वय, वियुग्मित सुदृढीकरण अधिगम के साथ

Created by
  • Haebom

लेखक

ज़ेई सन, युहांग काओ, जियानज़े लियांग, किउशी सन, ज़ियू लियू, ज़िक्सियॉन्ग झांग, युहांग ज़ैंग, ज़ियाओयी डोंग, काई चेन, दहुआ लिन, जियाकी वांग

रूपरेखा

यह शोधपत्र वैज्ञानिक कंप्यूटिंग जैसे विशिष्ट क्षेत्रों में ग्राफ़िकल यूज़र इंटरफ़ेस (GUI) के लिए स्वायत्त एजेंटों के डिज़ाइन के लिए एक नवीन दृष्टिकोण प्रस्तुत करता है। यह दृष्टिकोण दीर्घकालिक योजना और सटीक निष्पादन, दोनों की आवश्यकता वाली स्थितियों में मौजूदा सामान्य और विशेषज्ञ एजेंटों की सीमाओं को दूर करता है। जहाँ मौजूदा दृष्टिकोणों में योजना और निष्पादन क्षमताओं के बीच एक समझौता होता है, वहीं हम CODA प्रस्तुत करते हैं, जो एक सीखने योग्य, रचनात्मक ढाँचा है जो एक सामान्य योजनाकार (सेरेब्रम) और एक विशेषज्ञ निष्पादक (सेरिबैलम) को एकीकृत करता है। CODA को दो-चरणीय पाइपलाइन के माध्यम से प्रशिक्षित किया जाता है। पहले चरण, विशेषज्ञता, में प्रत्येक वैज्ञानिक अनुप्रयोग के लिए विशेषज्ञ योजनाकारों को व्यक्तिगत रूप से प्रशिक्षित किया जाता है। दूसरे चरण, सामान्यीकरण, में सभी सफल प्रक्षेप पथों को एकत्रित किया जाता है और अंतिम योजनाकार के पर्यवेक्षित फ़ाइन-ट्यूनिंग के लिए उपयोग किया जाता है। यह सुनिश्चित करता है कि CODA में मज़बूत निष्पादन और क्रॉस-डोमेन सामान्यीकरण, दोनों क्षमताएँ मौजूद हैं। साइंसबोर्ड बेंचमार्क के चार कार्यों में, CODA मौजूदा विधियों से काफ़ी बेहतर प्रदर्शन करता है और ओपन-सोर्स मॉडलों में सर्वोच्च प्रदर्शन प्राप्त करता है।

Takeaways, Limitations

Takeaways:
वैज्ञानिक कंप्यूटिंग में GUI स्वायत्त एजेंटों के प्रदर्शन में सुधार करने के लिए एक नया दृष्टिकोण।
सामान्य नियोजन कौशल को व्यावसायिक निष्पादन कौशल के साथ संयोजित करके मौजूदा सीमाओं पर विजय प्राप्त करना
सीखने योग्य, विन्यास योग्य ढांचे के माध्यम से अनुभव से अनुकूलनशीलता
सीमित डेटा वातावरण में भी प्रभावी प्रदर्शन प्राप्त करें
ओपन सोर्स मॉडलों में सर्वोच्च प्रदर्शन
Limitations:
प्रस्तावित ढांचे की सामान्यीकरणीयता का आगे मूल्यांकन आवश्यक है।
विभिन्न वैज्ञानिक क्षेत्रों और अधिक जटिल GUI वातावरणों के लिए मापनीयता सत्यापन आवश्यक है।
साइंसबोर्ड बेंचमार्क के अलावा अन्य बेंचमार्क पर प्रदर्शन मूल्यांकन आवश्यक है।
प्रशिक्षण डेटा की गुणवत्ता पर निर्भरता का आकलन करने की आवश्यकता
👍