यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र दृष्टि-भाषा अन्वेषण (वीएलएन) में बड़े पैमाने के भाषा मॉडलों (एलएलएम) की सीमाओं को दूर करने के लिए एक स्व-विकासशील वीएलएन ढाँचा (एसई-वीएलएन) प्रस्तावित करता है। एसई-वीएलएन में एक पदानुक्रमित स्मृति मॉड्यूल होता है जो निरंतर सीखने और विकास के माध्यम से अनुभवात्मक ज्ञान का उपयोग करता है, सफलता और विफलता के मामलों को पुन: प्रयोज्य ज्ञान में परिवर्तित करता है; एक पुनर्प्राप्ति-संवर्धित चिंतन-आधारित तर्क मॉड्यूल जो अनुभव को पुनः प्राप्त करता है और बहु-चरणीय निर्णय लेने में सक्षम बनाता है; और एक प्रतिबिंब मॉड्यूल जो निरंतर विकास को सक्षम बनाता है। यह R2R और REVERSE डेटासेट पर पिछले अत्याधुनिक मॉडलों की तुलना में क्रमशः 23.9% और 15.0% प्रदर्शन सुधार प्राप्त करता है, और अज्ञात वातावरणों में 57% और 35.2% सफलता दर प्राप्त करता है। यह दर्शाता है कि अनुभव भंडार के बढ़ने के साथ प्रदर्शन में सुधार होता है, जो एक स्व-विकासशील वीएलएन एजेंट ढाँचे के रूप में इसकी अपार क्षमता का संकेत देता है।
Takeaways, Limitations
•
Takeaways:
◦
एलएलएम-आधारित वीएलएन में अनुभवात्मक ज्ञान उपयोग और आत्म-विकास क्षमताओं को लागू करने का पहला प्रयास।
◦
R2R और REVERSE डेटासेट पर पिछले अत्याधुनिक तरीकों की तुलना में महत्वपूर्ण प्रदर्शन सुधार।
◦
अनुभव संचय के आधार पर प्रदर्शन सुधार के माध्यम से स्व-विकसित एजेंटों की क्षमता का प्रदर्शन करना।
•
Limitations:
◦
प्रस्तावित ढांचे की कम्प्यूटेशनल लागत और जटिलता के विश्लेषण का अभाव।
◦
विभिन्न वातावरणों और कार्यों में सामान्यीकरण प्रदर्शन का आगे मूल्यांकन आवश्यक है।
◦
वास्तविक दुनिया के अनुप्रयोगों के लिए और अधिक अनुसंधान और विकास की आवश्यकता है।