दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ह्यूम: दृश्य-भाषा-क्रिया मॉडल में सिस्टम-2 सोच का परिचय

Created by
  • Haebom

लेखक

हाओमिंग सॉन्ग, डेलिन क्व, युआनकी याओ, किझी चेन, क्यूई लव, यिवेन तांग, मोदी शि, गुआंगहुई रेन, माओकिंग याओ, बिन झाओ, डोंग वांग, ज़ुएलोंग ली

रूपरेखा

इस पत्र का उद्देश्य रोबोट-आधारित मॉडलों को मानव जैसी सोच क्षमताएं प्रदान करना है, जो भौतिक दुनिया में जटिल कार्यों को करते समय वास्तविक क्रियाओं को करने से पहले मनुष्यों द्वारा धीमी गति से सोचने के तरीके से प्रेरणा लेता है। इस उद्देश्य के लिए, हम ह्यूम का प्रस्ताव करते हैं, जो मूल्य-आधारित सिस्टम 2 सोच और कैस्केडिंग एक्शन डेनॉइजिंग के साथ एक दोहरे-सिस्टम विज़न-लैंग्वेज-एक्शन (वीएलए) मॉडल है। ह्यूम का सिस्टम 2 अनुमानित क्रियाओं के स्टेट-एक्शन मूल्य का अनुमान लगाने के लिए एक उपन्यास वैल्यू क्वेरी हेड का उपयोग करता है, और मूल्य-निर्देशित सोच को लागू करता है जो बार-बार कई एक्शन उम्मीदवारों का नमूना लेता है और स्टेट-एक्शन मूल्य के आधार पर एक का चयन करता है। सिस्टम 1 एक हल्की प्रतिक्रियाशील दृश्य-मोटर नीति है प्रायोगिक परिणाम दर्शाते हैं कि ह्यूम कई सिमुलेशन बेंचमार्क और वास्तविक रोबोट परिनियोजन पर मौजूदा अत्याधुनिक वीएलए मॉडल से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
जटिल कार्यों को करने की क्षमता में सुधार करने के लिए रोबोट नियंत्रण में धीमी मानवीय विचार प्रक्रिया को लागू करना।
मूल्य-संचालित सोच कुशल कार्य चयन और योजना को सक्षम बनाती है।
सिस्टम 1 और सिस्टम 2 की दोहरी प्रणाली वास्तुकला के माध्यम से वास्तविक समय प्रदर्शन और नियोजन क्षमताओं के बीच संतुलन बनाए रखना।
विभिन्न सिमुलेशन और वास्तविक रोबोट वातावरण में उत्कृष्ट प्रदर्शन सत्यापन।
Limitations:
प्रस्तावित मॉडल के मूल्य फ़ंक्शन और इसके सामान्यीकरण प्रदर्शन को सीखने की प्रभावशीलता पर आगे अनुसंधान की आवश्यकता है।
विभिन्न जटिल कार्य वातावरणों के लिए आगे सामान्यीकरण निष्पादन मूल्यांकन की आवश्यकता है।
वास्तविक दुनिया की जटिलता और अनिश्चितता को पूरी तरह से संभालने की अपनी सीमाएं हो सकती हैं।
सिस्टम 2 के कम आवृत्ति संचालन के कारण संभावित विलंब समस्याएँ।
👍