यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
बड़े पैमाने पर शारीरिक अंतःक्रिया डेटा पर निर्भरता की प्रमुख बाधा को दूर करने के लिए, यह शोधपत्र आदिम सन्निहित विश्व मॉडल (PEWM) प्रस्तावित करता है, जो सीमित, अल्पकालिक समय-सीमाओं पर केंद्रित एक नवीन विश्व मॉडलिंग प्रतिमान है। वीडियो निर्माण को एक निश्चित, अल्पकालिक समय-सीमा तक सीमित करके, PEWM भाषाई अवधारणाओं और रोबोट गतियों के दृश्य निरूपणों के बीच सूक्ष्म संरेखण को सक्षम बनाता है, प्रशिक्षण जटिलता को कम करता है, शारीरिक डेटा संग्रह की दक्षता में सुधार करता है, और अनुमान विलंबता को कम करता है। एक मॉड्यूलर विज़न-लैंग्वेज मॉडल (VLM) प्लानर और एक स्टार्ट-गोल हीटमैप गाइडेंस मैकेनिज्म (SGG) से सुसज्जित, यह लचीला क्लोज्ड-लूप नियंत्रण सक्षम करता है और जटिल कार्यों के लिए आदिम-स्तरीय नीतियों के रचनात्मक सामान्यीकरण का समर्थन करता है। वीडियो मॉडल के स्थानिक-कालिक दृश्य पूर्ववर्तियों और VLM की अर्थगत समझ का लाभ उठाते हुए, यह सूक्ष्म-कणीय शारीरिक अंतःक्रिया और उच्च-स्तरीय अनुमान के बीच की खाई को पाटता है, जिससे मापनीय, व्याख्या योग्य और सामान्य-उद्देश्यीय शारीरिक बुद्धिमत्ता का मार्ग प्रशस्त होता है।
Takeaways, Limitations
•
Takeaways:
◦
एक नया विश्व मॉडलिंग प्रतिमान प्रस्तुत करना जो बड़े पैमाने पर डेटा निर्भरता की समस्या का समाधान करता है।
◦
भाषा और व्यवहार के बीच बेहतर संरेखण
◦
प्रशिक्षण जटिलता और अनुमान विलंबता में कमी
◦
डेटा-कुशल शारीरिक डेटा संग्रह संभव
◦
जटिल कार्यों के लिए रचनात्मक सामान्यीकरण का समर्थन
◦
मापनीय, व्याख्या योग्य और सामान्य प्रयोजन वाली शारीरिक बुद्धिमत्ता की संभावना प्रस्तुत करना।
•
Limitations:
◦
सीमित अल्पकालिक क्षितिज के कारण दीर्घकालिक योजना और पूर्वानुमान में कठिनाई
◦
आदिम व्यवहारों के एक निश्चित सेट पर निर्भरता के कारण सीमित लचीलापन
◦
वीएलएम और एसजीजी के प्रदर्शन पर निर्भरता
◦
वास्तविक रोबोट प्रणालियों पर प्रयोज्यता और सामान्यीकरण प्रदर्शन का आगे सत्यापन आवश्यक है।