यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र एक ऑफ़लाइन IL विधि प्रस्तुत करता है जो उच्च-गुणवत्ता वाले विशेषज्ञ डेटा की कमी और अनुकरण अधिगम (IL) में सहचर बदलाव को दूर करने के लिए निम्न-गुणवत्ता वाले, लेबल रहित डेटा का लाभ उठाती है। विशेष रूप से, हम एक अवस्था-आधारित खोज ढाँचा प्रस्तुत करते हैं जो अपूर्ण प्रदर्शन डेटा से अवस्था-क्रिया युग्मों को जोड़ता है, और विविध और सूचना-समृद्ध प्रशिक्षण पथ उत्पन्न करता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि मानक IL बेंचमार्क और वास्तविक दुनिया के रोबोटिक कार्यों पर सामान्यीकरण और प्रदर्शन दोनों में उल्लेखनीय सुधार करती है।
Takeaways, Limitations
•
Takeaways:
◦
हम निम्न-गुणवत्ता वाले डेटा का लाभ उठाकर अनुकरण सीखने की डेटा दक्षता में सुधार करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
◦
राज्य-आधारित पुनर्प्राप्ति ढांचा अधिक विविध और सूचना-समृद्ध प्रशिक्षण डेटा के सृजन को सक्षम बनाता है।
◦
वास्तविक रोबोटिक कार्यों में प्रदर्शन सुधार को सत्यापित करके व्यावहारिकता साबित करना।
•
Limitations:
◦
प्रस्तावित विधि के प्रदर्शन में सुधार विशिष्ट बेंचमार्क और रोबोटिक कार्यों तक सीमित हो सकता है।
◦
राज्य-आधारित खोज ढाँचे कम्प्यूटेशनल दृष्टि से महंगे हो सकते हैं।
◦
विभिन्न प्रकार के निम्न-गुणवत्ता वाले डेटा पर सामान्यीकरण प्रदर्शन मूल्यांकन का अभाव हो सकता है।