दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

राज्य-स्तरीय प्रक्षेप पथ सिलाई के माध्यम से सुदृढ़ ऑफ़लाइन अनुकरण शिक्षण

Created by
  • Haebom

लेखक

शुज़े वांग, युनपेंग मेई, होंगजी काओ, येतिआन युआन, गैंग वांग, जियान सन, जी चेन

रूपरेखा

यह शोधपत्र एक ऑफ़लाइन IL विधि प्रस्तुत करता है जो उच्च-गुणवत्ता वाले विशेषज्ञ डेटा की कमी और अनुकरण अधिगम (IL) में सहचर बदलाव को दूर करने के लिए निम्न-गुणवत्ता वाले, लेबल रहित डेटा का लाभ उठाती है। विशेष रूप से, हम एक अवस्था-आधारित खोज ढाँचा प्रस्तुत करते हैं जो अपूर्ण प्रदर्शन डेटा से अवस्था-क्रिया युग्मों को जोड़ता है, और विविध और सूचना-समृद्ध प्रशिक्षण पथ उत्पन्न करता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि मानक IL बेंचमार्क और वास्तविक दुनिया के रोबोटिक कार्यों पर सामान्यीकरण और प्रदर्शन दोनों में उल्लेखनीय सुधार करती है।

Takeaways, Limitations

Takeaways:
हम निम्न-गुणवत्ता वाले डेटा का लाभ उठाकर अनुकरण सीखने की डेटा दक्षता में सुधार करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
राज्य-आधारित पुनर्प्राप्ति ढांचा अधिक विविध और सूचना-समृद्ध प्रशिक्षण डेटा के सृजन को सक्षम बनाता है।
वास्तविक रोबोटिक कार्यों में प्रदर्शन सुधार को सत्यापित करके व्यावहारिकता साबित करना।
Limitations:
प्रस्तावित विधि के प्रदर्शन में सुधार विशिष्ट बेंचमार्क और रोबोटिक कार्यों तक सीमित हो सकता है।
राज्य-आधारित खोज ढाँचे कम्प्यूटेशनल दृष्टि से महंगे हो सकते हैं।
विभिन्न प्रकार के निम्न-गुणवत्ता वाले डेटा पर सामान्यीकरण प्रदर्शन मूल्यांकन का अभाव हो सकता है।
👍