दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

SCIZOR: बड़े पैमाने पर अनुकरणीय शिक्षण के लिए डेटा संग्रहण हेतु एक स्व-पर्यवेक्षित दृष्टिकोण

Created by
  • Haebom

लेखक

यू झांग, युकी झी, हुइहान लियू, रुतव शाह, माइकल वान, लिनक्सी फैन, युके झू

रूपरेखा

यह शोधपत्र SCIZOR, एक स्व-पर्यवेक्षित अधिगम-आधारित डेटा क्लीनिंग ढाँचा, प्रस्तावित करता है जो अनुकरण अधिगम में बड़े पैमाने के डेटासेट की खराब गुणवत्ता की समस्या का समाधान करता है, जो रोबोटों को विविध व्यवहार करने के लिए प्रशिक्षित करता है। SCIZOR खराब डेटा गुणवत्ता के दो स्रोतों को संबोधित करता है: उप-इष्टतम डेटा (कार्य प्रगति का अभाव) और अनावश्यक पैटर्न। उप-इष्टतम डेटा को एक स्व-पर्यवेक्षित अधिगम-आधारित कार्य प्रगति पूर्वसूचक का उपयोग करके हटाया जाता है, और अनावश्यक डेटा को संयुक्त अवस्था-क्रिया निरूपण के लिए एक डीडुप्लीकेशन मॉड्यूल का उपयोग करके हटाया जाता है। प्रायोगिक परिणाम दर्शाते हैं कि SCIZOR सीमित डेटा के साथ भी उच्च-प्रदर्शन अनुकरण अधिगम नीतियाँ प्राप्त करता है, जिससे विभिन्न बेंचमार्क पर 15.4% का औसत प्रदर्शन सुधार प्राप्त होता है।

Takeaways, Limitations

Takeaways:
स्व-पर्यवेक्षित शिक्षण का उपयोग करते हुए एक कुशल रोबोट डेटा शुद्धिकरण विधि प्रस्तुत की गई है।
डेटासेट या प्रक्षेप पथ स्तर पर मौजूदा अपरिष्कृत शोधन विधियों की तुलना में, राज्य-क्रिया युग्म स्तर पर सटीक शोधन संभव है।
उच्च प्रदर्शन अनुकरण शिक्षण नीतियों को कम डेटा के साथ प्रशिक्षित किया जा सकता है।
उप-इष्टतम और डुप्लिकेट डेटा को एक साथ संसाधित करके डेटा की गुणवत्ता में सुधार करें।
Limitations:
SCIZOR का प्रदर्शन स्व-पर्यवेक्षित शिक्षण-आधारित कार्य प्रगति भविष्यवक्ता और डीडुप्लीकेशन मॉड्यूल के प्रदर्शन पर निर्भर हो सकता है।
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन को निर्धारित करने के लिए और अधिक शोध की आवश्यकता है। विभिन्न रोबोटिक कार्यों और डेटासेट पर इसकी प्रयोज्यता का सत्यापन किया जाना चाहिए।
कार्य प्रगति पूर्वानुमानक और डीडुप्लीकेशन मॉड्यूल के डिजाइन और पैरामीटर सेटिंग्स के अतिरिक्त स्पष्टीकरण और विश्लेषण की आवश्यकता है।
👍