दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

पिक्सेल से प्लानर पुशिंग के लिए प्रसार नीतियों के सिम-और-रियल सह-प्रशिक्षण का अनुभवजन्य विश्लेषण

Created by
  • Haebom

लेखक

एडम वेई, अभिनव अग्रवाल, बोयुआन चेन, रोहन बोसवर्थ, निकोलस फाफ, रस टेड्रेके

रूपरेखा

सिमुलेशन और वास्तविक हार्डवेयर से उत्पन्न प्रदर्शन डेटा का उपयोग करके सहकारी शिक्षण, रोबोटिक्स में अनुकरण शिक्षण के पैमाने को बढ़ाने के लिए एक आशाजनक दृष्टिकोण के रूप में उभरा है। इस अध्ययन का उद्देश्य सिमुलेशन-वास्तविक सह-शिक्षण दृष्टिकोण के मूलभूत सिद्धांतों को स्पष्ट करना है ताकि सिमुलेशन डिज़ाइन, सिमुलेशन और वास्तविक डेटा सेट निर्माण, और नीति प्रशिक्षण को सूचित किया जा सके। प्रायोगिक परिणाम दर्शाते हैं कि सिम्युलेटेड डेटा का उपयोग करके सह-शिक्षण प्रदर्शन में उल्लेखनीय सुधार कर सकता है, खासकर जब वास्तविक डेटा सीमित हो। यह प्रदर्शन सुधार अतिरिक्त सिमुलेशन डेटा के साथ तब तक बढ़ता है जब तक कि एक पठार तक नहीं पहुँच जाता, और अधिक वास्तविक डेटा के जुड़ने से प्रदर्शन की सीमा बढ़ जाती है। इसके अलावा, गैर-ग्रास्पिंग या संपर्क-गहन कार्यों के लिए, भौतिक डोमेन अंतराल को कम करना दृश्य निष्ठा बढ़ाने से अधिक प्रभावी हो सकता है। कुछ आश्चर्यजनक रूप से, हम पाते हैं कि कुछ हद तक दृश्य असमानता सह-शिक्षण के लिए फायदेमंद हो सकती है। बाइनरी जांच दर्शाती है कि उच्च-प्रदर्शन वाली नीतियों को सिम्युलेटेड और वास्तविक डोमेन के बीच अंतर करना सीखना चाहिए। हम सिमुलेशन और वास्तविक दुनिया के कार्यों के बीच सकारात्मक हस्तांतरण को सुगम बनाने वाले सूक्ष्म अंतरों और तंत्रों की जांच करके निष्कर्ष निकालते हैं। समतलीय धक्का के सामान्य कार्य पर हमारे संकीर्ण ध्यान ने हमें एक गहन अध्ययन करने की अनुमति दी। हमने 50 से ज़्यादा वास्तविक दुनिया की नीतियों (जिनका 1,000 से ज़्यादा परीक्षणों में मूल्यांकन किया गया) और 250 नकली नीतियों (जिनका 50,000 से ज़्यादा परीक्षणों में मूल्यांकन किया गया) पर प्रयोग किए। वीडियो और कोड https://sim-and-real-cotraining.github.io/ पर उपलब्ध हैं ।

Takeaways, Limitations

Takeaways:
नकली डेटा का उपयोग करके सहकारी शिक्षण रोबोट-नकल सीखने में प्रदर्शन में काफी सुधार कर सकता है, जहां वास्तविक दुनिया का डेटा सीमित है।
हालाँकि अतिरिक्त सिमुलेशन डेटा प्रदर्शन में सुधार में योगदान देता है, लेकिन एक निश्चित बिंदु के बाद इसका प्रभाव कम हो जाता है। वास्तविक दुनिया का डेटा जोड़ने से प्रदर्शन की सीमा बढ़ जाती है।
ऐसे कार्यों के लिए जिनमें बहुत अधिक सहायता या संपर्क शामिल होता है, भौतिक डोमेन अंतराल को कम करना दृश्य निष्ठा से अधिक महत्वपूर्ण हो सकता है।
दृश्य विभेदन का एक निश्चित स्तर, नकली और वास्तविक डोमेन के बीच अंतर करने की क्षमता में सुधार करके सहयोगात्मक शिक्षण में सहायता कर सकता है।
Limitations:
यह अध्ययन एक विशिष्ट कार्य, फ्लैट पुशिंग तक सीमित था, तथा इसकी सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
सिमुलेशन और वास्तविक दुनिया के डेटा के बीच डोमेन अंतर को पाटने के लिए इष्टतम तरीकों को निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न रोबोटिक कार्यों और वातावरणों के लिए मापनीयता पर आगे अनुसंधान की आवश्यकता है।
👍