दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

X-सिम: रियल-टू-सिम-टू-रियल के माध्यम से क्रॉस-एम्बोडीमेंट लर्निंग

Created by
  • Haebom

लेखक

पृथ्विश डैन, कुशल केडिया, एंजेला चाओ, एडवर्ड वेई डुआन, मैक्सिमस एड्रियन पेस, वेई-चिउ मा, संजीबन चौधरी

रूपरेखा

यह शोधपत्र एक वास्तविक-से-सिम-से-वास्तविक ढाँचा प्रस्तावित करता है, जिसे X-Sim कहा जाता है। मानवीय गति की नकल करने के बजाय, X-Sim, RGBD छवियों से वस्तु गति को निकालकर वस्तु-केंद्रित पुरस्कारों को परिभाषित करता है, जिनका उपयोग फिर एक सुदृढीकरण अधिगम (RL) एजेंट को प्रशिक्षित करने के लिए किया जाता है। सीखी गई नीति को विभिन्न दृष्टिकोणों और प्रकाश व्यवस्था के साथ रेंडर किए गए सिंथेटिक रोलआउट का उपयोग करके एक छवि-सशर्त प्रसार नीति में परिवर्तित किया जाता है। वास्तविक परिवेश में स्थानांतरित करने के लिए, हम ऑनलाइन डोमेन अनुकूलन का उपयोग करके वास्तविक और सिम्युलेटेड प्रेक्षणों को संरेखित करते हैं। हम रोबोट टेलीऑपरेशन डेटा की आवश्यकता के बिना पाँच हेरफेर कार्यों में प्रदर्शन में औसतन 30% सुधार प्रदर्शित करते हैं, मौजूदा विधियों की तुलना में 10 गुना कम डेटा अधिग्रहण समय के साथ समान प्रदर्शन प्राप्त करते हैं, और नए कैमरा दृष्टिकोणों और परीक्षण समय के लिए अच्छा सामान्यीकरण प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
हम यह प्रदर्शित करते हैं कि मानव गति की नकल किए बिना रोबोट हेरफेर नीतियों को सीखना संभव है।
ऑब्जेक्ट-केंद्रित क्षतिपूर्ति का उपयोग करके वास्तविक-से-सिमुलेशन स्थानांतरण प्रदर्शन में सुधार करना।
ऑनलाइन डोमेन अनुकूलन तकनीकों के माध्यम से वास्तविक दुनिया की प्रयोज्यता में वृद्धि करना।
डेटा संग्रहण समय कम करें और सामान्यीकरण प्रदर्शन में सुधार करें।
Limitations:
RGBD छवि डेटा पर निर्भर करता है.
यह नकली और वास्तविक वातावरण के बीच के अंतर को पाटने का आदर्श समाधान नहीं है।
प्रस्तुत पांच हेरफेर कार्यों के अलावा अन्य कार्यों के लिए सामान्यीकरण प्रदर्शन को और अधिक सत्यापन की आवश्यकता है।
👍