यह शोधपत्र एक नवीन ढाँचा प्रस्तुत करता है जो गैर-अभ्यास-आधारित हेरफेर की समस्या को हल करने के लिए मॉडल-आधारित और अधिगम-आधारित दृष्टिकोणों को जोड़ता है। मॉडल-आधारित दृष्टिकोणों की दक्षता को अधिगम-आधारित दृष्टिकोणों की सुदृढ़ता के साथ संयोजित करके, हम कम्प्यूटेशनल रूप से कुशल संपर्क निहित प्रक्षेप पथ अनुकूलन (CITO) पर आधारित एक प्रदर्शन-निर्देशित गहन सुदृढीकरण अधिगम (RL) डिज़ाइन करके नमूना-कुशल अधिगम प्राप्त करते हैं, जो स्पष्ट रूप से संपर्क बिंदुओं पर विचार करता है। इसके अलावा, हम एक विशेषाधिकार प्राप्त प्रशिक्षण रणनीति का उपयोग करते हुए एक सिमुलेशन-टू-रियल ट्रांसफर दृष्टिकोण प्रस्तुत करते हैं जो एक रोबोट को विशेषाधिकार प्राप्त जानकारी (जैसे, वस्तु का द्रव्यमान, आकार, या मुद्रा) के बिना, केवल प्रोप्रियोसेप्शन, दृष्टि और बल संवेदन का उपयोग करके पिवट हेरफेर करने में सक्षम बनाता है। कई पिवट कार्यों पर मूल्यांकन सिमुलेशन-टू-रियल ट्रांसफर के सफल कार्यान्वयन को प्रदर्शित करता है। अधिक जानकारी YouTube लिंक पर दिए गए वीडियो में मिल सकती है।