यह शोधपत्र, डीप रीइन्फोर्समेंट लर्निंग (RL) की नमूना दक्षता समस्या के समाधान हेतु, मानव गति पूर्वानुमान से प्रेरित एक नवीन विधि, ईगो-फोरसाइट प्रस्तुत करता है। पारंपरिक RL की विशाल प्रशिक्षण डेटा आवश्यकताओं को पूरा करने के लिए, हम एक ऐसा दृष्टिकोण अपनाते हैं जो एजेंट और उसके परिवेश को एक-दूसरे से अलग करता है। हालाँकि, पिछले अध्ययनों के विपरीत, हम एजेंट-पर्यावरण अंतःक्रिया को एजेंट की गतिविधियों का उपयोग करके, बिना किसी पर्यवेक्षित संकेतों के, सीखते हैं। ईगो-फोरसाइट, दृश्य-मोटर पूर्वानुमानों के माध्यम से स्व-पर्यवेक्षित शिक्षण के माध्यम से एजेंट की बोध क्षमता को बढ़ाता है, जिससे वह नकली और वास्तविक दुनिया के रोबोट डेटा से एजेंट की गतिविधियों का पूर्वानुमान लगाने में सक्षम होता है। इसे मॉडल-मुक्त RL एल्गोरिदम के साथ एकीकृत करके, हम बेहतर नमूना दक्षता और प्रदर्शन प्रदर्शित करते हैं।