यह शोधपत्र बहु-एजेंट पाथफाइंडिंग (MAPF) समस्या के लिए एक नवीन वितरित अधिगम-आधारित ढाँचा प्रस्तुत करता है। विद्यमान अधिगम-आधारित MAPF विधियाँ सीमित दृष्टि क्षेत्र (FOV) पर आधारित निर्णय लेने के कारण अल्पकालिक नीतियों और अकुशल सहयोग जैसी सीमाओं से ग्रस्त हैं। इन सीमाओं को दूर करने के लिए, यह अध्ययन एक नवीन ढाँचा प्रस्तावित करता है जो वितरित गहन सुदृढीकरण अधिगम पर शीफ सिद्धांत लागू करता है। यह ढाँचा घनिष्ठ सहयोगात्मक निर्णय लेने को सक्षम बनाने के लिए अनेक एजेंटों के बीच ज्यामितीय अंतर-निर्भरताओं को सीखता और उनका लाभ उठाता है। शीफ सिद्धांत के आधार पर, हम स्थानीय सहमति के माध्यम से वैश्विक सहमति प्राप्त करने की स्थितियों को गणितीय रूप से सिद्ध करते हैं। इसके आधार पर, हम एक तंत्रिका नेटवर्क का उपयोग करके अव्यक्त स्थान में सहमति का अनुमान लगाते हैं और उसे स्व-पर्यवेक्षित अधिगम के माध्यम से प्रशिक्षित करते हैं। प्रत्येक एजेंट, विद्यमान MAPF विधियों जैसी सामान्य विशेषताओं के अतिरिक्त, पाथफाइंडिंग और टकराव से बचाव के लिए कुशल सहयोग को सुगम बनाने हेतु सीखी गई सहमति विशेषताओं पर अनुमान वितरित करता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि अत्याधुनिक अधिगम-आधारित MAPF नियोजकों से, विशेष रूप से अपेक्षाकृत बड़े और जटिल परिदृश्यों में, उल्लेखनीय रूप से बेहतर प्रदर्शन करती है। इसके अलावा, प्रस्तावित विधि विभिन्न सिमुलेशन और वास्तविक दुनिया रोबोट प्रयोगों में बेसलाइन मॉडल से बेहतर प्रदर्शन करती है।