दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सिग्मा: शेफ-सूचित ज्यामितीय बहु-एजेंट पथ-खोज

Created by
  • Haebom

लेखक

शुहाओ लियाओ, वेइहांग ज़िया, युहोंग काओ, वेइहेंग दाई, चेंगयांग हे, वेनजुन वू, गुइलाउम सार्टोरेटी

रूपरेखा

यह शोधपत्र बहु-एजेंट पाथफाइंडिंग (MAPF) समस्या के लिए एक नवीन वितरित अधिगम-आधारित ढाँचा प्रस्तुत करता है। विद्यमान अधिगम-आधारित MAPF विधियाँ सीमित दृष्टि क्षेत्र (FOV) पर आधारित निर्णय लेने के कारण अल्पकालिक नीतियों और अकुशल सहयोग जैसी सीमाओं से ग्रस्त हैं। इन सीमाओं को दूर करने के लिए, यह अध्ययन एक नवीन ढाँचा प्रस्तावित करता है जो वितरित गहन सुदृढीकरण अधिगम पर शीफ सिद्धांत लागू करता है। यह ढाँचा घनिष्ठ सहयोगात्मक निर्णय लेने को सक्षम बनाने के लिए अनेक एजेंटों के बीच ज्यामितीय अंतर-निर्भरताओं को सीखता और उनका लाभ उठाता है। शीफ सिद्धांत के आधार पर, हम स्थानीय सहमति के माध्यम से वैश्विक सहमति प्राप्त करने की स्थितियों को गणितीय रूप से सिद्ध करते हैं। इसके आधार पर, हम एक तंत्रिका नेटवर्क का उपयोग करके अव्यक्त स्थान में सहमति का अनुमान लगाते हैं और उसे स्व-पर्यवेक्षित अधिगम के माध्यम से प्रशिक्षित करते हैं। प्रत्येक एजेंट, विद्यमान MAPF विधियों जैसी सामान्य विशेषताओं के अतिरिक्त, पाथफाइंडिंग और टकराव से बचाव के लिए कुशल सहयोग को सुगम बनाने हेतु सीखी गई सहमति विशेषताओं पर अनुमान वितरित करता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि अत्याधुनिक अधिगम-आधारित MAPF नियोजकों से, विशेष रूप से अपेक्षाकृत बड़े और जटिल परिदृश्यों में, उल्लेखनीय रूप से बेहतर प्रदर्शन करती है। इसके अलावा, प्रस्तावित विधि विभिन्न सिमुलेशन और वास्तविक दुनिया रोबोट प्रयोगों में बेसलाइन मॉडल से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
सीमित अवलोकन और संचार वातावरण में भी कुशल बहु-एजेंट सहयोग को सक्षम करने के लिए परत सिद्धांत का लाभ उठाना।
वितरित गहन सुदृढीकरण सीखने के माध्यम से एक अत्यधिक स्केलेबल और उत्तरदायी MAPF समाधान प्रदान करना।
हम एक नवीन MAPF प्लानर प्रस्तुत करते हैं जो जटिल वातावरण में मौजूदा विधियों से बेहतर प्रदर्शन करता है।
वास्तविक रोबोट प्रयोगों के माध्यम से एल्गोरिथम की प्रभावशीलता का सत्यापन।
Limitations:
परत सिद्धांत-आधारित सर्वसम्मति मॉडलिंग अनुमानित तरीकों पर निर्भर करती है और पूर्ण सहमति की गारंटी नहीं दे सकती है।
सीखने की प्रक्रिया जटिल और कम्प्यूटेशनल दृष्टि से महंगी हो सकती है।
प्रस्तावित विधि का प्रदर्शन पर्यावरण की जटिलता के आधार पर भिन्न हो सकता है और सभी वातावरणों में सुसंगत प्रदर्शन की गारंटी नहीं दे सकता है।
चूंकि प्रयोग विशिष्ट वातावरणों और रोबोटिक प्रणालियों तक सीमित हो सकते हैं, इसलिए अन्य वातावरणों या प्रणालियों के लिए सामान्यीकरण निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍