दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रेलगन: विभिन्न वातावरणों और कार्यों में बहु-एजेंट पथ खोज के लिए एक एकीकृत कन्वोल्यूशनल नीति

Created by
  • Haebom

लेखक

यिमिन टैंग, जिओ जिओंग, जिंगी शी, जियाओयांग ली, एर्डेम बी{\I}y{\i}k, स्वेन कोएनिग

रूपरेखा

यह शोधपत्र RAILGUN प्रस्तुत करता है, जो बहु-एजेंट पथ-निर्धारण (MAPF) समस्या के लिए पहली केंद्रीकृत शिक्षण-आधारित नीति है। मौजूदा वितरित शिक्षण-आधारित विधियों के विपरीत, RAILGUN एक पर्यवेक्षित नीति डिज़ाइन करने के लिए CNN-आधारित आर्किटेक्चर का उपयोग करता है, जो मानचित्र आकारों और एजेंट गणनाओं की एक विस्तृत श्रृंखला में सामान्यीकरण को सक्षम बनाता है। मॉडल को नियम-आधारित विधियों से एकत्रित प्रक्षेप पथ डेटा का उपयोग करके पर्यवेक्षित शिक्षण का उपयोग करके प्रशिक्षित किया जाता है। व्यापक प्रयोगात्मक परिणाम दर्शाते हैं कि RAILGUN मौजूदा विधियों से बेहतर प्रदर्शन करता है और उत्कृष्ट शून्य-शॉट सामान्यीकरण प्रदर्शन प्राप्त करता है।

Takeaways, Limitations

Takeaways:
हम बहु-एजेंट पथ-खोज समस्या के लिए पहली केंद्रीकृत शिक्षण-आधारित नीति प्रस्तुत करते हैं।
मानचित्र-आधारित नीतियों के साथ विभिन्न मानचित्र आकारों और एजेंट गणनाओं में सामान्यीकरण का प्रदर्शन करना।
प्रयोगात्मक रूप से सत्यापित किया गया कि शून्य-शॉट सामान्यीकरण प्रदर्शन उत्कृष्ट है।
मौजूदा तरीकों की तुलना में बेहतर प्रदर्शन प्राप्त करें
Limitations:
नियम-आधारित विधियों से एकत्रित डेटा का उपयोग करने वाले पर्यवेक्षित शिक्षण दृष्टिकोणों पर भरोसा करें।
रेलगन की वास्तुकला और प्रशिक्षण प्रक्रिया के विस्तृत विवरण का अभाव (अतिरिक्त जानकारी की आवश्यकता)
अन्य प्रकार की MAPF समस्याओं (जैसे, गतिशील वातावरण) के लिए सामान्यीकरण प्रदर्शन के सत्यापन का अभाव।
👍