दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कुशल रोबोट संचालन के लिए ऑन-डिवाइस डिफ्यूजन ट्रांसफॉर्मर नीति

Created by
  • Haebom

लेखक

यिमिंग वू, हुआन वांग, झेंगहाओ चेन, जियानक्सिन पैंग, डोंग जू

रूपरेखा

यह शोधपत्र LightDP का प्रस्ताव करता है, जो एक नवीन ढाँचा है जिसे प्रसार नीतियों के वास्तविक समय परिनियोजन में तेज़ी लाने के लिए डिज़ाइन किया गया है, जो सीमित मोबाइल उपकरण संसाधनों के कारण संघर्ष करती हैं। LightDP दो प्रमुख रणनीतियों के माध्यम से अभिकलन संबंधी बाधाओं का समाधान करता है: शोर-निरोधक मॉड्यूल का नेटवर्क संपीड़न और आवश्यक नमूनाकरण चरणों में कमी। हम विलंबता में प्राथमिक योगदानकर्ता के रूप में शोर-निरोधक नेटवर्क की पहचान करने के लिए मौजूदा प्रसार नीति आर्किटेक्चर का व्यापक अभिकलनात्मक विश्लेषण करते हैं। मौजूदा प्रूनिंग विधियों से जुड़े प्रदर्शन में गिरावट को दूर करने के लिए, हम एक एकीकृत प्रूनिंग और पुनर्प्रशिक्षण पाइपलाइन प्रस्तुत करते हैं जो मॉडल के प्रूनिंग-पश्चात लचीलेपन को स्पष्ट रूप से अनुकूलित करती है। इसके अलावा, हम प्रूनिंग तकनीकों को संगति आसवन के साथ संयोजित करते हैं ताकि क्रिया पूर्वानुमान सटीकता बनाए रखते हुए नमूनाकरण चरणों को प्रभावी ढंग से कम किया जा सके। PushT, Robomimic, CALVIN, और LIBERO जैसे मानक डेटासेट पर प्रायोगिक मूल्यांकन दर्शाते हैं कि LightDP मोबाइल उपकरणों पर वास्तविक समय क्रिया पूर्वानुमान के लिए प्रतिस्पर्धी प्रदर्शन प्राप्त करता है, जो संसाधन-सीमित वातावरण में प्रसार-आधारित नीतियों के व्यावहारिक परिनियोजन की दिशा में एक महत्वपूर्ण कदम है। व्यापक वास्तविक-विश्व प्रयोगों से पता चलता है कि प्रस्तावित लाइटडीपी अत्याधुनिक प्रसार नीतियों के बराबर प्रदर्शन प्राप्त करता है।

Takeaways, Limitations

Takeaways:
हम एक लाइटडीपी फ्रेमवर्क प्रस्तुत करते हैं जो मोबाइल उपकरणों पर प्रसार नीतियों के वास्तविक समय वितरण को सक्षम बनाता है।
नेटवर्क संपीड़न और कम नमूनाकरण चरणों के माध्यम से कम्प्यूटेशनल बाधाओं को संबोधित करना।
एकीकृत छंटाई और पुनःप्रशिक्षण पाइपलाइन के साथ छंटाई के बाद प्रदर्शन में गिरावट को कम करना।
नमूनाकरण चरणों को कम करें और स्थिरता आसवन का उपयोग करके सटीकता बनाए रखें।
विविध डेटासेट (पुशटी, रोबोमिमिक, कैल्विन, लिबरो) पर वास्तविक समय गति पूर्वानुमान और अत्याधुनिक प्रदर्शन प्राप्त करें।
Limitations:
लाइटडीपी का प्रदर्शन सुधार विशिष्ट डेटासेट और आर्किटेक्चर पर निर्भर हो सकता है।
प्रस्तावित छंटाई और पुनःप्रशिक्षण रणनीति के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
वास्तविक दुनिया के वातावरण में रोबोट हेरफेर कार्यों की विविधता पर विचार करने के लिए अतिरिक्त प्रयोगों की आवश्यकता है।
ऊर्जा खपत के विश्लेषण का अभाव।
👍