दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

यूएडी: रोबोटिक हेरफेर में सामान्यीकरण के लिए अप्रशिक्षित सामर्थ्य आसवन

Created by
  • Haebom

लेखक

यिहे तांग, वेनलोंग हुआंग, यिंगके वांग, चेंगशु ली, रॉय युआन, रूओहान झांग, जियाजुन वू, ली फी-फी

रूपरेखा

यह शोधपत्र असंरचित वातावरणों में रोबोटिक वस्तुओं के हेरफेर के लिए सूक्ष्म वस्तु सामर्थ्य को समझने के महत्व पर प्रकाश डालता है। मौजूदा दृश्य विशेषता पूर्वानुमान विधियाँ मैन्युअल रूप से एनोटेट किए गए डेटा पर निर्भरता या उनकी सीमाओं के कारण सीमित हैं, जो उन्हें एक पूर्वनिर्धारित कार्य समूह तक सीमित कर देती हैं। इसके उत्तर में, हम अनसुपरवाइज्ड अफोर्डेंस डिस्टिलेशन (UAD) प्रस्तुत करते हैं, एक ऐसी विधि जो किसी आधारभूत मॉडल से विशेषता ज्ञान को बिना किसी मैन्युअल एनोटेशन के एक कार्य-सशर्त विशेषता मॉडल में आसवित करती है। बड़े पैमाने के विज़न मॉडल और विज़न-लैंग्वेज मॉडल की पूरक शक्तियों का लाभ उठाते हुए, UAD स्वचालित रूप से <निर्देश, दृश्य विशेषता> युग्मों के एक बड़े डेटासेट पर एनोटेशन करता है। एक हल्के कार्य-सशर्त डिकोडर को स्थिर विशेषताओं पर प्रशिक्षित करके, UAD वास्तविक दुनिया के रोबोटिक वातावरणों और विविध मानवीय गतिविधियों में उल्लेखनीय सामान्यीकरण प्रदर्शन प्रदर्शित करता है, भले ही इसे सिमुलेशन में केवल रेंडर की गई वस्तुओं पर ही प्रशिक्षित किया गया हो। यूएडी द्वारा अवलोकन स्थान के रूप में प्रदान की गई विशेषताओं का उपयोग करते हुए, हम एक अनुकरण सीखने की नीति का प्रस्ताव करते हैं जो केवल 10 उदाहरणों पर प्रशिक्षण के बाद भी, अदृश्य वस्तु उदाहरणों, वस्तु श्रेणियों और कार्य निर्देशों में विविधताओं में आशाजनक सामान्यीकरण प्रदर्शन को प्रदर्शित करता है।

Takeaways, Limitations

Takeaways:
मैन्युअल एनोटेशन के बिना बड़े डेटासेट को स्वचालित रूप से एनोटेट करके एफोर्डेंस लर्निंग को सक्षम करें।
केवल सिमुलेशन डेटा का उपयोग करके वास्तविक वातावरण में सामान्यीकरण प्रदर्शन को सुरक्षित करने के लिए मूल मॉडल का उपयोग करना।
नवीन वस्तुओं और कार्य निर्देशों के लिए सामान्यीकरण प्रदर्शन को केवल कुछ ही अनुकरणीय शिक्षण परीक्षणों के साथ प्रदर्शित किया जाता है।
यह अनुकरण सीखने की नीति के साथ संयोजन के माध्यम से वास्तविक रोबोट हेरफेर के लिए प्रयोज्यता का सुझाव देता है।
Limitations:
सिमुलेशन डेटा पर निर्भरता के कारण वास्तविक वातावरण में डोमेन गैप की समस्या हो सकती है।
यह आधार मॉडल के प्रदर्शन पर निर्भर करता है, और आधार मॉडल की सीमाएं UAD के प्रदर्शन को प्रभावित कर सकती हैं।
विभिन्न वस्तुओं और कार्यों में सामान्यीकरण प्रदर्शन की सीमाओं पर आगे अध्ययन की आवश्यकता है।
👍