दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

टेबुला रासा से उभरती क्षमताओं तक: वास्तविक दुनिया के अप्रशिक्षित गुणवत्ता-विविधता के माध्यम से रोबोट कौशल की खोज

Created by
  • Haebom

लेखक

लुका ग्रिलोटी (एआईआरएल, इंपीरियल कॉलेज लंदन), लिसा कोइफर्ड (एआईआरएल, इंपीरियल कॉलेज लंदन), ऑस्कर पैंग (एआईआरएल, इंपीरियल कॉलेज लंदन), मैक्सेंस फाल्डोर (एआईआरएल, इंपीरियल कॉलेज लंदन), एंटोनी कुली (एआईआरएल, इंपीरियल कॉलेज लंदन)

रूपरेखा

इस पत्र का उद्देश्य स्वायत्त कौशल खोज को प्राप्त करना है, जिससे रोबोट बिना किसी स्पष्ट पर्यवेक्षण के विविध व्यवहार प्राप्त कर सकें। मौजूदा गुणवत्ता-विविधता अभिनेता-आलोचक (QDAC) विधियों के लिए मैन्युअल रूप से परिभाषित कौशल स्थानों और सावधानीपूर्वक ट्यून किए गए हेयुरिस्टिक्स की आवश्यकता होती है, जो उनके व्यावहारिक अनुप्रयोग को सीमित करता है। इस पत्र में, हम QDAC के एक विस्तार, अनसुपरवाइज्ड रियल-वर्ल्ड स्किल एक्विजिशन (URSA) का प्रस्ताव करते हैं, जो रोबोट को वास्तविक दुनिया के वातावरण में स्वायत्त रूप से विविध और उच्च-प्रदर्शन कौशल की खोज करने और उनमें महारत हासिल करने में सक्षम बनाता है। हम प्रदर्शित करते हैं कि URSA सिम्युलेटेड और वास्तविक दुनिया दोनों वातावरणों में Unitree A1 चौपाया रोबोट के लिए विविध गति कौशलों की सफलतापूर्वक खोज करता है। यह हेयुरिस्टिक-आधारित कौशल खोज और पूरी तरह से अनसुपरवाइज्ड शिक्षण वातावरण दोनों का समर्थन करता है

Takeaways, Limitations

Takeaways:
वास्तविक दुनिया के वातावरण में रोबोट द्वारा स्वायत्त कौशल खोज और निपुणता के लिए एक नया ढांचा।
QDAC के Limitations में मैनुअल स्किल स्पेस डेफिनिशन और ह्यूरिस्टिक ट्यूनिंग की आवश्यकता को संबोधित करना
हेयुरिस्टिक-आधारित और पूर्णतः अप्रशिक्षित शिक्षण वातावरण दोनों का समर्थन करता है
वास्तविक दुनिया की क्षति के अनुकूलन सहित, बाद के कार्यों में सीखे गए कौशल की पुनः प्रयोज्यता का प्रमाण।
वास्तविक दुनिया की रोबोटिक प्रणालियों की स्वायत्तता और अनुकूलनशीलता में सुधार करने में योगदान देता है
Limitations:
यूनिट्री ए1 चतुर्भुज रोबोट के लिए केवल प्रायोगिक परिणाम प्रस्तुत किए गए हैं, तथा अन्य रोबोट प्लेटफार्मों के लिए सामान्यीकरण निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
वास्तविक दुनिया के प्रयोगों का पैमाना और विविधता सीमित हो सकती है।
अप्रशिक्षित शिक्षण की प्रकृति के कारण, शिक्षण प्रक्रिया में अप्रत्याशितता और स्थिरता संबंधी समस्याएं उत्पन्न होने की संभावना रहती है।
👍