दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

टेबुला रासा से उभरती क्षमताओं तक: वास्तविक दुनिया के अप्रशिक्षित गुणवत्ता-विविधता के माध्यम से रोबोट कौशल की खोज

Created by
  • Haebom

लेखक

लुका ग्रिलोटी (एआईआरएल, इंपीरियल कॉलेज लंदन), लिसा कोइफर्ड (एआईआरएल, इंपीरियल कॉलेज लंदन), ऑस्कर पैंग (एआईआरएल, इंपीरियल कॉलेज लंदन), मैक्सेंस फाल्डोर (एआईआरएल, इंपीरियल कॉलेज लंदन), एंटोनी कुली (एआईआरएल, इंपीरियल कॉलेज लंदन)

रूपरेखा

यह पत्र स्वायत्त कौशल खोज पर केंद्रित है, जहाँ रोबोट बिना किसी स्पष्ट पर्यवेक्षण के विविध व्यवहार प्राप्त करते हैं। मौजूदा गुणवत्ता-विविधता अभिनेता-आलोचक (QDAC) विधियाँ मैन्युअल रूप से परिभाषित कौशल स्थानों और सावधानीपूर्वक ट्यून किए गए अनुमानों पर निर्भर करती हैं, जो वास्तविक दुनिया की स्थितियों में उनकी प्रयोज्यता को सीमित करती हैं। इस पत्र में, हम QDAC के एक विस्तार, अपर्यवेक्षित वास्तविक-विश्व कौशल अधिग्रहण (URSA) का प्रस्ताव करते हैं। URSA रोबोट को वास्तविक दुनिया में विविध और उच्च-प्रदर्शन कौशलों की स्वायत्त खोज और उनमें महारत हासिल करने में सक्षम बनाता है। यूनिट्री A1 चतुर्भुज रोबोट का उपयोग करके सिमुलेशन और वास्तविक दुनिया के प्रयोगों के माध्यम से, हम विविध गति कौशलों की सफल खोज का प्रदर्शन करते हैं, जो अनुमान-आधारित कौशल खोज और पूरी तरह से अपर्यवेक्षित शिक्षण वातावरण दोनों का समर्थन करता है। यह वास्तविक दुनिया में रोबोटिक शिक्षा के लिए एक नया ढांचा प्रस्तुत करता है, जो सीमित मानवीय हस्तक्षेप के साथ निरंतर प्रौद्योगिकी खोज को सक्षम बनाता है, तथा अधिक स्वायत्त और अनुकूल रोबोटिक प्रणालियों की ओर एक महत्वपूर्ण कदम है।

Takeaways, Limitations

Takeaways:
वास्तविक दुनिया में रोबोटों की स्वायत्त कौशल खोज और निपुणता के लिए एक नवीन रूपरेखा (यूआरएसए) प्रस्तुत की गई है।
मैनुअल परिभाषा और हेयुरिस्टिक ट्यूनिंग समस्याओं का समाधान करना जो मौजूदा QDAC विधियों की सीमाएं हैं।
हेयुरिस्टिक-आधारित और पूर्णतः अप्रशिक्षित शिक्षण वातावरण दोनों का समर्थन करता है।
वास्तविक दुनिया में क्षति अनुकूलन जैसे कार्यों में मौजूदा तरीकों की तुलना में बेहतर प्रदर्शन का प्रदर्शन किया।
सीमित मानवीय हस्तक्षेप से निरंतर तकनीकी खोज संभव है।
एक वास्तविक रोबोट (यूनिट्री ए1) का उपयोग करके प्रयोगात्मक परिणामों की प्रस्तुति।
Limitations:
यूआरएसए के सामान्यीकरण प्रदर्शन के आगे सत्यापन की आवश्यकता है (विभिन्न रोबोट प्लेटफार्मों और वातावरणों पर प्रदर्शन मूल्यांकन)।
जटिल कार्यों या अधिक विविध तकनीकी खोजों के लिए मापनीयता समीक्षा आवश्यक है।
वास्तविक दुनिया के अनुप्रयोगों में उत्पन्न होने वाली अप्रत्याशित स्थितियों के लिए मजबूती मूल्यांकन की आवश्यकता होती है।
सीखने की प्रक्रिया की दक्षता में सुधार लाने और सीखने के समय को कम करने के लिए अनुसंधान की आवश्यकता है।
👍