[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अंतर्निहित मानवीय प्रतिक्रिया से सुदृढीकरण सीखने के माध्यम से मनुष्यों और रोबोटों को संरेखित करना

Created by
  • Haebom

लेखक

सूजी किम, ह्ये-बिन शिन, सेओंग-व्हान ली

रूपरेखा

इस पत्र में, हम इलेक्ट्रोएन्सेफेलोग्राफी (ईईजी) का उपयोग करते हुए एक अंतर्निहित मानव प्रतिक्रिया-आधारित सुदृढीकरण सीखने (आरएलआईएचएफ) ढांचे का प्रस्ताव करते हैं ताकि पारंपरिक सुदृढीकरण सीखने (आरएल) की सीमाओं को दूर किया जा सके, जो विरल इनाम वातावरण में प्रभावी नीतियों को सीखने के लिए संघर्ष करता है। हम स्पष्ट उपयोगकर्ता हस्तक्षेप के बिना निरंतर अंतर्निहित प्रतिक्रिया प्रदान करने के लिए त्रुटि-संबंधित क्षमताओं (ईआरआरपी) का उपयोग करते हैं, और विरल बाहरी इनाम वातावरण में भी प्रभावी नीति सीखने को सक्षम करने के लिए पूर्व-प्रशिक्षित डिकोडर के माध्यम से कच्चे ईईजी संकेतों को संभाव्य इनाम घटकों में बदलते हैं। हम MuJoCo भौतिकी इंजन पर आधारित सिमुलेशन वातावरण में किनोवा जेन2 रोबोटिक आर्म का उपयोग करके बाधा से बचाव और ऑब्जेक्ट हेरफेर कार्यों पर प्रस्तावित विधि का मूल्यांकन करते हैं।

Takeaways, Limitations

Takeaways:
दुर्लभ पुरस्कार समस्या को हल करने के लिए एक नवीन आरएलएचएफ ढांचा प्रस्तुत किया गया है।
स्पष्ट उपयोगकर्ता हस्तक्षेप के बिना अंतर्निहित प्रतिक्रिया का लाभ उठाकर प्राकृतिक अंतःक्रिया को सक्षम बनाता है
ईईजी-आधारित अंतर्निहित फीडबैक के माध्यम से प्रभावी नीतिगत शिक्षा प्राप्त करना
इंटरैक्टिव रोबोटिक्स के क्षेत्र में स्केलेबल और मानव-केंद्रित सुदृढीकरण सीखने की क्षमता प्रस्तुत करना
Limitations:
वर्तमान में इसका मूल्यांकन केवल सिमुलेशन वातावरण में किया जाता है, वास्तविक रोबोट वातावरण में प्रदर्शन सत्यापन आवश्यक है।
ईईजी सिग्नल व्याख्या की सटीकता और सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है
विभिन्न कार्यों और उपयोगकर्ताओं के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन करने की आवश्यकता
ईईजी डेटा संग्रहण और प्रसंस्करण की जटिलता और लागत को ध्यान में रखा जाना चाहिए।
👍