दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अनिश्चित मानव मार्गदर्शन के साथ सुदृढीकरण सीखने द्वारा जटिल मॉडल परिवर्तन

Created by
  • Haebom

लेखक

क्याना डेगेनैस, इस्तवान डेविड

रूपरेखा

यह शोधपत्र मॉडल-आधारित इंजीनियरिंग में जटिल मॉडल रूपांतरण (MT) अनुक्रमों को कुशलतापूर्वक विकसित करने के लिए एक सुदृढीकरण अधिगम (RL)-आधारित ढाँचा प्रस्तुत करता है। मॉडल सिंक्रनाइज़ेशन, स्वचालित मॉडल पुनर्प्राप्ति और डिज़ाइन स्पेस एक्सप्लोरेशन सहित विभिन्न समस्याओं के लिए जटिल MT अनुक्रमों की आवश्यकता होती है। हालाँकि, इन्हें मैन्युअल रूप से विकसित करना त्रुटि-प्रवण और चुनौतीपूर्ण है। इस शोधपत्र में, हम एक दृष्टिकोण और तकनीकी ढाँचा प्रस्तावित करते हैं जो एक RL एजेंट को उपयोगकर्ता सलाह का उपयोग करके इष्टतम MT अनुक्रम खोजने में सक्षम बनाता है, जिसमें अनिश्चितता भी शामिल हो सकती है। हम उपयोगकर्ता-परिभाषित MTs को RL प्राइमिटिव्स में मैप करते हैं और इष्टतम MT अनुक्रमों को खोजने के लिए उन्हें RL प्रोग्राम के रूप में निष्पादित करते हैं। प्रायोगिक परिणाम प्रदर्शित करते हैं कि अनिश्चितता की स्थिति में भी, उपयोगकर्ता सलाह RL प्रदर्शन में उल्लेखनीय रूप से सुधार करती है, जिससे जटिल MTs के अधिक कुशल विकास में योगदान मिलता है। यह अध्ययन उपयोगकर्ता सलाह की निश्चितता और समय के बीच के अंतर को संबोधित करके RL-आधारित मानव-इन-द-लूप इंजीनियरिंग पद्धति को आगे बढ़ाता है।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि एक आर.एल.-आधारित ढांचा जो अनिश्चित उपयोगकर्ता सलाह को शामिल करता है, जटिल मॉडल परिवर्तन अनुक्रमों को विकसित करने की दक्षता में सुधार कर सकता है।
हम मानव-इन-लूप इंजीनियरिंग पद्धतियों में आर.एल. को प्रभावी ढंग से लागू करने के लिए एक नवीन दृष्टिकोण प्रस्तुत करते हैं।
हम उपयोगकर्ता की सलाह की निश्चितता और समय के बीच के समझौते पर विचार करके व्यावहारिक आरएल-आधारित प्रणालियों के डिजाइन में अंतर्दृष्टि प्रदान करते हैं।
Limitations:
प्रस्तावित ढाँचे की व्यापकता और मापनीयता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है। विभिन्न प्रकार के मॉडलों और समस्याओं पर इसकी प्रयोज्यता का और अधिक सत्यापन किया जाना आवश्यक है।
उपयोगकर्ता सलाह की गुणवत्ता और मात्रा के आधार पर प्रदर्शन परिवर्तनों का अधिक गहन विश्लेषण आवश्यक है।
वास्तविक इंजीनियरिंग वातावरण में इसकी प्रयोज्यता और व्यावहारिकता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍