दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सक्रिय शिक्षण और अधिकतम संभाव्यता अनुमान के साथ बहु-उद्देश्यीय संयोजन अनुकूलन के लिए वरीयता उद्दीपन

Created by
  • Haebom

लेखक

मैरिएन डिफ्रेस्ने, जयंता मंडी, टियास गन्स

रूपरेखा

यह शोधपत्र एक वास्तविक-विश्व संयोजन अनुकूलन समस्या पर विचार करता है जिसमें मूल्य, उत्पाद गुणवत्ता और स्थायित्व जैसे कई परस्पर विरोधी उद्देश्य शामिल हैं। यद्यपि कई उद्देश्यों को एक एकल उद्देश्य फलन (जैसे, रैखिक संयोजन) में एकत्रित करने के लिए गणना-योग्य रूप से कुशल विधियाँ मौजूद हैं, रैखिक संयोजनों के भारों को पूर्वनिर्धारित करना चुनौतीपूर्ण है। एक विकल्प के रूप में, इंटरैक्टिव शिक्षण विधियाँ जो उपयोगकर्ताओं से उम्मीदवार समाधानों की तुलना करने के लिए कहती हैं, आशाजनक हैं। मुख्य चुनौतियाँ हैं उम्मीदवारों को शीघ्रता से उत्पन्न करना, एक ऐसा उद्देश्य फलन सीखना जो उच्च-गुणवत्ता वाले समाधानों की ओर ले जाए, और उपयोगकर्ता इंटरैक्शन को न्यूनतम करना। यह शोधपत्र रचनात्मक वरीयता उद्दीपन (CPE) ढाँचे पर आधारित एक विधि प्रस्तावित करता है जो तीन विशेषताओं में सुधार करती है: इंटरैक्शन गति, लर्निंग प्रदर्शन और उपयोगकर्ता इंटरैक्शन की संख्या। इंटरैक्शन गति में सुधार के लिए, हम एक (आरामदायक) समाधान पूल का उपयोग करते हैं। लर्निंग प्रदर्शन को बढ़ाने के लिए, हम ब्रैडली-टेरी वरीयता मॉडल के अधिकतम संभाव्यता अनुमान का उपयोग करते हैं। उपयोगकर्ता इंटरैक्शन की संख्या को कम करने के लिए, हम सक्रिय लर्निंग से प्रेरित एक समूह-आधारित अधिग्रहण फ़ंक्शन का उपयोग करते हैं। पीसी कॉन्फ़िगरेशन कार्यों और यथार्थवादी बहु-आवृत्ति रूटिंग समस्याओं पर किए गए प्रयोगों से पता चलता है कि हमारी विधि मौजूदा सीपीई विधियों की तुलना में तेजी से क्वेरी चयन, कम क्वेरी और उच्च गुणवत्ता वाले संयोजन समाधान प्राप्त करती है।

Takeaways, Limitations

Takeaways:
बहु-उद्देश्यीय संयोजन अनुकूलन समस्याओं के लिए एक कुशल इंटरैक्टिव शिक्षण विधि प्रस्तुत की गई है।
सीपीई फ्रेमवर्क में बेहतर इंटरैक्शन गति, सीखने का प्रदर्शन और उपयोगकर्ता इंटरैक्शन की संख्या।
वास्तविक दुनिया की समस्याओं (पीसी कॉन्फ़िगरेशन, मल्टी-इंस्टेंस रूटिंग) में मौजूदा तरीकों की तुलना में बेहतर प्रदर्शन का प्रदर्शन किया।
ब्रैडली-टेरी मॉडल और समूह-आधारित अधिग्रहण कार्यों का प्रभावी उपयोग।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार की संयोजन अनुकूलन समस्याओं के लिए प्रयोज्यता सत्यापन आवश्यक है।
उपयोगकर्ता वरीयता मॉडल की सटीकता पर निर्भरता.
बड़े पैमाने की समस्याओं के लिए मापनीयता की समीक्षा आवश्यक है।
👍