दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मॉड्यूलर प्रॉम्प्ट संरचना के माध्यम से अनुकूलित मल्टी-टास्क प्रॉम्प्ट ट्यूनिंग के साथ फ्यू-शॉट ट्रांसफर लर्निंग को बढ़ाना

Created by
  • Haebom

लेखक

अहमद पौरामिनी, हेशाम फ़ैली

रूपरेखा

बहु-कार्य प्रॉम्प्ट ट्यूनिंग के प्रदर्शन को बेहतर बनाने के लिए, यह शोधपत्र एक ऐसी विधि प्रस्तावित करता है जो प्रत्येक कार्य के प्रॉम्प्ट को साझा प्रॉम्प्ट (स्रोत प्रॉम्प्ट) और कार्य-विशिष्ट प्रॉम्प्ट (निजी प्रॉम्प्ट) में विघटित कर देती है। प्रशिक्षण के दौरान, स्रोत प्रॉम्प्ट को परिष्कृत किया जाता है और प्रत्येक कार्य के लिए लक्ष्य प्रॉम्प्ट उत्पन्न करने हेतु निजी प्रॉम्प्ट के साथ संयोजित किया जाता है। हम स्रोत प्रॉम्प्ट को संयोजित करने, स्रोत और निजी प्रॉम्प्ट की भूमिकाओं का विश्लेषण करने और प्रदर्शन को अनुकूलित करने हेतु लचीले और ट्यून करने योग्य कॉन्फ़िगरेशन प्रदान करने हेतु कई विधियाँ प्रस्तुत और तुलना करते हैं। प्रायोगिक परिणाम मौजूदा प्रॉम्प्ट ट्यूनिंग विधियों और संबंधित शोध की तुलना में बेहतर सटीकता और सुदृढ़ता प्रदर्शित करते हैं, और विभिन्न कार्यों पर, विशेष रूप से स्मॉल-शॉट सेटिंग में, GLUE बेंचमार्क सहित, अन्य विधियों से बेहतर प्रदर्शन करते हैं। इस उपलब्धि के लिए काफ़ी कम प्रशिक्षण डेटा की आवश्यकता होती है, जो दर्शाता है कि यह विधि स्मॉल-शॉट सेटिंग में उपयोगी है।

Takeaways, Limitations

Takeaways:
मल्टी-टास्क प्रॉम्प्ट ट्यूनिंग के प्रदर्शन में सुधार के लिए एक नवीन विधि प्रस्तुत की गई है।
स्रोत प्रॉम्प्ट और निजी प्रॉम्प्ट की भूमिकाओं का स्पष्ट विश्लेषण करें, और इसके आधार पर लचीला कॉन्फ़िगरेशन प्रदान करें।
छोटे शॉट सेटिंग्स में मौजूदा तरीकों से बेहतर प्रदर्शन करता है
यह दर्शाता है कि प्रशिक्षण डेटा की थोड़ी मात्रा के साथ उच्च प्रदर्शन प्राप्त किया जा सकता है।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन को निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न कार्यों और मॉडलों के लिए मापनीयता मूल्यांकन की आवश्यकता है।
स्रोत संकेत चयन और संयोजन रणनीतियों को अनुकूलित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍