दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्व-पर्यवेक्षित प्रॉम्प्ट अनुकूलन

Created by
  • Haebom

लेखक

जिंयु जियांग, जियायी झांग, झाओयांग यू, शिनबिंग लियांग, फेंगवेई टेंग, जिंहाओ तू, फाशेन रेन, जियानग्रू तांग, सिरुई होंग, चेंगलिन वू, युयु लुओ

रूपरेखा

यह पत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) की अनुमान क्षमता में सुधार लाने और विभिन्न डोमेन में कार्य आवश्यकताओं के साथ आउटपुट को संरेखित करने के लिए अच्छी तरह से डिज़ाइन किए गए प्रॉम्प्ट के महत्व पर प्रकाश डालता है। मौजूदा प्रॉम्प्ट अनुकूलन विधियां सही उत्तरों या मानवीय हस्तक्षेप जैसे बाहरी संदर्भों पर बहुत अधिक निर्भर करती हैं, जो उन्हें वास्तविक दुनिया के परिदृश्यों तक सीमित कर देती हैं। इसे संबोधित करने के लिए, यह पत्र स्व-पर्यवेक्षित प्रॉम्प्ट अनुकूलन (एसपीओ) का प्रस्ताव करता है, जो एक लागत प्रभावी प्रॉम्प्ट अनुकूलन ढांचा है जिसे बाहरी संदर्भों की आवश्यकता नहीं होती है। एसपीओ एलएलएम आउटपुट तुलनाओं से मूल्यांकन और अनुकूलन संकेत प्राप्त करता है, एलएलएम मूल्यांकनकर्ता का उपयोग करके जोड़ीदार आउटपुट तुलनाओं के माध्यम से बेहतर प्रॉम्प्ट का चयन करता है

Takeaways, Limitations

Takeaways:
बाह्य संदर्भों के बिना प्रॉम्प्ट को कुशलतापूर्वक अनुकूलित करने के लिए एक नई विधि (एसपीओ) प्रस्तुत की गई है।
मौजूदा तरीकों की तुलना में काफी कम लागत और नमूना संख्या के साथ बेहतर प्रदर्शन प्राप्त करें।
विभिन्न कार्यों (बंद और खुले) के लिए प्रयोज्यता।
शीघ्र अनुकूलन को स्वचालित करने के लिए एलएलएम की अपनी क्षमताओं का लाभ उठाएं।
Limitations:
यह एलएलएम मूल्यांकनकर्ता और अनुकूलक के प्रदर्शन पर निर्भर हो सकता है।
यह किसी विशिष्ट LLM के लिए अनुकूलित विधि हो सकती है।
विभिन्न डोमेन और कार्य प्रकारों के लिए सामान्यीकरण प्रदर्शन सत्यापन आवश्यक है।
एलएलएम मूल्यांकनकर्ताओं और अनुकूलकों द्वारा की गई त्रुटियां अंतिम परिणामों को प्रभावित कर सकती हैं।
👍