दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एमएम-प्रॉम्प्ट: निरंतर दृश्य प्रश्नोत्तर के लिए क्रॉस-मोडल प्रॉम्प्ट ट्यूनिंग

Created by
  • Haebom

लेखक

जू ली, फैन ल्यू

रूपरेखा

यह शोधपत्र पूर्व-प्रशिक्षित मॉडलों (PTM) पर आधारित सतत दृश्य प्रश्नोत्तर (CVQA) में सतत बहुविध अधिगम को सक्षम करने के लिए प्रॉम्प्ट ट्यूनिंग के उपयोग का अन्वेषण करता है। अधिकांश मौजूदा विधियाँ क्रॉस-मोडल प्रॉम्प्ट को पृथक करती हैं और दृश्य व पाठ्य प्रॉम्प्ट को अलग-अलग बनाती हैं, जिससे मोडल असंतुलन बढ़ता है और समय के साथ प्रदर्शन में गिरावट आती है। इस समस्या के समाधान के लिए, हम MM-प्रॉम्प्ट का प्रस्ताव करते हैं, जो एक नवीन ढाँचा है जो क्रॉस-मोडल प्रॉम्प्ट क्वेरी और क्रॉस-मोडल प्रॉम्प्ट रिकवरी को एकीकृत करता है। MM-प्रॉम्प्ट की क्रॉस-मोडल प्रॉम्प्ट क्वेरी, क्वेरी निर्माण के दौरान क्रॉस-मोडल संकेतों को शामिल करके संतुलित प्रॉम्प्ट चयन को सक्षम बनाती है, जबकि क्रॉस-मोडल प्रॉम्प्ट रिकवरी, अभिव्यंजना में उतार-चढ़ाव को रोकने के लिए संरेखण हानि द्वारा निर्देशित पुनरावृत्त क्रॉस-मोडल अंतःक्रियाओं के माध्यम से संयुक्त प्रॉम्प्ट पुनर्निर्माण की सुविधा प्रदान करती है। व्यापक प्रयोगों से पता चलता है कि MM-प्रॉम्प्ट, सतत अधिगम के दौरान संतुलित मोडल जुड़ाव बनाए रखते हुए सटीकता और ज्ञान धारण के मामले में पिछले तरीकों से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
क्रॉस-मोडल प्रॉम्प्ट क्वेरीज़ और रिकवरी के साथ एक संतुलित मल्टीमॉडल लर्निंग फ्रेमवर्क प्रस्तुत किया गया है।
मौजूदा तरीकों की मॉडल असंतुलन समस्या का समाधान करना और प्रदर्शन में सुधार करना
निरंतर सीखने के माहौल में उच्च सटीकता और ज्ञान प्रतिधारण प्राप्त करना।
Limitations:
प्रस्तावित विधि की प्रभावशीलता विशिष्ट पीटीएम और डेटासेट पर निर्भर हो सकती है। विभिन्न पीटीएम और डेटासेट पर अतिरिक्त प्रयोगों की आवश्यकता है।
संरेखण हानि के माध्यम से प्रतिनिधित्वात्मक उतार-चढ़ाव से बचने के लिए रणनीतियों की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
वास्तविक दुनिया के अनुप्रयोगों में प्रदर्शन मूल्यांकन और मापनीयता पर और अधिक शोध की आवश्यकता है।
👍