दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

टोकन प्रीपेंडिंग: एलएलएम से बेहतर वाक्य एम्बेडिंग प्राप्त करने के लिए एक प्रशिक्षण-मुक्त दृष्टिकोण

Created by
  • Haebom

लेखक

युचेन फू, ज़िफेंग चेंग, झिवेई जियांग, झोंगहुई वांग, याफेंग यिन, झेंग्लिआंग ली, किंग गु

रूपरेखा

इस पत्र में, हम बड़े पैमाने पर भाषा मॉडल (LLM) से वाक्य एम्बेडिंग निकालने के लिए एक नई तकनीक, टोकन प्रीपेंडिंग (TP) का प्रस्ताव करते हैं। मौजूदा विधियाँ LLM को प्रॉम्प्ट इंजीनियरिंग के माध्यम से अंतिम टोकन के एम्बेडिंग में वाक्य की जानकारी को एनकोड करने के लिए प्रेरित करती हैं, लेकिन इससे कारणात्मक ध्यान के कारण पक्षपाती एन्कोडिंग और कैस्केडिंग प्रभाव होता है, जो शुरुआती टोकन को बाद के टोकन को संदर्भित करने से रोकता है। TP प्रत्येक परत के डिकोड किए गए वाक्य एम्बेडिंग को अगली परत के इनपुट वाक्यों में जोड़ता है, ताकि शुरुआती टोकन पूरी वाक्य जानकारी पर ध्यान दे सकें। यह एक प्लग-एंड-प्ले, प्रशिक्षण-मुक्त तकनीक है जिसे विभिन्न प्रॉम्प्ट-आधारित वाक्य एम्बेडिंग विधियों और ऑटोरिग्रैसिव LLM के साथ सहजता से एकीकृत किया जा सकता है। विभिन्न अर्थपूर्ण पाठ समानता (STS) कार्यों और उपवर्गीकरण कार्यों पर व्यापक प्रयोगों के माध्यम से, हम प्रदर्शित करते हैं कि TP मौजूदा विधियों के प्रदर्शन में उल्लेखनीय रूप से सुधार करता है जबकि अनुमान लागत में मामूली वृद्धि करता है।

Takeaways, Limitations

Takeaways:
एलएलएम-आधारित वाक्य एम्बेडिंग निष्कर्षण के प्रदर्शन को बेहतर बनाने के लिए एक नवीन टीपी तकनीक प्रस्तावित की गई है।
प्लग-एंड-प्ले तरीके से मौजूदा प्रॉम्प्ट-आधारित विधियों के साथ एकीकृत करना आसान है।
किसी सीखने की आवश्यकता नहीं, वस्तुतः कोई अतिरिक्त लागत नहीं।
विभिन्न एसटीएस कार्यों और उपवर्गीकरण कार्यों पर प्रदर्शन सुधारों को प्रयोगात्मक रूप से मान्य करें।
Limitations:
यह निर्धारित करने के लिए आगे के अध्ययन की आवश्यकता है कि क्या इस पत्र में प्रस्तुत टीपी तकनीक की प्रभावशीलता सभी एलएलएम और सभी प्रॉम्प्ट-आधारित वाक्य एम्बेडिंग विधियों पर लागू होती है।
विभिन्न प्रकार के ध्यान तंत्रों का उपयोग करते हुए एलएलएम के लिए प्रयोज्यता और प्रभावशीलता विश्लेषण की आवश्यकता है।
अत्यंत लंबे वाक्यों के लिए टीपी तकनीकों की दक्षता और प्रदर्शन का मूल्यांकन करने की आवश्यकता है।
👍