दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

टोकनसेलेक्ट: गतिशील टोकन-स्तरीय केवी कैश चयन के माध्यम से एलएलएम के लिए कुशल दीर्घ-संदर्भ अनुमान और लंबाई एक्सट्रपलेशन

Created by
  • Haebom

लेखक

वेई वू, झुओशी पैन, चाओ वांग, लियि चेन, युनचु बाई, तियानफू वांग, कुन फू, झेंग वांग, हुई जिओंग

रूपरेखा

लंबे-पाठ संदर्भ प्रसंस्करण में प्रदर्शन में गिरावट और गणना संबंधी जटिलता के मुद्दों को हल करने के लिए, यह शोधपत्र डायनेमिक टोकन-स्तरीय KV कैश चयन (TokenSelect) का प्रस्ताव करता है, जो एक नवीन, प्रशिक्षण-मुक्त विधि है। TokenSelect, टोकन-स्तरीय महत्व मापों के आधार पर केवल महत्वपूर्ण KV कैश टोकन का चयनात्मक रूप से उपयोग करके ध्यान गणना करता है। यह क्वेरी समानता अवलोकनों और एक कुशल पृष्ठांकित डॉट उत्पाद कर्नेल के आधार पर डिज़ाइन किए गए चयन कैश का उपयोग करके चयन ओवरहेड को कम करता है और गति में सुधार करता है। प्रायोगिक परिणाम दर्शाते हैं कि TokenSelect मौजूदा विधियों से बेहतर प्रदर्शन करता है, जिससे ध्यान गणना गति में 23.84 गुना तक की वृद्धि और एंड-टू-एंड विलंबता में 2.28 गुना तक की कमी प्राप्त होती है।

Takeaways, Limitations

Takeaways:
प्रशिक्षण के बिना दीर्घकालिक संदर्भ प्रसंस्करण की गति और सटीकता में एक साथ सुधार करने के लिए एक प्रभावी विधि प्रस्तुत की गई है।
मौजूदा लंबे-पाठ संदर्भ प्रसंस्करण विधियों की गति में गिरावट की समस्या को प्रभावी ढंग से हल करता है, जो कि Limitations है।
टोकन-स्तरीय महत्व मापन और वैकल्पिक केवी कैश उपयोग के माध्यम से कम्प्यूटेशनल लागत में कमी।
Limitations:
ऐसी संभावना है कि प्रस्तावित विधि का प्रदर्शन विशिष्ट डेटासेट या मॉडल के प्रति पक्षपाती हो सकता है।
चयन कैश और पृष्ठांकित डॉट उत्पाद कर्नेल की प्रभावशीलता डेटासेट आकार या मॉडल आकार के आधार पर भिन्न हो सकती है।
विभिन्न प्रकार के एलएलएम और अनुप्रयोग क्षेत्रों पर आगे और प्रयोग की आवश्यकता है।
👍