दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

PTQ1.61: बड़े भाषा मॉडल के लिए अत्यंत निम्न-बिट पोस्ट-ट्रेनिंग क्वांटिज़ेशन विधियों की वास्तविक सीमा को आगे बढ़ाएँ

Created by
  • Haebom

लेखक

जियाकी झाओ, मियाओ झांग, मिंग वांग, युझांग शांग, काइहाओ झांग, वेइली गुआन, याओवेई वांग, मिन झांग

रूपरेखा

अल्ट्रा-लो-बिट (<2-बिट) क्वांटिज़ेशन में गंभीर प्रदर्शन गिरावट से ग्रस्त बड़े पैमाने के भाषा मॉडल (LLM) की समस्या का समाधान करने के लिए, यह शोधपत्र PTQ1.61, एक नवीन अल्ट्रा-लो-बिट पोस्ट-ट्रेनिंग क्वांटिज़ेशन (PTQ) विधि प्रस्तावित करता है जो 1.61-बिट वेट क्वांटिज़ेशन को सक्षम बनाता है। जहाँ मौजूदा विधियाँ प्रति वेट 1 से अधिक अतिरिक्त बिट का उपयोग करती हैं, वहीं PTQ1.61 इनपुट सक्रियण पर आधारित एक-आयामी संरचित मास्क प्रस्तुत करता है जो केवल एक नगण्य 0.0002-बिट अतिरिक्त बिट का उपयोग करता है, महत्वपूर्ण वेट चैनलों को 4 बिट आवंटित करता है, और एक ब्लॉक-वार स्केलिंग कारक अनुकूलन ढाँचे के माध्यम से गैर-महत्वपूर्ण चैनलों पर बाइनरीकरण करता है। इसके अलावा, हम एक नवीन क्वांटिज़ेशन पूर्वप्रसंस्करण प्रतिमान प्रस्तुत करते हैं जो क्वांटिज़ेशन से पहले पूर्व-प्रशिक्षित मॉडल के वेट वितरण को रूपांतरित करके अल्ट्रा-लो-बिट चैनल-विशिष्ट PTQ की कठिनाइयों को कम करता है। प्रायोगिक परिणाम दर्शाते हैं कि PTQ1.61 अल्ट्रा-लो-बिट क्वांटिज़ेशन में अत्याधुनिक प्रदर्शन प्राप्त करता है।

Takeaways, Limitations

Takeaways:
यह 1.61 बिट्स के अल्ट्रा-लो बिट क्वांटाइजेशन के माध्यम से एलएलएम के मेमोरी उपयोग और कम्प्यूटेशनल लोड को काफी कम करने की संभावना प्रस्तुत करता है।
हम एक नई अल्ट्रा-लो बिट दर PTQ विधि प्रस्तुत करते हैं जो पारंपरिक मिक्स-प्रिसिजन विधियों की सीमाओं पर विजय प्राप्त करती है।
हम क्वांटाइजेशन प्रीप्रोसेसिंग नामक एक नए प्रतिमान के माध्यम से अल्ट्रा-लो-बिट क्वांटाइजेशन की चुनौतियों का समाधान करने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं।
प्रायोगिक परिणाम PTQ1.61 के उत्कृष्ट प्रदर्शन को सत्यापित करते हैं।
Limitations:
यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या प्रस्तावित विधि सभी प्रकार के एलएलएम के लिए समान प्रदर्शन की गारंटी देती है।
1.61-बिट क्वांटाइजेशन के व्यावहारिक कार्यान्वयन और हार्डवेयर समर्थन पर विचार किया जाना आवश्यक है।
प्रस्तावित क्वांटिज़ेशन प्रीप्रोसेसिंग चरण की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍