दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

DLLMQuant: प्रसार-आधारित बड़े भाषा मॉडल का परिमाणीकरण

Created by
  • Haebom

लेखक

चेन जू, दावेई यांग

रूपरेखा

यह शोधपत्र प्रसार-आधारित वृहद-स्तरीय भाषा मॉडल (DLLM) के कुशल निर्माण हेतु एक परिमाणीकरण तकनीक प्रस्तुत करता है। DLLM पर लागू होने पर, मौजूदा प्रशिक्षण-पश्चात परिमाणीकरण (PTQ) तकनीकें, गतिशील मास्किंग, पुनरावृत्तीय निर्माण और द्विदिशात्मक ध्यान जैसे मूल DLLM तंत्रों के साथ टकराव के कारण सटीकता और सामान्यीकरण में गिरावट का सामना करती हैं। इसलिए, इस शोधपत्र में, हम DLLMQuant ढाँचे का प्रस्ताव करते हैं, जिसमें तीन नवीन तकनीकें शामिल हैं: TMAS, एक क्षतिपूर्ति तकनीक जो कालिक और मुखौटा कारकों पर विचार करती है; IA-AQ, जो द्विदिशात्मक ध्यान के अंतःक्रिया संकेत का लाभ उठाकर परिमाणीकरण संसाधनों का गतिशील आवंटन करती है; और CGQ, जो त्रुटि सुधार के लिए मुखौटा अवस्थाओं और टोकन स्कोर का उपयोग करती है। प्रायोगिक परिणाम दर्शाते हैं कि DLLMQuant बेहतर दक्षता के साथ-साथ महत्वपूर्ण प्रदर्शन सुधार भी प्राप्त करता है।

Takeaways, Limitations

Takeaways:
हम DLLMQuant प्रस्तुत करते हैं, जो कुशल DLLM निर्माण के लिए एक नया PTQ फ्रेमवर्क है।
मौजूदा PTQs पर DLLM लागू करते समय उत्पन्न होने वाली कम सटीकता और सामान्यीकरण प्रदर्शन की समस्याओं का समाधान करना।
डीएलएलएम की विशेषताओं को ध्यान में रखते हुए प्रभावी क्वांटीकरण तीन नवीन तकनीकों के माध्यम से प्राप्त किया जाता है: टीएमएएस, आईए-एक्यू, और सीजीक्यू।
प्रायोगिक परिणाम DLLMQuant के प्रदर्शन में सुधार और बढ़ी हुई दक्षता की पुष्टि करते हैं।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन का आगे सत्यापन आवश्यक है।
विभिन्न DLLM आर्किटेक्चर और आकारों के लिए प्रयोज्यता और प्रदर्शन विश्लेषण आवश्यक है।
अन्य क्वांटीकरण तकनीकों के साथ अधिक विस्तृत तुलनात्मक विश्लेषण की आवश्यकता है।
वास्तविक अनुप्रयोग वातावरण में प्रदर्शन मूल्यांकन और स्थिरता सत्यापन आवश्यक है।
👍