दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

प्रशिक्षण-पश्चात क्वांटाइज्ड वृहद भाषा मॉडल में कार्य-स्तरीकृत ज्ञान के लिए स्केलिंग नियम

Created by
  • Haebom

लेखक

चेनक्सी झोउ, पेंगफेई काओ, जियांग ली, जून झाओ, कांग लियू

रूपरेखा

यह शोधपत्र प्रशिक्षण-पश्चात परिमाणीकरण (PTQ) का अन्वेषण करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) के परिनियोजन के दौरान उत्पन्न होने वाले आकार संबंधी मुद्दों के समाधान हेतु एक व्यावहारिक संपीड़न विधि है। हम देखते हैं कि पिछले अध्ययन PTQ के प्रभाव और परिमाणित मॉडल के स्केलिंग नियमों की व्यापक समझ प्रदान करने में विफल रहे हैं। हमने विभिन्न कार्यों में पदानुक्रमित स्केलिंग नियमों का प्रयोगात्मक रूप से अन्वेषण किया है। हम LLM में ज्ञान को स्मरण और उपयोग कौशल में विघटित करते हैं और मॉडल आकार, प्रभावी बिट चौड़ाई, अंशांकन सेट आकार और समूह आकार को समाहित करते हुए एक एकीकृत मात्रात्मक ढाँचा विकसित करते हैं। हमारे परिणाम बताते हैं कि ज्ञान का स्मरण, ज्ञान के उपयोग की तुलना में प्रभावी बिट चौड़ाई, अंशांकन सेट आकार और मॉडल आकार में परिवर्तनों के प्रति काफी अधिक संवेदनशील होता है। ये निष्कर्ष PTQ के प्रभाव की एक विस्तृत समझ प्रदान करते हैं और ज्ञान-जागरूक परिमाणीकरण रणनीतियों को विकसित करने के लिए मार्गदर्शन प्रदान करते हैं जो लक्षित संज्ञानात्मक कार्यों को बेहतर ढंग से संरक्षित करती हैं।

Takeaways, Limitations

Takeaways:
एलएलएम छात्रों के ज्ञान स्मरण और अनुप्रयोग कौशल पर पीटीक्यू के प्रभाव का विस्तृत विश्लेषण प्रदान करता है।
ज्ञान स्मरण और अनुप्रयोग के प्रति विभिन्न संवेदनशीलताओं को उजागर करके, हम PTQ रणनीतियों को बेहतर बनाने के लिए आवश्यक अंतर्दृष्टि प्रदान करते हैं।
हम एक एकीकृत मात्रात्मक ढांचा प्रस्तुत करते हैं जो मॉडल आकार, प्रभावी बिट चौड़ाई, अंशांकन सेट आकार और समूह आकार को ध्यान में रखता है।
लक्षित संज्ञानात्मक कार्यों को संरक्षित करने वाली ज्ञान-जागरूक क्वांटिज़ेशन रणनीतियों को विकसित करने के लिए मार्गदर्शन प्रदान करता है।
Limitations:
यह अध्ययन एक विशिष्ट एलएलएम आर्किटेक्चर और डेटासेट तक सीमित हो सकता है। विभिन्न एलएलएम आर्किटेक्चर और डेटासेट पर आगे और शोध की आवश्यकता है।
प्रस्तावित ढांचे की सामान्यीकरणीयता के आगे सत्यापन की आवश्यकता है।
वास्तविक दुनिया के परिनियोजन वातावरण में PTQ प्रदर्शन मूल्यांकन का अभाव है।
👍