दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

CALR: कुशल वृहद भाषा मॉडल परत संपीड़न के लिए सुधारात्मक अनुकूली निम्न-रैंक अपघटन

Created by
  • Haebom

लेखक

मुचम्मद दानियाल कौत्सर, अफ़रा मजीदा हरियोनो, विद्यावान, स्यूक्रोन अबू इशाक अल्फ़ारोज़ी, कुंटपोंग वोरारतपन्या

रूपरेखा

यह पत्र सुधारात्मक अनुकूली निम्न-श्रेणी अपघटन (CALR) का प्रस्ताव करता है, जो एक नवीन विधि है जो बड़े पैमाने के भाषा मॉडल (LLM) को तैनात करने की चुनौतियों, विशेष रूप से उनके विशाल आकार और उच्च गणना संबंधी मांगों को दूर करने के लिए एकल मान अपघटन (SVD) का उपयोग करके निम्न-श्रेणी अपघटन तकनीक में सुधार करती है। जबकि मौजूदा SVD-आधारित संपीड़न विधियाँ मॉडल पुनर्निर्माण त्रुटियों को कम करने पर ध्यान केंद्रित करती हैं, जो कार्यात्मक प्रदर्शन को कम करती हैं, CALR कार्यात्मक अवशिष्ट त्रुटियों को ठीक करने के लिए प्रशिक्षित समानांतर निम्न-श्रेणी सुधार मॉड्यूल के साथ SVD का उपयोग करके संपीड़ित परतों को संयोजित करके इस समस्या का समाधान करता है। SmolLM2-135M, Qwen3-0.6B, और Llama-3.2-1B जैसे मॉडलों पर प्रायोगिक परिणाम दर्शाते हैं कि CALR मूल मॉडल प्रदर्शन के क्रमशः 59.45% और 90.42% को बनाए रखते हुए, क्रमशः 26.93% और 51.77% तक मापदंडों की संख्या को कम करता है यह दर्शाता है कि कार्यात्मक सूचना हानि को सीखने योग्य संकेत के रूप में मानना ​​एक प्रभावी संपीड़न प्रतिमान है।

Takeaways, Limitations

Takeaways:
एक नवीन संपीड़न प्रतिमान प्रस्तुत किया गया है जो कार्यात्मक सूचना हानि को सीखने योग्य संकेत के रूप में मानता है।
एक CALR एल्गोरिथ्म का विकास जो मौजूदा निम्न-रैंक अपघटन तकनीकों से बेहतर प्रदर्शन करता है।
एलएलएम के आकार और कम्प्यूटेशनल मांगों को कम करके वास्तविक दुनिया में तैनाती की क्षमता को बढ़ाना।
संसाधन-सीमित वातावरण में एलएलएम के उपयोग का विस्तार
Limitations:
प्रस्तुत प्रयोगात्मक परिणाम एक विशिष्ट मॉडल तक सीमित हैं और सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
CALR सुधार मॉड्यूल को प्रशिक्षित करने के लिए आवश्यक कम्प्यूटेशनल लागत और समय का विश्लेषण आवश्यक है।
विभिन्न आकारों और प्रकारों के एलएलएम के लिए अतिरिक्त प्रयोगों और प्रदर्शन मूल्यांकन की आवश्यकता है।
👍