[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सिम्बायोसिस: मल्टी-एडेप्टर इंफरेंस और फाइन-ट्यूनिंग

Created by
  • Haebom

लेखक

सारांश गुप्ता, उमेश देशपांडे, ट्रैविस जानसेन, स्वामी सुंदररमन

रूपरेखा

यह पत्र एक सिम्बायोसिस फ्रेमवर्क का प्रस्ताव करता है जो पैरामीटर-कुशल फाइन-ट्यूनिंग (PEFT) तकनीक का उपयोग करके बड़े पैमाने पर भाषा मॉडल (LLM) के फाइन-ट्यूनिंग के दौरान होने वाली GPU मेमोरी की अधिक खपत और कम उपयोग की समस्याओं को संबोधित करता है। मौजूदा फ्रेमवर्क की सीमाएँ हैं कि उन्हें कई एडाप्टरों का उपयोग करके फाइन-ट्यूनिंग या अनुमान लगाते समय प्रत्येक कार्य के लिए बेस मॉडल इंस्टेंस की अलग से तैनाती की आवश्यकता होती है, विभिन्न PEFT विधियों या स्वतंत्र संसाधन प्रबंधन के मिश्रण का समर्थन नहीं करते हैं, अनुमान और फाइन-ट्यूनिंग कार्यों के बीच संसाधन साझा करने की अनुमति नहीं देते हैं, और गोपनीयता सुरक्षा का अभाव है। सिम्बायोसिस बेस मॉडल को एक सेवा के रूप में वितरित करके इन मुद्दों का समाधान करता है Llama2-13B का उपयोग करके किए गए मूल्यांकन के परिणाम दर्शाते हैं कि मौजूदा विधियों की तुलना में समान GPU वातावरण में समान समय में चार गुना अधिक एडाप्टरों को फाइन-ट्यून किया जा सकता है।

Takeaways, Limitations

Takeaways:
GPU मेमोरी-कुशल PEFT-आधारित LLM फ़ाइन-ट्यूनिंग और अनुमान को सक्षम करना।
विभिन्न PEFT विधियों और स्वतंत्र संसाधन प्रबंधन के लिए समर्थन।
अनुमान और फ़ाइन-ट्यूनिंग कार्यों के बीच आधार मॉडल संसाधनों को साझा करने की क्षमता।
उपयोगकर्ता गोपनीयता संरक्षण सुविधाएँ प्रदान करता है।
ट्रांसफॉर्मर्स लाइब्रेरी में अधिकांश मॉडलों के साथ संगत।
पारंपरिक तरीकों की तुलना में चार गुना अधिक फाइन-ट्यूनिंग दक्षता प्राप्त करें।
Limitations:
सिम्बायोसिस फ्रेमवर्क के वास्तविक कार्यान्वयन और मापनीयता पर विवरण का अभाव हो सकता है।
विभिन्न एलएलएम और एडाप्टर आकारों के लिए सामान्यीकरण प्रदर्शन के अतिरिक्त मूल्यांकन की आवश्यकता हो सकती है।
यह निर्धारित करने के लिए अतिरिक्त सत्यापन की आवश्यकता हो सकती है कि क्या विशिष्ट हार्डवेयर वातावरणों के लिए और सामान्य हार्डवेयर वातावरणों में प्रदर्शन के लिए अनुकूलन की आवश्यकता है।
👍