दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

EigenLoRAx: संसाधन-कुशल अनुकूलन और अनुमान के लिए प्रमुख उप-स्थानों को खोजने के लिए एडाप्टरों का पुनर्चक्रण

Created by
  • Haebom

लेखक

प्रखर कौशिक, अंकित वैद्य, श्रवण चौधरी, एलन युइले

रूपरेखा

इस शोधपत्र में, हम EigenLoRAx का प्रस्ताव करते हैं, जो बड़े पैमाने के मॉडल को ठीक करने में पर्यावरणीय प्रभाव की निष्पक्षता और पहुँच के मुद्दों को संबोधित करने के लिए एक हल्की फ़ाइन-ट्यूनिंग तकनीक है। यह साझा डोमेन ज्ञान के साथ संरेखित एक प्रमुख घटक स्थान उत्पन्न करने के लिए मौजूदा पूर्व-प्रशिक्षित निम्न-रैंक एडाप्टर (LoRA) का उपयोग करता है, और इसके आधार पर नए कार्यों के लिए तेज़ी से अनुकूल होता है। कम संसाधन वाले वातावरण में, ऑर्थोगोनल बेसिस वैक्टर जोड़कर स्थान का विस्तार किया जाता है। EigenLoRAx पूरे एडाप्टर को फ़ाइन-ट्यून करने की आवश्यकता के बिना केवल प्रमुख घटकों के लिए हल्के गुणांक सीखता है, जो पैरामीटर और मेमोरी उपयोग को महत्वपूर्ण रूप से कम करता है और प्रशिक्षण और अनुमान दक्षता में सुधार करता है। यह विभिन्न डोमेन और कार्यों में मजबूत प्रदर्शन प्रदर्शित करता है, और संसाधन-विवश वातावरण में एज-आधारित अनुप्रयोगों, वैयक्तिकरण और बड़े पैमाने के मॉडल की निष्पक्ष तैनाती के लिए एक स्केलेबल समाधान प्रदान करता है।

Takeaways, Limitations

Takeaways:
मौजूदा LoRA का लाभ उठाकर पैरामीटर-कुशल फ़ाइन-ट्यूनिंग को सक्षम बनाता है।
संसाधन-सीमित वातावरण में भी प्रभावी बड़े पैमाने पर मॉडल अनुप्रयोग संभव है।
एज-आधारित अनुप्रयोगों और व्यक्तिगत मॉडल के निर्माण के लिए उपयोगी।
पर्यावरणीय प्रभाव और सुगम्यता समानता मुद्दों के समाधान में योगदान देना।
प्रशिक्षण और अनुमान में तेजी लाएँ।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न आकारों और प्रकारों के LoRA की संगतता और प्रदर्शन मूल्यांकन आवश्यक है।
विशिष्ट डोमेन या कार्यों के प्रति संभावित पूर्वाग्रह।
प्रमुख घटक स्थान के आयाम चयन के लिए अनुकूलन रणनीतियों पर अनुसंधान की आवश्यकता है।
👍