दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

TAPAS: बड़े न्यूरल नेटवर्क के लिए टेंसर समानांतर रणनीतियों का तेज़ और स्वचालित व्युत्पन्न

Created by
  • Haebom

लेखक

ज़िजी शि, ले जियांग, आंग वांग, जी झांग, चेन्कन वू, योंग ली, ज़ियाओकुई ज़ियाओ, वेई लिन, जियालिन ली

रूपरेखा

यह शोधपत्र एक स्वचालित समानांतरीकरण ढाँचा, TAPAS, प्रस्तुत करता है जो बड़े पैमाने के तंत्रिका नेटवर्कों के वितरित प्रशिक्षण के लिए आवश्यक टेंसर समानांतरीकरण रणनीतियों के स्वचालित निर्धारण की चुनौतियों का समाधान करता है। यह ढाँचा, तंत्रिका नेटवर्कों की आवर्ती उप-संरचना का लाभ उठाते हुए, विभाजन-और-विजय दृष्टिकोण का उपयोग करके खोज स्थान को कुशलतापूर्वक कम करके, मौजूदा विधियों के घातीय रूप से बढ़ते खोज स्थान का समाधान करता है। यह दृष्टिकोण मॉडल आकार के संबंध में उप-रेखीय जटिलता प्राप्त करता है, जिससे बड़े पैमाने के नेटवर्क प्रशिक्षण के लिए लागू एक मापनीय समाधान प्राप्त होता है। प्रायोगिक परिणाम दर्शाते हैं कि TAPAS मौजूदा अत्याधुनिक स्वचालित समानांतरीकरण ढाँचों की तुलना में 160 गुना तक तेज़ खोज गति प्राप्त करता है, और व्युत्पन्न रणनीति का प्रदर्शन विशेषज्ञ द्वारा डिज़ाइन की गई मेगाट्रॉन-एलएम लाइब्रेरी के बराबर या उससे बेहतर है।

Takeaways, Limitations

Takeaways:
हम TAPAS प्रस्तुत करते हैं, जो बड़े पैमाने के तंत्रिका नेटवर्क के स्वचालित टेंसर समानांतरीकरण के लिए एक कुशल ढांचा है।
मौजूदा घातांकीय जटिलता समस्या को उप-रैखिक जटिलता में सुधारना।
मौजूदा उच्च-प्रदर्शन स्वचालित समानांतरीकरण फ्रेमवर्क की तुलना में अत्यधिक तेज़ खोज गति (160 गुना तक तेज़) प्राप्त करें।
स्वचालित रूप से विशेषज्ञ-स्तर का प्रदर्शन प्राप्त करें
Limitations:
TAPAS के प्रदर्शन में सुधार विशिष्ट प्रकार के न्यूरल नेटवर्क आर्किटेक्चर पर निर्भर हो सकता है। विभिन्न आर्किटेक्चर में सामान्यीकरण प्रदर्शन का मूल्यांकन किया जाना आवश्यक है।
प्रायोगिक परिणाम विशिष्ट मॉडलों और हार्डवेयर वातावरण तक सीमित हो सकते हैं, इसलिए अन्य वातावरणों में प्रदर्शन सत्यापन आवश्यक है।
स्वचालित रूप से उत्पन्न टेंसर समानांतर रणनीतियों की इष्टतमता अभी भी मॉडल और हार्डवेयर कॉन्फ़िगरेशन के आधार पर भिन्न हो सकती है।
👍