दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

HPCTransCompile: उच्च-प्रदर्शन CUDA ट्रांसपिलेशन और LLM प्रारंभिक अन्वेषण के लिए एक AI कंपाइलर द्वारा निर्मित डेटासेट

Created by
  • Haebom

लेखक

जियाकी लव, ज़ुफ़ेंग हे, यानचेन लियू, ज़ू दाई, आओचेंग शेन, यिंगहाओ ली, जियाचेन हाओ, जियानरॉन्ग डिंग, यांग हू, शौयी यिन

रूपरेखा

यह पत्र वर्तमान स्थिति का विश्लेषण करता है जो गहन शिक्षण मॉडल के तेजी से बढ़ते मापदंडों और कम्प्यूटेशनल मांगों को संबोधित करने के लिए CUDA-आधारित GPU संगणना पर निर्भर करता है। CUDA पारिस्थितिकी तंत्र की प्रमुख स्थिति ने अन्य हार्डवेयर प्लेटफ़ॉर्म पर CUDA-आधारित सॉफ़्टवेयर का समर्थन करने की आवश्यकता को अनिवार्य बना दिया है, लेकिन CUDA कोड को अन्य प्लेटफ़ॉर्म पर अनुवाद करना एक कठिन कार्य है। मौजूदा तरीकों की सीमाएँ हैं और उच्च विकास लागत की आवश्यकता होती है। इन मुद्दों को संबोधित करने के लिए, यह पत्र एक नया ढाँचा प्रस्तावित करता है जो AI संकलक और स्वचालित अनुकूलन तकनीकों का लाभ उठाकर उच्च-प्रदर्शन CUDA कोड और संबंधित प्लेटफ़ॉर्म कोड जोड़े उत्पन्न करता है। हम एक ग्राफ-आधारित डेटा वृद्धि विधि जोड़ते हैं और CUDA अनुवाद के प्रदर्शन का मूल्यांकन करने के लिए HPCTransEval बेंचमार्क पेश करते हैं। हम एक केस स्टडी के रूप में CUDA-से-CPU अनुवाद पर प्रयोग करते हैं, CPU ऑपरेटरों की गति को प्रदर्शित करते हैं और CUDA पारिस्थितिकी तंत्र की संगतता समस्याओं को संबोधित करने के लिए LLM की क्षमता पर प्रकाश डालते हैं। स्रोत कोड खुला स्रोत है।

Takeaways, Limitations

Takeaways:
हम LLM का उपयोग करके CUDA कोड को अन्य प्लेटफार्मों पर कुशलतापूर्वक अनुवाद करने के लिए एक नया ढांचा प्रस्तुत करते हैं।
एलएलएम प्रदर्शन का मूल्यांकन करना और ग्राफ-आधारित डेटा संवर्द्धन और एचपीसीट्रांसइवल बेंचमार्क के माध्यम से संभावित सुधारों का प्रदर्शन करना।
CPU ऑपरेटर की गति में सुधार (औसतन 43.8%) करके CUDA पारिस्थितिकी तंत्र में संगतता समस्याओं को हल करने की क्षमता का प्रदर्शन करना।
खुले स्रोत प्रकटीकरण के माध्यम से अनुसंधान की पुनरुत्पादनशीलता और विस्तारशीलता सुनिश्चित करना।
_____टी17506_____:
वर्तमान में, यह CUDA-से-CPU रूपांतरण पर केंद्रित एक केस स्टडी है, इसलिए अन्य प्लेटफार्मों पर रूपांतरण प्रदर्शन के लिए और अधिक शोध की आवश्यकता है।
उच्च-प्रदर्शन कोड के लिए LLM प्रदर्शन अभी भी उप-इष्टतम हो सकता है।
एचपीसीट्रांसइवल बेंचमार्क की बहुमुखी प्रतिभा और व्यापकता के आगे सत्यापन की आवश्यकता है।
एलएलएम-आधारित दृष्टिकोणों की मापनीयता और सामान्यीकरण का पता लगाने के लिए आगे अनुसंधान की आवश्यकता है।
👍