दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रैंक-अवेयर बीम जीआरपीओ के साथ ट्रांसफॉर्मर्स के माध्यम से छिपी हुई बीजीय संरचनाओं की खोज

Created by
  • Haebom

लेखक

जेहा ली, जिओ हुह, निंग सु, टोनी यू यू

रूपरेखा

यह शोधपत्र ट्रांसफ़ॉर्मर मॉडल का उपयोग करके बहुचर बहुपद वियोजन समस्याओं के समाधान की खोज करता है। बहुपद वियोजन, विज्ञान और इंजीनियरिंग में व्यापक रूप से प्रयुक्त होने के बावजूद, NP-कठिन माना जाता है और इसके लिए उच्च सटीकता और अंतर्दृष्टि की आवश्यकता होती है। यह अध्ययन एक संश्लेषित डेटा निर्माण पाइपलाइन विकसित करता है जो समस्या की जटिलता पर सूक्ष्म नियंत्रण की अनुमति देता है और स्केलिंग व्यवहार और सामान्यीकरण प्रदर्शन का मूल्यांकन करने के लिए पर्यवेक्षित शिक्षण का उपयोग करके एक ट्रांसफ़ॉर्मर मॉडल को प्रशिक्षित करता है। इसके अलावा, हम बीम समूहीकृत सापेक्ष नीति अनुकूलन (BGRPO) का प्रस्ताव करते हैं, जो कठिन बीजगणितीय समस्याओं के लिए उपयुक्त एक पदानुक्रम-जागरूक सुदृढीकरण शिक्षण विधि है। BGRPO का उपयोग करके फ़ाइन-ट्यूनिंग सटीकता में सुधार करती है और बीम की चौड़ाई को आधे तक कम कर देती है, जिससे अनुमान का कार्यभार लगभग 75% कम हो जाता है। इसके अलावा, प्रस्तावित मॉडल बहुपद सरलीकरण में मैथेमेटिका से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
हम दिखाते हैं कि ट्रांसफॉर्मर मॉडल को गैर-रेखीय अव्यक्त पैटर्न खोज और बहुभिन्नरूपी बहुपद अपघटन पर लागू किया जा सकता है, जो एक एनपी-कठिन समस्या है।
हम BGRPO एल्गोरिथम के माध्यम से अनुमान गणना की मात्रा को कुशलतापूर्वक कम करने की एक विधि प्रस्तुत करते हैं।
बहुपद सरलीकरण कार्यों में पारंपरिक मैथमेटिका की तुलना में बेहतर प्रदर्शन प्राप्त करता है।
एक सिंथेटिक डेटा जनरेशन पाइपलाइन प्रदान करता है जो बहुपद अपघटन समस्याओं की जटिलता को नियंत्रित कर सकता है।
Limitations:
प्रदर्शन मूल्यांकन मुख्यतः सिंथेटिक डेटा पर किया गया है, तथा वास्तविक डेटा पर सामान्यीकरण प्रदर्शन के लिए अतिरिक्त सत्यापन की आवश्यकता होती है।
BGRPO एल्गोरिथम का प्रदर्शन विशिष्ट समस्या प्रकार और सेटिंग्स पर निर्भर हो सकता है।
बहुत जटिल बहुपदों पर प्रदर्शन के लिए आगे अध्ययन की आवश्यकता है।
👍