यह शोधपत्र ट्रांसफ़ॉर्मर मॉडल का उपयोग करके बहुचर बहुपद वियोजन समस्याओं के समाधान की खोज करता है। बहुपद वियोजन, विज्ञान और इंजीनियरिंग में व्यापक रूप से प्रयुक्त होने के बावजूद, NP-कठिन माना जाता है और इसके लिए उच्च सटीकता और अंतर्दृष्टि की आवश्यकता होती है। यह अध्ययन एक संश्लेषित डेटा निर्माण पाइपलाइन विकसित करता है जो समस्या की जटिलता पर सूक्ष्म नियंत्रण की अनुमति देता है और स्केलिंग व्यवहार और सामान्यीकरण प्रदर्शन का मूल्यांकन करने के लिए पर्यवेक्षित शिक्षण का उपयोग करके एक ट्रांसफ़ॉर्मर मॉडल को प्रशिक्षित करता है। इसके अलावा, हम बीम समूहीकृत सापेक्ष नीति अनुकूलन (BGRPO) का प्रस्ताव करते हैं, जो कठिन बीजगणितीय समस्याओं के लिए उपयुक्त एक पदानुक्रम-जागरूक सुदृढीकरण शिक्षण विधि है। BGRPO का उपयोग करके फ़ाइन-ट्यूनिंग सटीकता में सुधार करती है और बीम की चौड़ाई को आधे तक कम कर देती है, जिससे अनुमान का कार्यभार लगभग 75% कम हो जाता है। इसके अलावा, प्रस्तावित मॉडल बहुपद सरलीकरण में मैथेमेटिका से बेहतर प्रदर्शन करता है।