दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बड़े भाषा मॉडल के साथ अर्थ असमानता खेल का कार्यक्रम

Created by
  • Haebom

लेखक

एंटोनियो वैलेरियो मिसेली-बैरोन, वैशाख बेले, अली पयानी

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (LLM) की जटिल कोड अनुमान क्षमता में सुधार के लिए एक नवीन विधि प्रस्तुत करता है। हालाँकि LLM नियमित कोडिंग कार्यों में अच्छा प्रदर्शन करते हैं, लेकिन प्रोग्राम शब्दार्थ के बारे में गैर-तुच्छ अनुमानों की आवश्यकता वाले जटिल कार्यों में वे विफल हो सकते हैं। इस समस्या का समाधान करने के लिए, यह अध्ययन सिमेंटिक इनक्विटी गेम (SInQ) पर आधारित कोड अनुमान प्रशिक्षण डेटा को कृत्रिम रूप से उत्पन्न करने की एक विधि की खोज करता है। एक जनरेटर एजेंट वास्तविक दुनिया के प्रोग्रामिंग कार्यों के डेटासेट से प्राप्त सिमेंटिक रूप से भिन्न प्रोग्राम वेरिएंट उत्पन्न करता है, और एक मूल्यांकन एजेंट ऐसे इनपुट उदाहरणों की पहचान करता है जो मूल प्रोग्राम और उत्पन्न वेरिएंट के व्यवहार को भिन्न बनाते हैं। दोनों एजेंट एक-दूसरे को अर्ध-प्रतिकूल रूप से प्रशिक्षित करते हैं, और हम प्रदर्शित करते हैं कि यह व्यवस्था सैद्धांतिक रूप से अनंत कम्प्यूटेशनल संसाधनों को मानकर स्व-खेल के माध्यम से असीम रूप से बेहतर हो सकती है। हम बहुभाषी भेद्यता पहचान और पायथन अंतर्निहित पहचानकर्ता विनिमय बेंचमार्क सहित विभिन्न कोड निर्माण और समझ मानकों पर प्रयोगों के माध्यम से प्रस्तावित विधि की प्रभावशीलता को प्रमाणित करते हैं। पूरी तरह से पायथन कोड पर प्रशिक्षित होने के बावजूद, प्रस्तावित विधि C/C++ कोड में भेद्यता पहचान को बेहतर बनाती है और पायथन बिल्ट-इन आइडेंटिफ़ायर एक्सचेंज बेंचमार्क पर महत्वपूर्ण प्रदर्शन लाभ प्राप्त करती है, एक ऐसा बेंचमार्क जहाँ मौजूदा LLMs को कठिनाई होती है। हमने प्रयोग को पुन: प्रस्तुत करने के लिए आवश्यक कोड और उत्पन्न सिंथेटिक डेटा को सार्वजनिक कर दिया है, जिससे अन्य शोधकर्ता LLM को बेहतर बना सकते हैं।

Takeaways, Limitations

Takeaways:
हम अर्थगत असमानता खेलों (SInQ) पर आधारित सिंथेटिक डेटा जनरेशन विधि के माध्यम से LLM की जटिल कोड तर्क क्षमता में सुधार की संभावना प्रस्तुत करते हैं।
यह सीमित डेटा के साथ भी बहुभाषी और विविध प्रकार की कोड अनुमान समस्याओं पर प्रदर्शन सुधार की क्षमता को प्रदर्शित करता है।
उत्पन्न सिंथेटिक डेटा के प्रकटीकरण के माध्यम से एलएलएम अनुसंधान की उन्नति में योगदान दें।
स्व-खेल के आधार पर निरंतर प्रदर्शन सुधार की संभावना प्रस्तुत करना।
Limitations:
वास्तविक दुनिया के वातावरण में असीमित कम्प्यूटेशनल संसाधनों को मानने वाले सैद्धांतिक प्रमाणों की प्रयोज्यता की जांच करने की आवश्यकता है।
उत्पन्न सिंथेटिक डेटा की गुणवत्ता और विविधता पर आगे अनुसंधान की आवश्यकता है।
यह निर्धारित करने के लिए आगे सत्यापन की आवश्यकता है कि क्या विशिष्ट बेंचमार्क के लिए प्रदर्शन सुधारों को अन्य सभी प्रकार की कोड अनुमान समस्याओं के लिए सामान्यीकृत किया जा सकता है।
जटिल और विविध वास्तविक दुनिया कोड अनुमान समस्याओं के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन करने की आवश्यकता है।
👍