दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कोड से शुद्धता तक: पदानुक्रमित डिबगिंग के साथ कोड निर्माण के अंतिम चरण को पूरा करना

Created by
  • Haebom

लेखक

यूलिंग शि, सोंगसोंग वांग, चेंगचेंग वान, मिन वांग, ज़ियाओडोंग गु

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (LLM) पर आधारित कोड निर्माण की सीमाओं को दूर करने के लिए एक बहु-रिज़ॉल्यूशन डीबगर (MGDebugger) का प्रस्ताव करता है। MGDebugger, उत्पन्न कोड में निम्न-स्तरीय वाक्यविन्यास त्रुटियों से लेकर उच्च-स्तरीय एल्गोरिथम संबंधी खामियों तक, विभिन्न स्तरों पर त्रुटियों को अलग करता है, उनकी पहचान करता है और उनका समाधान करता है। यह समस्याग्रस्त कोड को उप-कार्यों के एक पदानुक्रमित वृक्ष में विघटित करता है, जहाँ प्रत्येक स्तर एक विशिष्ट स्तर पर एक त्रुटि दर्शाता है। LLM-आधारित पायथन निष्पादक का उपयोग करते हुए, यह उप-कार्यों के निष्पादन का पता लगाता है और त्रुटियों की सटीक पहचान के लिए परिवर्तनशील स्थितियों की निगरानी करता है। उप-कार्य-स्तरीय परीक्षण और बॉटम-अप, पुनरावृत्तीय बग समाधान के माध्यम से सटीकता और दक्षता में सुधार होता है। HumanEval और HumanEvalFix डेटासेट का उपयोग करके प्राप्त प्रायोगिक परिणाम मौजूदा डीबगिंग प्रणालियों की तुलना में इसके बेहतर प्रदर्शन को प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
हम एक नई डिबगिंग विधि प्रस्तुत करते हैं जो LLM-आधारित कोड जेनरेशन की सटीकता को बेहतर बनाने में योगदान दे सकती है।
विभिन्न स्तरों पर बग्स का समाधान करके जटिल समस्या समाधान के लिए प्रभावी सिद्ध।
एलएलएम-आधारित सिमुलेशन रनर के माध्यम से सटीक त्रुटि पहचान और सुधार संभव है।
ह्यूमनइवल और ह्यूमनइवलफिक्स डेटासेट पर मौजूदा प्रणालियों की तुलना में प्रदर्शन में सुधार का प्रयोगात्मक सत्यापन किया गया।
Limitations:
वर्तमान में, यह प्रणाली पायथन के लिए विशिष्ट है, तथा अन्य प्रोग्रामिंग भाषाओं में इसकी प्रयोज्यता के लिए और अधिक शोध की आवश्यकता है।
एलएलएम-आधारित सिमुलेशन रनर के प्रदर्शन और विश्वसनीयता के आगे सत्यापन की आवश्यकता है।
बहुत जटिल या विशेष प्रकार के बगों से निपटने के लिए और अधिक प्रयोग की आवश्यकता होती है।
एलएलएम की सीमाओं के कारण, यह संभव है कि कुछ प्रकार के बगों का पता न लगाया जा सके।
👍