दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

CoQuIR: कोड गुणवत्ता-जागरूक सूचना पुनर्प्राप्ति के लिए एक व्यापक बेंचमार्क

Created by
  • Haebom

लेखक

जियाहुई गेंग, फेंगयु कै, शाओबो कुई, किंग ली, लियांगवेई चेन, चेनयांग ल्यू, हाओनान ली, डेरुई झू, वाल्टर प्रेटस्चनर, हेंज कोप्पल, फाखरी कर्रे

रूपरेखा

यह पत्र कोड पुनर्प्राप्ति की गुणवत्ता-जागरूकता के मूल्यांकन हेतु एक बड़े पैमाने पर, बहुभाषी बेंचमार्क CoQuIR का प्रस्ताव करता है, जो सॉफ्टवेयर विकास में कोड पुन: उपयोग और डीबगिंग गति में सुधार के लिए आवश्यक है। मौजूदा बेंचमार्क के विपरीत, जो केवल कार्यात्मक प्रासंगिकता पर ध्यान केंद्रित करते हैं, CoQuIR 11 प्रोग्रामिंग भाषाओं में 42,725 प्रश्नों और 134,907 कोड स्निपेट के लिए सूक्ष्म गुणवत्ता एनोटेशन प्रदान करता है, जिसमें चार मुख्य आयामों पर विचार किया जाता है: सटीकता, दक्षता, सुरक्षा और रखरखाव। दो गुणवत्ता-केंद्रित मूल्यांकन मेट्रिक्स - जोड़ीदार वरीयता सटीकता और मार्जिन-आधारित रैंकिंग स्कोर - का उपयोग करते हुए, हम 23 पुनर्प्राप्ति मॉडल का बेंचमार्क करते हैं और पाते हैं कि सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल भी बग वाले या असुरक्षित कोड को अधिक मजबूत कोड से अलग करने के लिए संघर्ष करते हैं। निष्कर्षतः, यह अध्ययन कोड खोज प्रणालियों में गुणवत्ता संकेतों को एकीकृत करने के महत्व पर प्रकाश डालता है, तथा अधिक विश्वसनीय और मजबूत सॉफ्टवेयर विकास उपकरणों की नींव रखता है।

Takeaways, Limitations

Takeaways:
यह कोड खोज प्रणालियों में कोड गुणवत्ता (शुद्धता, दक्षता, सुरक्षा, रखरखाव) पर विचार करने के महत्व पर जोर देता है।
हम कोड खोज मॉडल की गुणवत्ता पहचान क्षमताओं का सटीक मूल्यांकन करने के लिए एक बड़े पैमाने पर, बहुभाषी बेंचमार्क, CoQuIR प्रदान करते हैं।
हम यह प्रदर्शित करते हैं कि गुणवत्ता-केंद्रित प्रशिक्षण विधियां गुणवत्ता बोध प्रदर्शन में सुधार कर सकती हैं।
अधिक विश्वसनीय और मजबूत सॉफ्टवेयर विकास उपकरण विकसित करने की नींव रखना।
Limitations:
चूंकि CoQuIR बेंचमार्क सिंथेटिक डेटासेट का उपयोग करके प्रारंभिक प्रयोगात्मक परिणामों पर आधारित है, इसलिए वास्तविक दुनिया के डेटासेट पर इसके प्रदर्शन का और अधिक सत्यापन आवश्यक है।
प्रस्तावित गुणवत्ता-केंद्रित प्रशिक्षण पद्धति की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
मूल्यांकन मेट्रिक्स की सीमाओं और सुधार की संभावनाओं के बारे में चर्चा का अभाव हो सकता है।
👍