दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

R2Vul: सुदृढीकरण सीखने और संरचित तर्क आसवन के साथ सॉफ्टवेयर कमजोरियों के बारे में तर्क करना सीखना

Created by
  • Haebom

लेखक

मार्टिन वीसो, चेनग्रान यांग, जंकाई चेन, रत्नादिरा विद्यासारी, टिंग झांग, हुइहुई हुआंग, हुउ हंग न्गुयेन, यान निंग तुन, टैन बुई, यिकुन ली, आंग हान वेई, फ्रैंक लियाउव, इंग लीह औह, ल्विन खिन शार, डेविड लो

रूपरेखा

यह शोधपत्र R2Vul का प्रस्ताव करता है, जो सॉफ़्टवेयर कमज़ोरियों का पता लगाने की एक नवीन विधि है। R2Vul, रीइन्फोर्समेंट लर्निंग-बेस्ड AI फीडबैक (RLAIF) और स्ट्रक्चर्ड इंफ़रेंस डिस्टिलेशन को मिलाकर, छोटे-कोड LLM को कमज़ोरियों का पता लगाने और सुरक्षा-सचेत स्पष्टीकरण तैयार करने हेतु प्रशिक्षित करता है। मौजूदा विचार प्रक्रियाओं और निर्देशात्मक ट्यूनिंग विधियों के विपरीत, R2Vul, RLAIF के माध्यम से विश्वसनीय लेकिन निराधार स्पष्टीकरणों की तुलना में पुष्ट स्पष्टीकरणों को प्राथमिकता देता है, जिसके परिणामस्वरूप अधिक सटीक पहचान और उच्च-गुणवत्ता वाले निष्कर्ष प्राप्त होते हैं। RLAIF का समर्थन करने के लिए, हमने पहला बहुभाषी भेद्यता पहचान वरीयता डेटासेट बनाया, जिसमें C#, JavaScript, Java, Python और C से 18,000 उच्च-गुणवत्ता वाले नमूने शामिल हैं। पाँच प्रोग्रामिंग भाषाओं में, हमने चार स्थैतिक विश्लेषण उपकरणों, आठ अत्याधुनिक LLM-आधारित बेसलाइन मॉडलों और विभिन्न फ़ाइन-ट्यूनिंग विधियों के प्रदर्शन की तुलना की। हमने दर्शाया है कि 1.5 बिलियन-पैरामीटर वाला R2Vul मॉडल, 32 बिलियन-पैरामीटर वाले शिक्षक मॉडल और क्लाउड-4-ओपस जैसे अग्रणी व्यावसायिक LLM से बेहतर प्रदर्शन करता है। इसके अतिरिक्त, हमने विभिन्न असंतुलित डेटा वितरणों के अंतर्गत मिथ्या सकारात्मक दर को कम करने के लिए एक हल्का सुधारात्मक चरण भी प्रस्तुत किया है। अंततः, गुणात्मक विश्लेषण से पता चलता है कि LLM और मानव मूल्यांकनकर्ताओं, दोनों ने R2Vul मॉडल के अनुमानों को अन्य अनुमान-आधारित आधारभूत मॉडलों की तुलना में लगातार उच्चतर रेटिंग दी है।

Takeaways, Limitations

Takeaways:
हम एक नवीन भेद्यता पहचान विधि R2Vul प्रस्तुत करते हैं जो RLAIF और संरचनात्मक अनुमान आसवन को जोड़ती है।
छोटे मॉडलों के साथ भी बड़े मॉडलों से बेहतर प्रदर्शन प्राप्त करना।
बहुभाषी समर्थन और विभिन्न प्रोग्रामिंग भाषाओं के लिए प्रयोज्यता।
झूठी सकारात्मक दर को कम करने के लिए एक हल्का सुधार कदम प्रस्तावित किया गया है।
उच्च गुणवत्ता वाले अनुमान निर्माण और सटीक भेद्यता का पता लगाना।
प्रथम बहुभाषी भेद्यता पहचान वरीयता डेटासेट का निर्माण।
Limitations:
प्रस्तुत बहुभाषी डेटासेट का आकार और विविधता भविष्य में सुधार की गुंजाइश छोड़ती है।
कुछ प्रोग्रामिंग भाषाओं या भेद्यता प्रकारों के प्रति पूर्वाग्रह हो सकता है।
वास्तविक दुनिया के वातावरण में सामान्यीकरण प्रदर्शन पर और अधिक शोध की आवश्यकता है।
सुधार चरण का प्रभाव डेटा वितरण के आधार पर भिन्न हो सकता है।
👍