दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

इम्पोर्टस्नेयर: पुनर्प्राप्ति-संवर्धित कोड निर्माण में निर्देशित "कोड मैनुअल" अपहरण

Created by
  • Haebom

लेखक

काई ये, लिआंगकाई सु, चेनक्सिओनग कियान

रूपरेखा

यह शोधपत्र बड़े पैमाने पर भाषा मॉडल (LLM)-आधारित कोड निर्माण, विशेष रूप से दुर्भावनापूर्ण निर्भरता अपहरण हमलों में खोज-संवर्धित निर्माण (RAG) की कमज़ोरियों पर एक अध्ययन प्रस्तुत करता है। हम दुर्भावनापूर्ण दस्तावेज़ों का उपयोग करके RAG-आधारित कोड निर्माण (RACG) में दुर्भावनापूर्ण निर्भरताएँ डालकर LLM और डेवलपर विश्वास का शोषण करने की क्षमता प्रदर्शित करते हैं। इसे प्राप्त करने के लिए, हम ImportSnare नामक एक नवीन आक्रमण ढाँचा प्रस्तावित करते हैं, जो दुर्भावनापूर्ण दस्तावेज़ों की रैंकिंग में हेरफेर करने के लिए स्थिति-जागरूक बीम खोज और दुर्भावनापूर्ण निर्भरताओं की अनुशंसा करने के लिए LLM में हेरफेर करने हेतु बहुभाषी प्रेरक सुझावों को शामिल करता है। हम प्रयोगात्मक रूप से प्रदर्शित करते हैं कि ImportSnare पायथन, रस्ट और जावास्क्रिप्ट सहित विभिन्न भाषाओं में उच्च सफलता दर (matplotlib और seaborn जैसी लोकप्रिय लाइब्रेरीज़ के लिए 50% से अधिक) प्राप्त करता है, और कम विषाक्तता दर (0.01%) पर भी प्रभावी है। यह LLM-आधारित विकास के आपूर्ति श्रृंखला जोखिमों को उजागर करता है और कोड निर्माण में बढ़ी हुई सुरक्षा की आवश्यकता का सुझाव देता है। बहुभाषी बेंचमार्क और डेटासेट सार्वजनिक किए जाएँगे।

____T52962_____, ____T52963_____

Takeaways:
यह एलएलएम-आधारित कोड जेनरेशन की सुरक्षा कमजोरियों को स्पष्ट रूप से उजागर करता है, विशेष रूप से आरएजी का लाभ उठाते समय दुर्भावनापूर्ण निर्भरता अपहरण का जोखिम।
ImportSnare फ्रेमवर्क का उपयोग करके प्रभावी दुर्भावनापूर्ण निर्भरता इंजेक्शन हमले की व्यवहार्यता का प्रयोगात्मक प्रदर्शन।
एलएलएम-आधारित विकास वातावरण में आपूर्ति श्रृंखला सुरक्षा को मजबूत करने की आवश्यकता पर बल दिया गया।
विभिन्न प्रोग्रामिंग भाषाओं के लिए बहुभाषी समर्थन और हमले की सफलता दर।
भविष्य के अनुसंधान के लिए बहुभाषी बेंचमार्क और डेटासेट जारी किए जाएंगे।
Limitations:
वर्तमान में प्रस्तावित हमले के लिए एक विशिष्ट दुर्भावनापूर्ण पैकेज पर निर्भरता आवश्यक है। विभिन्न प्रकार की दुर्भावनापूर्ण गतिविधियों के लिए सामान्यीकृत हमले की तकनीक विकसित करने हेतु अनुसंधान की आवश्यकता है।
इम्पोर्टस्नेयर के विरुद्ध रक्षा तकनीकों पर शोध का अभाव है। आक्रमण से बचाव और शमन रणनीतियों पर और शोध की आवश्यकता है।
वास्तविक दुनिया के परिदृश्यों में हमले की सफलता दर और प्रभावशीलता का और अधिक सत्यापन आवश्यक है।
👍