दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मेटा सेकएलाइन: त्वरित इंजेक्शन हमलों के खिलाफ एक सुरक्षित फाउंडेशन एलएलएम

Created by
  • Haebom

लेखक

सिज़े चेन, अरमान ज़र्मागम्बेटोव, डेविड वैगनर, चुआन गुओ

रूपरेखा

इस पेपर में, हम मेटा सेकएलाइन, एक ओपन-सोर्स, ओपन-वेट एलएलएम प्रस्तुत करते हैं, जो प्रॉम्प्ट इंजेक्शन हमलों के खिलाफ अत्याधुनिक प्रदर्शन करता है। मेटा सेकएलाइन को बेहतर सेकएलाइन रक्षा तकनीकों का उपयोग करके प्रशिक्षित किया जाता है और यह नौ उपयोगिता बेंचमार्क और सात सुरक्षा बेंचमार्क पर अच्छा प्रदर्शन करता है। विशेष रूप से, यह कई तरह के डाउनस्ट्रीम कार्यों, जैसे टूल इनवोकेशन और एजेंट वेब एक्सप्लोरेशन में सुरक्षा बनाए रखता है। 70B-पैरामीटर मॉडल, मेटा-सेकएलाइन-70B, कमर्शियल-ग्रेड LLM के समान अत्याधुनिक प्रॉम्प्ट इंजेक्शन अटैक डिफेंस और उपयोगिता प्राप्त करता है। इसका लक्ष्य प्रॉम्प्ट इंजेक्शन हमलों के खिलाफ रक्षा तकनीकों को आगे बढ़ाने के लिए ओपन-सोर्स मॉडल के माध्यम से AI सुरक्षा समुदाय में सहयोगी अनुसंधान को प्रोत्साहित करना है।

____T95785_____, Limitations

Takeaways:
खुले स्रोत वातावरण में उच्च-प्रदर्शन त्वरित इंजेक्शन रक्षा मॉडल प्रदान करके एआई सुरक्षा अनुसंधान में तेजी लाना।
मेटा सेकअलाइन विभिन्न डाउनस्ट्रीम परिचालनों में प्रभावी सुरक्षा प्रदर्शन भी प्रदर्शित करता है।
वाणिज्यिक स्तर के प्रदर्शन के साथ ओपन सोर्स मॉडल के माध्यम से एआई सुरक्षा प्रौद्योगिकी तक पहुंच बढ़ाएं।
Limitations:
इस पत्र में केवल विशिष्ट बेंचमार्क के लिए मूल्यांकन परिणाम प्रस्तुत किए गए हैं, तथा विभिन्न वास्तविक वातावरणों में प्रदर्शन के लिए अतिरिक्त सत्यापन की आवश्यकता है।
प्रशिक्षण डेटासेट की व्यापकता के बावजूद, यह अभी भी कुछ प्रकार के त्वरित इंजेक्शन हमलों के प्रति संवेदनशील हो सकता है।
मॉडल के बड़े आकार के कारण, संसाधन-विवश वातावरण में इसका उपयोग करना कठिन हो सकता है।
👍