दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

पॉइज़नस्वार्म: मॉडल क्राउडसोर्सिंग के माध्यम से सार्वभौमिक हानिकारक सूचना संश्लेषण

Created by
  • Haebom

लेखक

यू यान, शेंग सन, ज़ीफ़ेई झेंग, ज़िजी हाओ, तेली लियू, मिन लियू

रूपरेखा

यह शोधपत्र प्रतिकूल परीक्षण और ऐसे सुरक्षा उपायों के विकास पर केंद्रित है जो उत्तरदायी एवं सुरक्षित कृत्रिम बुद्धिमत्ता अनुप्रयोगों के निर्माण हेतु हानिकारक डेटा का उपयोग करते हैं। मौजूदा शोध मुख्य रूप से बड़े पैमाने के भाषा मॉडल (एलएलएम) का उपयोग करके बड़े पैमाने पर उच्च-गुणवत्ता वाले कार्य डेटासेट तैयार करने पर केंद्रित है, जिससे महंगे मैन्युअल एनोटेशन से बचा जा सके। हालाँकि, एलएलएम के सुरक्षा संरेखण तंत्र की सीमाओं के कारण, हानिकारक डेटा के संश्लेषण में अभी भी पीढ़ी की विश्वसनीयता और सामग्री विविधता के संदर्भ में चुनौतियाँ हैं। इस अध्ययन में, हम PoisonSwarm का प्रस्ताव करते हैं, जो एक नया हानिकारक डेटा संश्लेषण ढाँचा है जो उच्च सफलता दर बनाए रखते हुए विविध हानिकारक डेटा उत्पन्न करने के लिए एक मॉडल क्राउडसोर्सिंग रणनीति का उपयोग करता है। विशेष रूप से, हम प्रतितथ्यात्मक रूप से समृद्ध सौम्य डेटा को आधार टेम्पलेट के रूप में उत्पन्न करते हैं, प्रत्येक आधार टेम्पलेट को कई अर्थ इकाइयों में विघटित करते हैं, और संश्लेषण की सफलता सुनिश्चित करने के लिए गतिशील मॉडल स्विचिंग के माध्यम से इकाई-दर-इकाई विषाक्तता और अंतिम परिशोधन करते हैं। प्रायोगिक परिणाम प्रदर्शित करते हैं कि PoisonSwarm उच्च मापनीयता और विविधता के साथ विविध प्रकार के हानिकारक डेटा के संश्लेषण में अत्याधुनिक प्रदर्शन प्राप्त करता है।

Takeaways, Limitations

Takeaways:
एक मॉडल क्राउडसोर्सिंग रणनीति का उपयोग करके, हम पीढ़ी की विश्वसनीयता और विविधता की समस्याओं को हल करते हैं, जो मौजूदा एलएलएम-आधारित हानिकारक डेटा पीढ़ी की सीमाएं हैं।
पॉइज़नस्वार्म फ्रेमवर्क उच्च सफलता दर और मापनीयता के साथ विभिन्न प्रकार के हानिकारक डेटा के सृजन को सक्षम बनाता है।
सुरक्षित और जिम्मेदार AI विकास के लिए उच्च गुणवत्ता वाले हानिकारक डेटासेट बनाने में योगदान दें।
Limitations:
पॉइज़नस्वार्म का प्रदर्शन कुछ प्रकार के हानिकारक डेटा के प्रति पक्षपाती हो सकता है।
मॉडल क्राउडसोर्सिंग के दौरान उत्पन्न होने वाली अप्रत्याशितता और प्रबंधन संबंधी कठिनाइयाँ।
नैतिक मुद्दों और उत्पन्न हानिकारक डेटा के संभावित शोषण के संबंध में पर्याप्त विचार-विमर्श की आवश्यकता है।
👍