[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

उन्नत प्रतिकूल हस्तांतरणीयता के लिए अर्थ संरचना-जागरूक जनरेटिव हमले

Created by
  • Haebom

लेखक

जोंगोह जियोंग, हुनमिन यांग, जेसेक जियोंग, कुक-जिन यून

रूपरेखा

यह शोधपत्र जनरेटिव एडवर्सेरियल हमलों पर केंद्रित है जो एक गड़बड़ी जनरेटर को एक व्हाइट-बॉक्स सरोगेट मॉडल पर प्रशिक्षित करते हैं ताकि इसे बैक-बॉक्स बिग टीम मॉडल पर लागू किया जा सके। पारंपरिक पुनरावृत्तीय हमलों के विपरीत, जनरेटिव एडवर्सेरियल हमलों में उत्कृष्ट अनुमान समय दक्षता, मापनीयता और हस्तांतरणीयता होती है, लेकिन पिछले अध्ययन अर्थ संबंधी जानकारी को संरक्षित और उपयोग करने के लिए जनरेटिव मॉडल की अभिव्यक्ति क्षमताओं का पूरी तरह से उपयोग करने में विफल रहे हैं। इस शोधपत्र में, हम बताते हैं कि यद्यपि जनरेटर के मध्यवर्ती सक्रियणों में वस्तु सीमाओं और रफ़ आकृतियों जैसी समृद्ध अर्थ संबंधी विशेषताएँ होती हैं, फिर भी उनका पूरी तरह से उपयोग नहीं किया जाता है, जो वस्तु-संबंधित क्षेत्रों के साथ गड़बड़ी के संरेखण को सीमित करता है। इस समस्या का समाधान करने के लिए, यह शोधपत्र मीन टीचर पर आधारित एक अर्थ संबंधी संरचना-जागरूक हमले के ढाँचे का प्रस्ताव करता है। मीन टीचर एक समय-समय पर सुचारू किए गए फ़ीचर संदर्भ के रूप में कार्य करता है, जो फ़ीचर आसवन के माध्यम से स्टूडेंट मॉडल के प्रारंभिक परत सक्रियणों और टीचर मॉडल के अर्थ संबंधी समृद्ध सक्रियणों के बीच अर्थ संबंधी संगति को बढ़ाता है। प्रायोगिक परिणामों के आधार पर, हम जनरेटर में अर्थगत रूप से महत्वपूर्ण प्रारंभिक मध्यवर्ती ब्लॉकों में गड़बड़ी उत्पन्न करने की प्रक्रिया को स्थिर करते हैं, जिससे उन क्षेत्रों में प्रगतिशील प्रतिकूल गड़बड़ी उत्पन्न होती है जो प्रतिकूल स्थानांतरणीयता में उल्लेखनीय सुधार करती हैं। विभिन्न मॉडलों, डोमेन और कार्यों पर व्यापक प्रयोगों के माध्यम से, हम मौजूदा अत्याधुनिक जनरेटिव हमलों की तुलना में लगातार प्रदर्शन में सुधार प्रदर्शित करते हैं, और मौजूदा मेट्रिक्स और नए प्रस्तावित आकस्मिक सुधार दर (ACR) का उपयोग करके उनका व्यापक मूल्यांकन करते हैं।

Takeaways, Limitations

Takeaways:
जनरेटिव प्रतिकूल हमलों की हस्तांतरणीयता में सुधार करने के लिए एक नया ढांचा
अर्थ संबंधी जानकारी का लाभ उठाकर वस्तु-संबंधित क्षेत्रों के साथ गड़बड़ी का बेहतर संरेखण
मीन टीचर पर आधारित अर्थगत संरचना-जागरूक हमले के ढाँचे की प्रभावशीलता का सत्यापन
एक नए मूल्यांकन मीट्रिक, ACR का परिचय
विभिन्न मॉडलों, डोमेन और कार्यों के लिए व्यापक प्रयोगात्मक परिणाम प्रस्तुत करना
Limitations:
मीन टीचर के उपयोग के कारण कम्प्यूटेशनल लागत में संभावित वृद्धि
एसीआर सूचकांक की सामान्य प्रयोज्यता पर और अधिक शोध की आवश्यकता है
किसी विशिष्ट उत्पादन मॉडल पर संभावित निर्भरता
प्रायोगिक वातावरण में सीमाओं के कारण सामान्यीकरण का आगे सत्यापन आवश्यक है।
👍