दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सैन्य वाहन वर्गीकरण के लिए CLIP की अवरोधन मजबूती

Created by
  • Haebom

लेखक

जान एरिक वैन वोर्डन, गर्टजन बर्गआउट्स, लोटे निजस्केंस, अल्मा एम. लिज़ेंगा, सबीना वैन रूइज, फ्रैंक रुइस, ह्यूगो जे. कुइजफ

रूपरेखा

यह शोधपत्र CLIP जैसे दृष्टि-भाषा मॉडल (VLM) की मजबूती का अध्ययन करता है, जो सीमित लेबल वाले डेटा वाले रक्षा अनुप्रयोगों में उपयोगी है। विशेष रूप से, आंशिक अवरोध और निम्न SNR जैसे चुनौतीपूर्ण सैन्य वातावरणों में CLIP की मजबूती की जाँच करने के लिए, हमने 18 सैन्य वाहन वर्गों के एक कस्टम डेटासेट का उपयोग करके अवरोध प्रतिशत के एक फलन के रूप में वक्र के नीचे सामान्यीकृत क्षेत्र (NAUC) का मूल्यांकन किया। हमने पाया कि ट्रांसफार्मर-आधारित CLIP मॉडल ने CNN से बेहतर प्रदर्शन किया, जिसमें सूक्ष्म, वितरित अवरोधों ने मोटे, निरंतर अवरोधों की तुलना में अधिक प्रदर्शन गिरावट दिखाई। इसके अलावा, हमने देखा कि रैखिक जांच मॉडल लगभग 35% अवरोध पर तेजी से क्षीण होता है, जबकि बैकबोन को फाइन-ट्यूनिंग करने से प्रदर्शन गिरावट 60% या उससे अधिक अवरोधों तक कम हो जाती है।

Takeaways, Limitations

Takeaways:
ट्रांसफार्मर-आधारित CLIP मॉडल CNN की तुलना में अवरोधन के प्रति अधिक मजबूत पाए गए हैं।
सूक्ष्म एवं विसरित अवरोधन का प्रदर्शन ह्रास पर अधिक प्रभाव पड़ता है।
रीढ़ की हड्डी को ठीक करके अवरोधन के प्रति मजबूती में सुधार किया जा सकता है।
प्रशिक्षण के दौरान अवरोधन-विशिष्ट संवर्द्धन के महत्व पर जोर दें।
Limitations:
यह अध्ययन एक विशिष्ट सैन्य वाहन डेटासेट तक सीमित है।
पैच-स्तर की संवेदनशीलता और वास्तुशिल्पीय लचीलेपन पर आगे अनुसंधान की आवश्यकता है।
वास्तविक दुनिया में तैनाती के लिए अतिरिक्त सत्यापन आवश्यक है।
👍