दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अंतर्निहित लेबल शोर के विरुद्ध लेबल-केवल लोचदार विरूपण के माध्यम से मजबूत अर्थपूर्ण विभाजन प्रदर्शन को अनलॉक करना

Created by
  • Haebom

लेखक

येचन किम, डोंगहो यून, युंकवान ली, उनसे फातिमा, होंग कूक किम, सोंगजे ली, सांगा पार्क, जियोंग हो पार्क, सियोंजोंग कांग, मूंगु जियोन

रूपरेखा

पिछले छवि विभाजन अनुसंधान, जो स्पष्ट लेबल नॉइज़ पर केंद्रित है, के विपरीत, यह शोधपत्र वास्तविक-विश्व डेटासेट की सूक्ष्म (अंतर्निहित) लेबल अपूर्णता, जैसे अस्पष्ट वस्तु सीमाएँ या एनोटेटर्स के बीच अंतर, को संबोधित करता है। ये सूक्ष्म नॉइज़, भले ही स्पष्ट न हों, मॉडल के प्रदर्शन को कम कर सकते हैं। इस शोधपत्र में, हम NSegment+ प्रस्तुत करते हैं, जो एक नया संवर्द्धन ढाँचा है जो इस यथार्थवादी नॉइज़ को संबोधित करने के लिए छवि और लेबल परिवर्तनों को अलग करता है। NSegment+ मूल छवि को बनाए रखता है जबकि नियंत्रित प्रत्यास्थ विरूपण केवल खंडित लेबलों पर लागू होता है, जिससे यह मामूली लेबल बेमेल के बावजूद वस्तु संरचना के सुदृढ़ निरूपण सीखने पर ध्यान केंद्रित कर सकता है। प्रायोगिक परिणाम दर्शाते हैं कि NSegment+ वैहिंगेन, लवडीए, सिटीस्केप्स और PASCAL VOC डेटासेट पर क्रमशः +2.29, +2.38, +1.75 और +3.39 का औसत माध्य IoU सुधार प्राप्त करता है। इसे अन्य प्रशिक्षण तकनीकों, जैसे कि कटमिक्स और लेबल स्मूथिंग के साथ संयोजित करने पर, प्रदर्शन और भी बेहतर हो जाता है।

Takeaways, Limitations

Takeaways:
छवि विभाजन मॉडल प्रदर्शन पर अंतर्निहित लेबल शोर के प्रभाव को स्पष्ट रूप से प्रस्तुत करना।
एनसेगमेंट+ संवर्धन तकनीक के साथ अंतर्निहित लेबल शोर समस्या का समाधान करना जो छवि और लेबल रूपांतरणों को अलग करता है।
विभिन्न डेटासेटों में लगातार प्रदर्शन सुधार प्रदर्शित करता है, तथा मौजूदा विधियों से बेहतर प्रदर्शन करता है।
कटमिक्स और लेबल स्मूथिंग जैसी अन्य तकनीकों से तालमेल प्रभाव की पुष्टि की गई।
Limitations:
एनसेगमेंट+ में प्रत्यास्थ विरूपण मापदंडों के अनुकूलन पर विशिष्ट चर्चा का अभाव।
विभिन्न प्रकार के अंतर्निहित लेबल शोर के लिए सामान्यीकरण प्रदर्शन को सत्यापित करने की आवश्यकता है।
अन्य उन्नत संवर्द्धन तकनीकों के साथ तुलनात्मक विश्लेषण का अभाव।
👍