दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

वास्तविक समय वस्तु पहचान में आउट-ऑफ-डिस्ट्रीब्यूशन पहचान पर पुनर्विचार: बेंचमार्क खामियों से लेकर नए शमन प्रतिमान तक

Created by
  • Haebom

लेखक

चांगशुन वू, वेइचेंग हे, चिह-होंग चेंग, ज़ियाओवेई हुआंग, सद्देक बेंसलेम

रूपरेखा

यह शोधपत्र तर्क देता है कि आउट-ऑफ-डिस्ट्रीब्यूशन (OoD) इनपुट पर डीप लर्निंग-आधारित ऑब्जेक्ट डिटेक्शन मॉडल्स के अति-आत्मविश्वास की समस्या का समाधान करने के लिए, मौजूदा स्कोरिंग फ़ंक्शन में सुधार और परीक्षण-समय सीमा को समायोजित करने जैसे एल्गोरिथम सुधारों से परे, विकास जीवनचक्र पर व्यापक पुनर्विचार की आवश्यकता है। हम मौजूदा OoD डिटेक्शन मूल्यांकन मानकों की त्रुटियों (13% तक संदूषण) पर प्रकाश डालते हैं और एक नवीन प्रशिक्षण-समय शमन प्रतिमान प्रस्तावित करते हैं जो बाहरी OoD डिटेक्टरों पर निर्भर हुए बिना, अर्थगत रूप से समान OoD डेटासेट का उपयोग करके डिटेक्टर को परिष्कृत करता है। यह दृष्टिकोण YOLO मॉडल के लिए BDD-100K परिवेश में मतिभ्रम संबंधी त्रुटियों को 91% तक कम करता है, और YOLO, Faster R-CNN, और RT-DETR सहित विभिन्न डिटेक्शन विधियों, साथ ही छोटे-शॉट अनुकूलन के लिए सामान्यीकरण को प्रदर्शित करता है।

Takeaways, Limitations

Takeaways:
मौजूदा OoD पहचान मूल्यांकन मानदंडों में गंभीर डेटा संदूषण के मुद्दों को उजागर करके, हम मौजूदा शोध परिणामों की विश्वसनीयता के बारे में सवाल उठाते हैं और अधिक कठोर मूल्यांकन मानदंडों की आवश्यकता पर बल देते हैं।
हम प्रशिक्षण समय के दौरान OoD डेटा का लाभ उठाकर मॉडल के OoD प्रतिरोध को बढ़ाने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं।
एक सामान्य कार्यप्रणाली प्रस्तुत की गई है जिसे विभिन्न ऑब्जेक्ट डिटेक्शन मॉडल जैसे कि YOLO, फास्टर R-CNN, और RT-DETR पर लागू किया जा सकता है, और इसे कम मात्रा में डेटा के साथ भी अनुकूलित किया जा सकता है।
हमने प्रदर्शन में पर्याप्त सुधार प्रदर्शित किया है, जिससे BDD-100K डेटासेट पर YOLO मॉडल की मतिभ्रम त्रुटि 91% तक कम हो गई है।
Limitations:
प्रस्तावित विधि की प्रभावशीलता विशिष्ट डेटासेट और मॉडलों तक सीमित हो सकती है। विविध डेटासेट और मॉडलों पर अतिरिक्त प्रयोगों की आवश्यकता है।
नए प्रशिक्षण समय विश्राम प्रतिमान की कम्प्यूटेशनल लागत और डेटा तैयारी जटिलता पर आगे विश्लेषण की आवश्यकता है।
13% संदूषण दर एक विशिष्ट बेंचमार्क के लिए है, तथा यह निर्धारित करने के लिए आगे सत्यापन की आवश्यकता है कि क्या यह अन्य बेंचमार्क पर भी समान रूप से लागू होता है।
👍