दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

विस्तृत कन्वोल्यूशन और ध्यान-सहायता प्राप्त स्थानिक पूलिंग के साथ उपग्रह ऑब्जेक्ट स्थानीयकरण को बढ़ाना

Created by
  • Haebom

लेखक

सेराज अल महमूद मुस्तफ़ा, चेनक्सी वांग, जिया यू, युता होज़ुमी, जियानवू वांग

रूपरेखा

यह शोधपत्र इस तथ्य को संबोधित करता है कि उपग्रह इमेजरी में ऑब्जेक्ट स्थानीयकरण वस्तुओं की विविधता, कम स्थानिक रिज़ॉल्यूशन, बादलों और शहर की रोशनी जैसे शोर के हस्तक्षेप और प्रमुख विशेषताओं के हस्तक्षेप के कारण विशेष रूप से चुनौतीपूर्ण है। यह अध्ययन तीन उपग्रह डेटासेट पर केंद्रित है: ऊपरी-वायुमंडल गुरुत्वाकर्षण तरंग (GW), मेसोस्फीयर बोर, और महासागर भंवर (OE) प्रत्येक डेटासेट की अनूठी चुनौतियों को संबोधित करने के लिए। इन चुनौतियों में प्रमुख ऑब्जेक्ट पैटर्न के पैमाने और आकार में परिवर्तनशीलता शामिल है, जहां रुचि की वस्तुओं का आकार, आकार और फीचर कवरेज काफी भिन्न हो सकता है। इन चुनौतियों को संबोधित करने के लिए, यह शोधपत्र YOLO-DCAP प्रस्तुत करता है, जो जटिल परिदृश्यों में ऑब्जेक्ट स्थानीयकरण को बेहतर बनाने के लिए डिज़ाइन किया गया YOLOv5 का एक नया उन्नत संस्करण है। YOLO-DCAP एक मल्टी-स्केल डाइलेटेड रेसिडुअल कन्वोल्यूशन (MDRC) ब्लॉक को एकीकृत करता है जो विभिन्न फैलाव दरों के साथ मल्टी-स्केल सुविधाओं को कैप्चर करता है, और एक ध्यान-सहायता प्राप्त स्थानिक पूलिंग (AaSP) मॉड्यूल जो वैश्विक रूप से प्रासंगिक स्थानिक क्षेत्रों पर ध्यान केंद्रित करके फीचर चयन को बेहतर बनाता है। ये संरचनात्मक सुधार उपग्रह इमेजरी में वस्तुओं को बेहतर ढंग से खोजने में मदद करते हैं। प्रायोगिक परिणामों से पता चलता है कि YOLO-DCAP, YOLO बेसलाइन मॉडल और अत्याधुनिक तरीकों दोनों से काफी बेहतर प्रदर्शन करता है, बेसलाइन मॉडल की तुलना में mAP50 में औसतन 20.95% और IoU में 32.23% और अत्याधुनिक विकल्पों की तुलना में क्रमशः 7.35% और 9.84% की औसत हासिल करता है। तीन सैटेलाइट डेटासेट में लगातार प्रदर्शन में सुधार प्रस्तावित दृष्टिकोण की मजबूती और सामान्यीकरण को उजागर करता है। कोड https://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localization पर उपलब्ध है ।

Takeaways, Limitations

Takeaways:
हम एक नया YOLO-DCAP मॉडल प्रस्तुत करते हैं जो उपग्रह चित्रों में वस्तु स्थानीयकरण प्रदर्शन को बेहतर बनाता है।
विभिन्न उपग्रह डेटा सेटों में लगातार उत्कृष्ट प्रदर्शन।
एमडीआरसी ब्लॉकों और एएएसपी मॉड्यूलों की प्रभावशीलता का प्रयोगात्मक सत्यापन।
खुले स्रोत कोड प्रकटीकरण के माध्यम से पहुंच में सुधार करना।
Limitations:
एक विशिष्ट उपग्रह डेटा सेट पर प्रदर्शन मूल्यांकन तक सीमित। अन्य प्रकार के उपग्रह छवि डेटा के लिए सामान्यीकरण के आगे के सत्यापन की आवश्यकता है।
मॉडल की कम्प्यूटेशनल जटिलता और वास्तविक समय प्रसंस्करण क्षमता पर आगे विश्लेषण की आवश्यकता है।
विभिन्न शोरों और हस्तक्षेपों के प्रति मॉडल की मजबूती पर आगे अनुसंधान की आवश्यकता है।
👍