यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र इस तथ्य को संबोधित करता है कि उपग्रह इमेजरी में ऑब्जेक्ट स्थानीयकरण वस्तुओं की विविधता, कम स्थानिक रिज़ॉल्यूशन, बादलों और शहर की रोशनी जैसे शोर के हस्तक्षेप और प्रमुख विशेषताओं के हस्तक्षेप के कारण विशेष रूप से चुनौतीपूर्ण है। यह अध्ययन तीन उपग्रह डेटासेट पर केंद्रित है: ऊपरी-वायुमंडल गुरुत्वाकर्षण तरंग (GW), मेसोस्फीयर बोर, और महासागर भंवर (OE) प्रत्येक डेटासेट की अनूठी चुनौतियों को संबोधित करने के लिए। इन चुनौतियों में प्रमुख ऑब्जेक्ट पैटर्न के पैमाने और आकार में परिवर्तनशीलता शामिल है, जहां रुचि की वस्तुओं का आकार, आकार और फीचर कवरेज काफी भिन्न हो सकता है। इन चुनौतियों को संबोधित करने के लिए, यह शोधपत्र YOLO-DCAP प्रस्तुत करता है, जो जटिल परिदृश्यों में ऑब्जेक्ट स्थानीयकरण को बेहतर बनाने के लिए डिज़ाइन किया गया YOLOv5 का एक नया उन्नत संस्करण है। YOLO-DCAP एक मल्टी-स्केल डाइलेटेड रेसिडुअल कन्वोल्यूशन (MDRC) ब्लॉक को एकीकृत करता है जो विभिन्न फैलाव दरों के साथ मल्टी-स्केल सुविधाओं को कैप्चर करता है, और एक ध्यान-सहायता प्राप्त स्थानिक पूलिंग (AaSP) मॉड्यूल जो वैश्विक रूप से प्रासंगिक स्थानिक क्षेत्रों पर ध्यान केंद्रित करके फीचर चयन को बेहतर बनाता है। ये संरचनात्मक सुधार उपग्रह इमेजरी में वस्तुओं को बेहतर ढंग से खोजने में मदद करते हैं। प्रायोगिक परिणामों से पता चलता है कि YOLO-DCAP, YOLO बेसलाइन मॉडल और अत्याधुनिक तरीकों दोनों से काफी बेहतर प्रदर्शन करता है, बेसलाइन मॉडल की तुलना में mAP50 में औसतन 20.95% और IoU में 32.23% और अत्याधुनिक विकल्पों की तुलना में क्रमशः 7.35% और 9.84% की औसत हासिल करता है। तीन सैटेलाइट डेटासेट में लगातार प्रदर्शन में सुधार प्रस्तावित दृष्टिकोण की मजबूती और सामान्यीकरण को उजागर करता है। कोड https://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localization पर उपलब्ध है ।