दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

लैंडसैट30-एयू: ऑस्ट्रेलियाई लैंडसैट इमेजरी के लिए एक विज़न-लैंग्वेज डेटासेट

Created by
  • Haebom

लेखक

साई मा, ज़ुआंग ली, जॉन ए टेलर

रूपरेखा

उपग्रह चित्रों के साथ प्राकृतिक भाषा की अंतःक्रिया को सक्षम करने वाले दृष्टि-भाषा मॉडल (वीएलएम) की सीमाओं को संबोधित करने के लिए, यह शोधपत्र लैंडसैट30-एयू प्रस्तुत करता है, जो एक बड़े पैमाने का दृष्टि-भाषा डेटासेट है जो ऑस्ट्रेलिया के ऊपर चार लैंडसैट उपग्रहों (5, 7, 8, और 9) से एकत्रित 30 मीटर की दूरी पर 36 वर्षों से अधिक समय तक की दीर्घकालिक, निम्न-रिज़ॉल्यूशन उपग्रह चित्रों पर आधारित है। लैंडसैट30-एयू में दो घटक होते हैं: लैंडसैट30-एयू-कैप, जिसमें 196,262 छवि-कैप्शन युग्म हैं, और लैंडसैट30-एयू-वीक्यूए, जिसमें आठ सुदूर संवेदन डोमेन में 17,725 मानव-सत्यापित दृश्य प्रश्नोत्तर (वीक्यूए) नमूने हैं। हम प्रदर्शित करते हैं कि मौजूदा वीएलएम निम्न-रिज़ॉल्यूशन उपग्रह चित्रों को समझने में कठिनाई महसूस करते हैं और लैंडसैट30-एयू का उपयोग करके हल्के फ़ाइन-ट्यूनिंग के माध्यम से बेहतर प्रदर्शन प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
हम एक बड़े पैमाने पर विज़न-लैंग्वेज डेटासेट, लैंडसैट30-एयू प्रदान करते हैं, जिसमें दीर्घकालिक, कम-रिज़ॉल्यूशन, बहु-उपग्रह डेटा शामिल है, जो मौजूदा वीएलएम की सीमाओं पर काबू पाने के लिए आधार तैयार करता है।
हमने प्रयोगात्मक रूप से उपग्रह छवि समझ में मौजूदा वीएलएम की अपर्याप्तता को प्रदर्शित किया और फाइन-ट्यूनिंग के माध्यम से प्रदर्शन में सुधार की संभावना का सुझाव दिया।
यह कम-रिज़ॉल्यूशन उपग्रह इमेजरी पर आधारित पृथ्वी अवलोकन और विश्लेषण अनुसंधान के लिए नई संभावनाओं को खोलता है।
Limitations:
चूंकि डेटासेट ऑस्ट्रेलियाई क्षेत्र तक सीमित है, इसलिए वैश्विक सामान्यीकरण प्रदर्शन का और अधिक सत्यापन आवश्यक है।
वर्तमान में, उपग्रह चित्रों को समझने की वीएलएम की क्षमता अभी भी सीमित है, तथा अधिक उन्नत मॉडलों और तकनीकों की आवश्यकता है।
डेटासेट निर्माण के दौरान उपयोग की जाने वाली बूटस्ट्रैपिंग पाइपलाइन के विस्तृत विवरण का अभाव है।
👍