दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्या बड़े मल्टीमॉडल मॉडल कृषि दृश्यों को समझ सकते हैं? एग्रोमाइन्ड के साथ बेंचमार्किंग

Created by
  • Haebom

लेखक

किंगमेई ली, यांग झांग, ज़ुरोंग माई, युहांग चेन, शुओहोंग लू, हेंग्लियान हुआंग, जियारुई झांग, झिवेई झांग, यिबिन वेन, वेइजिया ली, हाओहुआन फू, जियानक्सी हुआंग, जुएपेंग झेंग

रूपरेखा

यह शोधपत्र कृषि सुदूर संवेदन के लिए विशिष्ट एक व्यापक मानक, एग्रॉमाइंड प्रस्तुत करता है। मौजूदा मानकों की सीमाओं, जिनमें सीमित डेटासेट विविधता और अति-सरलीकृत कार्य डिज़ाइन शामिल हैं, को दूर करने के लिए, हमने 27,247 QA युग्मों और 19,615 छवियों वाले एक उच्च-गुणवत्ता वाले मूल्यांकन सेट का निर्माण करने के लिए आठ सार्वजनिक डेटासेट और एक निजी कृषिभूमि डेटासेट को एकीकृत किया। एग्रॉमाइंड चार कार्य आयामों में 13 कार्य प्रकारों (फसल पहचान और स्वास्थ्य निगरानी से लेकर पर्यावरणीय विश्लेषण तक) को शामिल करता है: स्थानिक बोध, वस्तु बोध, दृश्य बोध और दृश्य अनुमान। एग्रॉमाइंड के साथ 20 मुक्त-स्रोत LMM और चार बंद-स्रोत मॉडलों का मूल्यांकन करने पर, विशेष रूप से स्थानिक अनुमान और सूक्ष्म-कणीय पहचान में, महत्वपूर्ण प्रदर्शन अंतरों का पता चलता है, जहाँ कुछ प्रमुख LMM मानव प्रदर्शन से बेहतर प्रदर्शन करते हैं। एग्रॉमाइंड कृषि सुदूर संवेदन के लिए एक मानकीकृत मूल्यांकन ढाँचा स्थापित करता है, जो LMM की डोमेन ज्ञान सीमाओं को उजागर करता है और भविष्य के अनुसंधान के लिए महत्वपूर्ण चुनौतियों पर प्रकाश डालता है। डेटा और कोड https://rssysu.github.io/AgroMind/ पर उपलब्ध हैं ।

Takeaways, Limitations

Takeaways:
एग्रोमाइन्ड कृषि सुदूर संवेदन के लिए व्यापक और मानकीकृत मानक प्रदान करता है।
एलएमएम प्रदर्शन का निष्पक्ष मूल्यांकन और सुधार करने के लिए आधार स्थापित करना
एलएमएम के डोमेन ज्ञान की सीमाएं और भविष्य की अनुसंधान दिशाएं (विशेष रूप से स्थानिक तर्क और सूक्ष्म-बोध)
हमने दर्शाया है कि कुछ एलएमएम मनुष्यों से बेहतर प्रदर्शन कर सकते हैं, जिससे एलएमएम की क्षमता की पुष्टि होती है।
Limitations:
एग्रोमाइन्ड डेटासेट के दायरे और विविधता को समझने के लिए और अधिक शोध की आवश्यकता है।
अधिक विविध एलएमएम मॉडलों का मूल्यांकन किए जाने की आवश्यकता है।
विशिष्ट कार्य प्रकारों के लिए निष्पादन विचलन का कारण निर्धारित करने के लिए गहन विश्लेषण की आवश्यकता है।
👍