दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

जियोचेन: भौगोलिक तर्क के लिए बहुविध विचार श्रृंखला

Created by
  • Haebom

लेखक

साहिती येरामिलि, निलय पांडे, राइना ग्रोवर, जयंत श्रवण ताम्रपल्ली

रूपरेखा

जियोचेन मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल्स (एमएलएलएम) के चरण-दर-चरण भौगोलिक अनुमान के मूल्यांकन हेतु एक बड़े पैमाने का बेंचमार्क है। 1.46 मिलियन मैपिलरी स्ट्रीट-लेवल छवियों का लाभ उठाते हुए, हम प्रत्येक छवि के साथ प्रश्नों का एक 21-चरणीय क्रम (30 मिलियन से अधिक प्रश्नोत्तर जोड़े) जोड़ते हैं। ये क्रम मॉडल को चार अनुमान श्रेणियों: दृश्य, स्थानिक, सांस्कृतिक और सटीक भौगोलिक स्थान निर्धारण में स्थूल-कण विशेषताओं से लेकर सूक्ष्म-कण स्थान निर्धारण तक मार्गदर्शन करते हैं, और कठिनाई स्तर के अनुसार एनोटेट किए जाते हैं। छवियों को सिमेंटिक सेगमेंटेशन (150 वर्ग) और दृश्य स्थान पहचान स्कोर के साथ भी एनोटेट किया जाता है। 2,088 छवियों के विविध उपसमूहों पर अत्याधुनिक एमएलएलएम्स (जीपीटी-4.1 वेरिएंट, क्लाउड 3.7 और जेमिनी 2.5 वेरिएंट) की बेंचमार्किंग से पता चला कि मॉडल लगातार दृश्य प्रमाण, अनियमित अनुमान और सटीक स्थान निर्धारण के साथ संघर्ष करते हैं, खासकर जब अनुमान की जटिलता बढ़ जाती है। जियोचेन एक मजबूत निदान पद्धति प्रदान करता है जो एमएलएलएम के भीतर जटिल भौगोलिक अनुमान में महत्वपूर्ण प्रगति को बढ़ावा देने के लिए महत्वपूर्ण है।

Takeaways, Limitations

Takeaways:
हम जियोचेन प्रस्तुत करते हैं, जो एमएलएलएम की भौगोलिक अनुमान क्षमताओं के मूल्यांकन के लिए एक मानकीकृत बड़े पैमाने का बेंचमार्क है।
यह स्पष्ट रूप से एमएलएलएम के दृश्य आधार, अनुमान क्षमता और स्थान का सटीक निर्धारण करने की क्षमता की सीमाओं को उजागर करता है।
एमएलएलएम में भौगोलिक अनुमान विकसित करने के लिए एक नैदानिक ​​पद्धति प्रदान करना।
Limitations:
वर्तमान बेंचमार्किंग सीमित संख्या में MLLM और छवियों के एक उपसमूह तक सीमित है।
अनुमान की जटिलता बढ़ने के साथ मॉडल के प्रदर्शन में गिरावट की घटना को समझने के लिए आगे के विश्लेषण की आवश्यकता है।
जियोचेन की मापनीयता और विविध भौगोलिक वातावरणों में प्रयोज्यता पर आगे अनुसंधान की आवश्यकता है।
👍