[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

$S^2M^2$: विश्वसनीय गहराई अनुमान के लिए स्केलेबल स्टीरियो मिलान मॉडल

Created by
  • Haebom

लेखक

जुनहोंग मिन, यंगपिल जियोन, जिमिन किम, मिनयोंग चोई

रूपरेखा

हमारा लक्ष्य एक सामान्यीकृत स्टीरियो मिलान मॉडल विकसित करना है जो रिज़ॉल्यूशन और असमानता की एक विस्तृत श्रृंखला पर डेटासेट-विशिष्ट फ़ाइन-ट्यूनिंग के बिना प्रदर्शन कर सके। मौजूदा पुनरावृत्त स्थानीय खोज दृष्टिकोण सीमित बेंचमार्क पर उच्च स्कोर प्राप्त करते हैं, लेकिन वैश्विक संगति का अभाव रखते हैं, जिससे सामान्यीकरण सीमित होता है। दूसरी ओर, वैश्विक मिलान आर्किटेक्चर सैद्धांतिक रूप से अधिक शक्तिशाली हैं, लेकिन उनकी उच्च कम्प्यूटेशनल लागत और मेमोरी आवश्यकताएँ उन्हें अव्यावहारिक बनाती हैं। इस पत्र में, हम $S^2M^2$ नामक एक नवीन वैश्विक मिलान आर्किटेक्चर प्रस्तुत करते हैं, जो लागत-मात्रा फ़िल्टरिंग या गहन संवर्द्धन स्टैक पर निर्भर किए बिना अत्याधुनिक सटीकता और उच्च दक्षता दोनों प्राप्त करता है। यह मज़बूत लंबी-दूरी प्रतिक्रिया के लिए एक बहु-रिज़ॉल्यूशन ट्रांसफ़ॉर्मर और एक नवीन हानि फ़ंक्शन को एकीकृत करता है जो असमानता, अवरोधन और विश्वास का अधिक मज़बूती से संयुक्त रूप से अनुमान लगाने के लिए संभाव्य मिलान पर संभाव्यता को केंद्रित करता है। यह मिडिलबरी v3 और ETH3D बेंचमार्क पर अत्याधुनिक प्रदर्शन प्राप्त करता है, प्रतिस्पर्धी दक्षता के साथ उच्च-गुणवत्ता वाले विवरणों का पुनर्निर्माण करता है।

Takeaways, Limitations

Takeaways:
हम एक नई वास्तुकला ($S^2M^2$) प्रस्तुत करते हैं जो पारंपरिक स्टीरियो मिलान विधियों में सटीकता और दक्षता के बीच व्यापार-बंद को हल करती है, जो कि Limitations है।
बहु-रिज़ॉल्यूशन ट्रांसफार्मर और नवीन हानि कार्यों का लाभ उठाकर उच्च सटीकता और दक्षता दोनों प्राप्त करना।
मिडिलबरी V3 और ETH3D बेंचमार्क पर अत्याधुनिक प्रदर्शन रिकॉर्ड।
उच्च गुणवत्ता वाले विवरणों का पुनर्निर्माण करने की क्षमता।
Limitations:
इस शोधपत्र में प्रस्तुत $S^2M^2$ के सामान्यीकरण प्रदर्शन का अतिरिक्त मूल्यांकन आवश्यक है। विभिन्न डेटासेट और स्थितियों पर प्रदर्शन सत्यापन आवश्यक है।
कम्प्यूटेशनल लागत और मेमोरी उपयोग के विस्तृत विश्लेषण और तुलना का अभाव। अन्य अत्याधुनिक मॉडलों के साथ तुलनात्मक विश्लेषण की आवश्यकता है।
नए हानि फलन के डिज़ाइन सिद्धांतों की विस्तृत व्याख्या का अभाव है। डिज़ाइन प्रक्रिया और इसके चयन के कारणों पर अतिरिक्त चर्चा की आवश्यकता है।
👍