दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

हस्तांतरणीय मास्क ट्रांसफार्मर: क्षेत्र-अनुकूली हस्तांतरणीयता अनुमान के साथ क्रॉस-डोमेन सिमेंटिक सेगमेंटेशन

Created by
  • Haebom

लेखक

जियानहुआ लियू, झेंगयु ली, यानरू वू, जिंगगे वांग, यांग टैन, रुइज़े झाओ, गुआन वांग, यांग ली

रूपरेखा

यह शोधपत्र विज़न ट्रांसफ़ॉर्मर्स (ViTs) का उपयोग करके सिमेंटिक सेगमेंटेशन में क्रॉस-डोमेन अंतरों के कारण होने वाले प्रदर्शन ह्रास को दूर करने के लिए एक क्षेत्र-स्तरीय अनुकूलन तकनीक का प्रस्ताव करता है। मौजूदा वैश्विक या पैच-स्तरीय अनुकूलन तकनीकों की सीमाओं को दूर करने के लिए, हम अनुकूली क्लस्टर-आधारित ट्रांसफ़रेबिलिटी एस्टीमेटर (ACTE) का उपयोग करके छवियों को संरचनात्मक और सिमेंटिक रूप से सुसंगत क्षेत्रों में गतिशील रूप से विभाजित करते हैं और प्रत्येक क्षेत्र की ट्रांसफ़रेबिलिटी का आकलन करते हैं। इसके बाद, ट्रांसफ़रेबल मास्क्ड अटेंशन (TMA) मॉड्यूल क्षेत्र-विशिष्ट ट्रांसफ़रेबिलिटी मैप्स को ViTs के अटेंशन मैकेनिज़्म में एकीकृत करता है, कम ट्रांसफ़रेबिलिटी और उच्च सिमेंटिक अनिश्चितता वाले क्षेत्रों में अनुकूलन को प्राथमिकता देता है। 20 क्रॉस-डोमेन युग्मों पर व्यापक मूल्यांकन मौजूदा विधियों की तुलना में औसतन 2% MIoU सुधार प्रदर्शित करता है।

Takeaways, Limitations

Takeaways:
हम डोमेन-स्तरीय अनुकूलन के माध्यम से अंतर-डोमेन अंतर के कारण ViTs-आधारित सिमेंटिक विभाजन के प्रदर्शन में गिरावट को प्रभावी ढंग से संबोधित करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
ACTE और TMA मॉड्यूल के माध्यम से क्षेत्रीय वितरण क्षमता का कुशलतापूर्वक विश्लेषण करें और इसे अनुकूलन प्रक्रिया में प्रतिबिंबित करें।
विभिन्न क्रॉस-डोमेन युग्मों के लिए प्रयोगात्मक परिणामों के माध्यम से उत्कृष्ट प्रदर्शन सत्यापन।
खुला स्रोत कोड प्रदान किया गया.
Limitations:
ACTE मॉड्यूल कम्प्यूटेशनल दृष्टि से महंगा हो सकता है।
कुछ डोमेन संयोजनों के लिए प्रदर्शन सुधार सीमित हो सकते हैं।
विभिन्न आर्किटेक्चर और डेटासेट पर अतिरिक्त प्रयोगों की आवश्यकता है।
👍