यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
CRISP-SAM2: मल्टी-ऑर्गन सेगमेंटेशन के लिए क्रॉस-मोडल इंटरैक्शन और सिमेंटिक प्रॉम्प्टिंग के साथ SAM2
Created by
Haebom
लेखक
ज़िनलेई यू, चांगमियाओ वांग, हुई जिन, अहमद एलाजाब, गैंगयोंग जिया, जियांग वान, चांगकिंग ज़ोउ, रुइक्वान जीई
रूपरेखा
CRISP-SAM2 एक बहु-अंग चिकित्सा विभाजन मॉडल है जो चिकित्सा छवि प्रसंस्करण में महत्वपूर्ण भूमिका निभाता है। मौजूदा मॉडलों के गलत विवरण, ज्यामितीय संकेत निर्भरता और स्थानिक सूचना हानि की समस्याओं को हल करने के लिए, हम एक नया मॉडल प्रस्तुत करते हैं जो क्रॉस-मोडल इंटरैक्शन और सिमेंटिक प्रॉम्प्टिंग का उपयोग करता है। हम एक उन्नत क्रॉस-अटेंशन इंटरैक्शन तंत्र के माध्यम से दृश्य और पाठ्य इनपुट को क्रॉस-मोडल प्रासंगिक अर्थों में बदलते हैं, और दृश्य जानकारी की समझ को बढ़ाने के लिए उन्हें छवि एनकोडर में फीड करते हैं। हम ज्यामितीय संकेतों पर निर्भरता को हटाने के लिए एक सिमेंटिक प्रॉम्प्टिंग रणनीति का उपयोग करते हैं, और स्मृति के लिए एक समानता-संरेखित स्व-अद्यतन रणनीति और चिकित्सा छवियों के अनुकूल होने और स्थानीय विवरणों को बढ़ाने के लिए एक मुखौटा सुधार प्रक्रिया लागू करते हैं। सात सार्वजनिक डेटासेट पर तुलनात्मक प्रयोग दिखाते हैं कि यह मौजूदा मॉडलों से बेहतर प्रदर्शन करता है, और विशेष रूप से, यह मौजूदा मॉडलों की Limitations को प्रभावी ढंग से हल करता है। कोड https://github.com/YU-deep/CRISP_SAM2.git पर उपलब्ध है ।
बहु-संस्थागत स्वास्थ्य देखभाल विभाजन में मौजूदा मॉडलों के __T8137__ (गलत विवरण, ज्यामितीय शीघ्र निर्भरता, स्थानिक सूचना हानि) को प्रभावी ढंग से संबोधित करना।
◦
क्रॉस-मोडल इंटरैक्शन और अर्थ संबंधी संकेत के माध्यम से दृश्य और पाठ्य जानकारी का प्रभावी ढंग से लाभ उठाएं।
◦
स्मृति के लिए समानता-संरेखित स्व-अद्यतन रणनीति और मास्क शोधन प्रक्रिया के माध्यम से स्थानीय विवरण को बढ़ाना।
◦
हम पुष्टि करते हैं कि हमारा मॉडल सात सार्वजनिक डेटासेटों पर मौजूदा मॉडलों से बेहतर प्रदर्शन करता है।
◦
खुले कोड के माध्यम से पुनरुत्पादनशीलता संभव है।
•
Limitations:
◦
पेपर में विशिष्ट Limitations का स्पष्ट रूप से उल्लेख नहीं किया गया है। अधिक गहन मूल्यांकन के लिए अतिरिक्त प्रयोगों और विश्लेषणों की आवश्यकता हो सकती है।
◦
कुछ प्रकार की चिकित्सा छवियों या संस्थानों के प्रदर्शन में कमी आने की संभावना हो सकती है।
◦
मॉडल की कम्प्यूटेशनल लागत और जटिलता के विस्तृत विश्लेषण का अभाव।