दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

XGeM: मल्टीमॉडल मेडिकल डेटा जेनरेशन के लिए एक मल्टी-प्रॉम्प्ट फाउंडेशन मॉडल

Created by
  • Haebom

लेखक

डेनियल मोलिनो, फ्रांसेस्को डि फियोला, एलियोडोरो फैएला, डेबोरा फैज़िनी, डोमिज़ियाना सैंटुची, लिनलिन शेन, वेलेरियो गुआरासी, पाओलो सोडा

रूपरेखा

XGeM एक 6.7 बिलियन-पैरामीटर मल्टीमॉडल जनरेटिव मॉडल है जिसे मेडिकल इमेजिंग में AI उपयोग की चुनौतियों का समाधान करने के लिए प्रस्तावित किया गया है: डेटा की कमी, गोपनीयता संबंधी चिंताएँ और मज़बूत मल्टीमॉडल एकीकरण की आवश्यकता। यह कंट्रास्टिव लर्निंग के माध्यम से एक साझा लेटेंट स्पेस का निर्माण करता है और एक नई मल्टी-प्रॉम्प्ट ट्रेनिंग रणनीति पेश करता है जो इनपुट मोडैलिटी के एक मनमाने उपसमूह पर शर्त लगा सकता है, जिससे विभिन्न मनमाने मोडैलिटी में संश्लेषण का समर्थन होता है। हम इसकी तुलना MIMIC-CXR डेटासेट का उपयोग करके प्रतिस्पर्धी मॉडलों से करते हैं, और विशेषज्ञ रेडियोलॉजिस्ट को लक्षित करने वाले विज़ुअल ट्यूरिंग टेस्ट के माध्यम से उत्पन्न डेटा की यथार्थवादिता और नैदानिक ​​प्रासंगिकता का मूल्यांकन करते हैं। हम प्रदर्शित करते हैं कि इसका उपयोग डेटा गुमनामी, वर्ग असंतुलन और डेटा की कमी जैसी स्वास्थ्य सेवा डेटा चुनौतियों का समाधान करने के लिए किया जा सकता है।

Takeaways, Limitations

Takeaways:
हम 6.7 बिलियन मापदंडों के साथ एक मजबूत मल्टीमॉडल जनरेटिव मॉडल प्रस्तुत करते हैं, जो विभिन्न चिकित्सा डेटा तौर-तरीकों के बीच लचीले और मनमाने अंतर-रूपांतरण का समर्थन करता है।
विपरीत शिक्षण और बहु-प्रॉम्प्ट प्रशिक्षण रणनीतियों के माध्यम से नैदानिक ​​स्थिरता बनाए रखते हुए कई तौर-तरीकों को एकीकृत करना।
चिकित्सा डेटा गुमनामीकरण, वर्ग असंतुलन और डेटा अपर्याप्तता की समस्याओं को हल करने में योगदान देता है।
विशेषज्ञ मूल्यांकन के माध्यम से उत्पन्न आंकड़ों की वास्तविकता और नैदानिक ​​वैधता का सत्यापन।
Limitations:
पेपर में विशिष्ट Limitations का स्पष्ट रूप से उल्लेख नहीं किया गया है। मॉडल के प्रदर्शन और सामान्यीकरण क्षमता को बेहतर बनाने के लिए भविष्य में शोध की आवश्यकता है।
किसी विशिष्ट डेटासेट (MIMIC-CXR) पर निर्भरता हो सकती है। अन्य डेटासेट के लिए सामान्यीकरण प्रदर्शन को सत्यापित करने की आवश्यकता है।
6.7 बिलियन पैरामीटर के बड़े मॉडल आकार के कारण कंप्यूटिंग संसाधन खपत और पहुंच संबंधी समस्याएं।
👍