दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एआई-संचालित चिकित्सा छवि संश्लेषण को आगे बढ़ाना: CLIP, फाइन-ट्यून्ड स्टेबल डिफ्यूजन और ड्रीम-बूथ + LoRA का उपयोग करते हुए MedVQA-GI चुनौती से अंतर्दृष्टि

Created by
  • Haebom

लेखक

ओजोनुगवा ओलुवाफेमी एजिगा पीटर, एमडी महमूदुर रहमान, फहमी खलीफा

रूपरेखा

यह पत्र MEDVQA-GI चुनौती को संबोधित करते हुए, पाठ विवरणों से गतिशील, मापनीय और सटीक चिकित्सा छवियों को उत्पन्न करने के लिए एक नया दृष्टिकोण प्रस्तुत करता है। मौजूदा तरीकों (स्थिर छवि विश्लेषण और पाठ विवरणों से गतिशील चिकित्सा छवि निर्माण की कमी) की सीमाओं को दूर करने के लिए, हमने उच्च गुणवत्ता वाली चिकित्सा छवियों को उत्पन्न करने के लिए निम्न-रैंक अनुकूलन (LORA) के साथ स्टेबल डिफ्यूजन और ड्रीमबूथ मॉडल को एकीकृत किया। इस प्रणाली में दो उप-कार्य शामिल हैं: छवि संश्लेषण (IS) और इष्टतम प्रॉम्प्ट जनरेशन (OPG)। मूल्यांकन के परिणाम बताते हैं कि स्टेबल डिफ्यूजन CLIP और ड्रीमबूथ + LORA की तुलना में उच्च-गुणवत्ता और अधिक विविध छवियां उत्पन्न करता है। विशेष रूप से, इसने सबसे कम FID स्कोर (सिंगल-सेंटर के लिए 0.099, मल्टी-सेंटर के लिए 0.064 और संयुक्त के लिए 0.067) और उच्चतम इंसेप्शन स्कोर (डेटासेट में औसत, 2.327) हासिल किया।

Takeaways, Limitations

Takeaways:
हम पाठ्य विवरण से गतिशील रूप से उच्च गुणवत्ता वाली चिकित्सा छवियां उत्पन्न करने की एक नवीन विधि प्रस्तुत करते हैं।
चिकित्सा छवि निर्माण के क्षेत्र में स्थिर प्रसार मॉडल की श्रेष्ठता सिद्ध करना।
एआई-आधारित चिकित्सा निदान प्रौद्योगिकी को बेहतर बनाने में योगदान देना।
Limitations:
मॉडल सुधार, डेटासेट संवर्द्धन, तथा नैदानिक अनुप्रयोग के लिए नैतिक विचारों सहित आगे और अधिक शोध की आवश्यकता है।
👍