यह पत्र MEDVQA-GI चुनौती को संबोधित करते हुए, पाठ विवरणों से गतिशील, मापनीय और सटीक चिकित्सा छवियों को उत्पन्न करने के लिए एक नया दृष्टिकोण प्रस्तुत करता है। मौजूदा तरीकों (स्थिर छवि विश्लेषण और पाठ विवरणों से गतिशील चिकित्सा छवि निर्माण की कमी) की सीमाओं को दूर करने के लिए, हमने उच्च गुणवत्ता वाली चिकित्सा छवियों को उत्पन्न करने के लिए निम्न-रैंक अनुकूलन (LORA) के साथ स्टेबल डिफ्यूजन और ड्रीमबूथ मॉडल को एकीकृत किया। इस प्रणाली में दो उप-कार्य शामिल हैं: छवि संश्लेषण (IS) और इष्टतम प्रॉम्प्ट जनरेशन (OPG)। मूल्यांकन के परिणाम बताते हैं कि स्टेबल डिफ्यूजन CLIP और ड्रीमबूथ + LORA की तुलना में उच्च-गुणवत्ता और अधिक विविध छवियां उत्पन्न करता है। विशेष रूप से, इसने सबसे कम FID स्कोर (सिंगल-सेंटर के लिए 0.099, मल्टी-सेंटर के लिए 0.064 और संयुक्त के लिए 0.067) और उच्चतम इंसेप्शन स्कोर (डेटासेट में औसत, 2.327) हासिल किया।