यह शोधपत्र चिकित्सा छवि विश्लेषण पाइपलाइन के विखंडन और अकुशलता को दूर करने के लिए एकल दृष्टि-भाषा मॉडल (वीएलएम) पर आधारित एक एकीकृत ढाँचा प्रस्तुत करता है। यह ढाँचा वीएलएम को दो भूमिकाओं में उपयोग करता है। पहला, वीएलएम एक मॉडल कार्ड मिलानकर्ता के रूप में कार्य करता है, जो चिकित्सा छवियों को उपयुक्त विशिष्ट मॉडलों तक पहुँचाता है। यह एक तीन-चरणीय प्रक्रिया (मोडैलिटी -> प्रमुख विसंगति -> मॉडल कार्ड आईडी) करता है, जिसमें प्रत्येक चरण में प्रारंभिक समाप्ति जाँच सटीकता में सुधार करती है। दूसरा, वीएलएम को एकल मॉडल के साथ कई उप-कार्यों को संभालने के लिए डोमेन-विशिष्ट डेटासेट पर परिष्कृत किया जाता है। गैस्ट्रोएंटरोलॉजी, हेमेटोलॉजी, नेत्र विज्ञान और पैथोलॉजी में, एकल-मॉडल परिनियोजन विशिष्ट बेसलाइन मॉडल के बराबर या उसके समान प्रदर्शन प्रदर्शित करते हैं। इससे डेटा वैज्ञानिकों के प्रयास में कमी, निगरानी में तेजी, मॉडल चयन में पारदर्शिता और एकीकरण ओवरहेड में कमी आने की उम्मीद है।