यह पेपर उस घटना को संबोधित करता है जिसमें टेक्स्ट-टू-इमेज जेनरेशन (TTI) मॉडल हमेशा अज्ञात शब्दों के साथ संकेत दिए जाने पर भी आउटपुट देते हैं। इस मामले में, मॉडल "बेस इमेज" उत्पन्न कर सकता है जो विभिन्न अप्रासंगिक संकेतों में एक दूसरे से बहुत मिलते-जुलते हैं। इस पेपर में, हम लोकप्रिय इमेज जनरेटर मिडजर्नी में बेस इमेज की पहली जांच प्रस्तुत करते हैं। हम इनपुट प्रॉम्प्ट बनाने के लिए एक व्यवस्थित दृष्टिकोण का वर्णन करते हैं जो बेस इमेज उत्पन्न करते हैं, और प्रारंभिक प्रयोगों और एक छोटे पैमाने पर पृथक्करण अध्ययन के परिणाम प्रस्तुत करते हैं। हम एक सर्वेक्षण अध्ययन पर भी रिपोर्ट करते हैं जिसने उपयोगकर्ता संतुष्टि पर बेस इमेज के प्रभाव की जांच की। यह अध्ययन TTI में बेस इमेज को समझने की नींव रखता है, और चुनौतियों और भविष्य के शोध दिशाओं पर प्रकाश डालता है।