यह शोधपत्र LOTS (लोकलाइज्ड टेक्स्ट एंड स्केच फॉर फ़ैशन इमेज जेनरेशन) प्रस्तुत करता है, जो एक फ़ैशन इमेज जेनरेशन विधि है जो फ़ैशन डिज़ाइन की जटिल रचनात्मक प्रक्रिया को ध्यान में रखते हुए, स्केच और टेक्स्ट जानकारी को जोड़ती है। LOTS, प्रसार मॉडल-आधारित चरणबद्ध विलय रणनीति के माध्यम से संपूर्ण फ़ैशन इमेज बनाने के लिए वैश्विक विवरणों को स्थानीय स्केच और टेक्स्ट जानकारी के साथ संयोजित करता है। एक मॉड्यूलर युग्म-केंद्रित निरूपण का उपयोग करते हुए, स्केच और टेक्स्ट को स्वतंत्र स्थानीय विशेषताओं को बनाए रखते हुए एक साझा अव्यक्त स्थान में एन्कोड किया जाता है। ध्यान-आधारित मार्गदर्शन प्रसार मॉडल की बहु-चरणीय शोर-निवारण प्रक्रिया के दौरान स्थानीय और वैश्विक स्थितियों को एकीकृत करता है। हम एक नया फ़ैशन डेटासेट, स्केची, प्रस्तुत करते हैं और मात्रात्मक और गुणात्मक मूल्यांकनों के माध्यम से मौजूदा विधियों की तुलना में इसके बेहतर प्रदर्शन को प्रदर्शित करते हैं।