यह शोध पत्र कृत्रिम, वैयक्तिकृत छवि निर्माण पर केंद्रित है, जो छवियों को उत्पन्न करने के लिए कई अवधारणाओं को जोड़ता है। मौजूदा शोध मुख्य रूप से लक्ष्य वस्तुओं के स्वरूप को संरक्षित करने पर केंद्रित रहा है, लेकिन उनके बीच अंतःक्रियाओं के सूक्ष्म नियंत्रण की अनदेखी की गई है। यह शोध पत्र "कस्टम मानव-वस्तु अंतःक्रिया छवि निर्माण" (CHOI) नामक एक चुनौती का प्रस्ताव करता है, जो मानव-वस्तु अंतःक्रिया परिदृश्यों पर केंद्रित है। CHOI के लिए लक्ष्य मनुष्यों और वस्तुओं की पहचान संरक्षण और उनके बीच अंतःक्रिया शब्दार्थ पर नियंत्रण, दोनों की आवश्यकता होती है। CHOI की प्रमुख चुनौतियाँ हैं: (1) एक साथ पहचान संरक्षण और अंतःक्रिया नियंत्रण के लिए मनुष्यों और वस्तुओं को स्व-निहित पहचान विशेषताओं और मुद्रा-आधारित अंतःक्रिया विशेषताओं में विघटित करना आवश्यक है। हालाँकि, मौजूदा HOI छवि डेटासेट इस विशेषता विघटन को सीखने के लिए आदर्श नमूने प्रदान नहीं करते हैं; और (2) मनुष्यों और वस्तुओं के बीच अनुपयुक्त स्थानिक विन्यास वांछित अंतःक्रिया शब्दार्थ का अभाव पैदा कर सकते हैं। इस समस्या का समाधान करने के लिए, हम एक दो-चरणीय मॉडल, इंटरैक्ट-कस्टम, डिज़ाइन करते हैं, जिसमें विभिन्न अंतःक्रिया मुद्राओं वाले समान मानव-वस्तु युग्मों के नमूनों वाले एक बड़े पैमाने के डेटासेट को संसाधित किया जाता है। इंटरैक्ट-कस्टम सबसे पहले एक अग्रभूमि मास्क उत्पन्न करके स्थानिक विन्यास को स्पष्ट रूप से मॉडल करता है जो अंतःक्रिया व्यवहार को दर्शाता है। फिर यह लक्षित मनुष्यों और वस्तुओं को उत्पन्न करता है जो इस मास्क द्वारा निर्देशित, अपनी पहचान विशेषताओं को बनाए रखते हुए अंतःक्रिया करते हैं। इंटरैक्ट-कस्टम पृष्ठभूमि छवि और लक्षित मानव-वस्तु स्थानों के संयोजन को निर्दिष्ट करने के लिए एक वैकल्पिक सुविधा भी प्रदान करता है, जिससे उच्च स्तर का सामग्री नियंत्रण प्राप्त होता है। CHOI कार्य के लिए कस्टम मेट्रिक्स पर व्यापक प्रयोग प्रस्तावित दृष्टिकोण की प्रभावशीलता को प्रदर्शित करते हैं।