दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

इंटरैक्ट-कस्टम: अनुकूलित मानव वस्तु इंटरैक्शन छवि निर्माण

Created by
  • Haebom

लेखक

झू जू, झाओवेन वांग, युक्सिन पेंग, यांग लियू

रूपरेखा

यह शोध पत्र कृत्रिम, वैयक्तिकृत छवि निर्माण पर केंद्रित है, जो छवियों को उत्पन्न करने के लिए कई अवधारणाओं को जोड़ता है। मौजूदा शोध मुख्य रूप से लक्ष्य वस्तुओं के स्वरूप को संरक्षित करने पर केंद्रित रहा है, लेकिन उनके बीच अंतःक्रियाओं के सूक्ष्म नियंत्रण की अनदेखी की गई है। यह शोध पत्र "कस्टम मानव-वस्तु अंतःक्रिया छवि निर्माण" (CHOI) नामक एक चुनौती का प्रस्ताव करता है, जो मानव-वस्तु अंतःक्रिया परिदृश्यों पर केंद्रित है। CHOI के लिए लक्ष्य मनुष्यों और वस्तुओं की पहचान संरक्षण और उनके बीच अंतःक्रिया शब्दार्थ पर नियंत्रण, दोनों की आवश्यकता होती है। CHOI की प्रमुख चुनौतियाँ हैं: (1) एक साथ पहचान संरक्षण और अंतःक्रिया नियंत्रण के लिए मनुष्यों और वस्तुओं को स्व-निहित पहचान विशेषताओं और मुद्रा-आधारित अंतःक्रिया विशेषताओं में विघटित करना आवश्यक है। हालाँकि, मौजूदा HOI छवि डेटासेट इस विशेषता विघटन को सीखने के लिए आदर्श नमूने प्रदान नहीं करते हैं; और (2) मनुष्यों और वस्तुओं के बीच अनुपयुक्त स्थानिक विन्यास वांछित अंतःक्रिया शब्दार्थ का अभाव पैदा कर सकते हैं। इस समस्या का समाधान करने के लिए, हम एक दो-चरणीय मॉडल, इंटरैक्ट-कस्टम, डिज़ाइन करते हैं, जिसमें विभिन्न अंतःक्रिया मुद्राओं वाले समान मानव-वस्तु युग्मों के नमूनों वाले एक बड़े पैमाने के डेटासेट को संसाधित किया जाता है। इंटरैक्ट-कस्टम सबसे पहले एक अग्रभूमि मास्क उत्पन्न करके स्थानिक विन्यास को स्पष्ट रूप से मॉडल करता है जो अंतःक्रिया व्यवहार को दर्शाता है। फिर यह लक्षित मनुष्यों और वस्तुओं को उत्पन्न करता है जो इस मास्क द्वारा निर्देशित, अपनी पहचान विशेषताओं को बनाए रखते हुए अंतःक्रिया करते हैं। इंटरैक्ट-कस्टम पृष्ठभूमि छवि और लक्षित मानव-वस्तु स्थानों के संयोजन को निर्दिष्ट करने के लिए एक वैकल्पिक सुविधा भी प्रदान करता है, जिससे उच्च स्तर का सामग्री नियंत्रण प्राप्त होता है। CHOI कार्य के लिए कस्टम मेट्रिक्स पर व्यापक प्रयोग प्रस्तावित दृष्टिकोण की प्रभावशीलता को प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
हम CHOI प्रस्तुत करते हैं, जो मानव-वस्तु अंतःक्रिया छवि निर्माण के क्षेत्र में एक नई चुनौती है, तथा इसके लिए एक प्रभावी मॉडल, इंटरैक्ट-कस्टम, का प्रस्ताव करते हैं।
ऐसी प्रौद्योगिकी का विकास जो एक साथ मानव और वस्तुओं की पहचान संरक्षण और अंतःक्रिया नियंत्रण को प्राप्त कर सके।
उपयोगकर्ताओं को उच्च सामग्री नियंत्रण प्रदान करता है।
बड़े पैमाने के डेटासेट का उपयोग करके एक प्रभावी शिक्षण रणनीति प्रस्तुत करना।
Limitations:
प्रस्तावित मॉडल का प्रदर्शन मूल्यांकन विशिष्ट मैट्रिक्स पर निर्भर हो सकता है।
विभिन्न प्रकार के मानव-वस्तु अंतःक्रियाओं के लिए सामान्यीकरण प्रदर्शन को और अधिक सत्यापन की आवश्यकता है।
हमने मौजूदा HOI छवि डेटासेट की सीमाओं को दूर करने के लिए एक नया डेटासेट बनाया है, लेकिन डेटासेट के पैमाने और विविधता में सीमाएं हो सकती हैं।
जटिल और विविध अंतःक्रिया परिदृश्यों को संभालने की क्षमता सीमित हो सकती है।
👍