दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ईकॉमएमएमएमयू: मजबूत मल्टीमॉडल ई-कॉमर्स मॉडल के लिए विजुअल्स का रणनीतिक उपयोग

Created by
  • Haebom

लेखक

ज़िनी लिंग, हानवेन डू, झिहुई झू, ज़िया निंग

रूपरेखा

यह पत्र इस मुद्दे को संबोधित करता है कि ई-कॉमर्स प्लेटफॉर्म से विविध छवि डेटा हमेशा उत्पाद समझ में सुधार नहीं कर सकता है। इसे व्यवस्थित रूप से मान्य करने के लिए, हम EcomMMMU, 406,190 नमूनों और 8,989,510 छवियों के साथ एक बड़े पैमाने पर मल्टीमॉडल मल्टी-टास्क समझ डेटासेट पेश करते हैं। EcomMMMU में आठ आवश्यक कार्य और एक विज़ुअल सिलेक्शन सबसेट (VSS) सबसेट शामिल है जो कई छवियों का लाभ उठाने की क्षमता का मूल्यांकन करता है। इसका उपयोग मल्टीमॉडल बड़े पैमाने पर भाषा मॉडल (MLLM) के प्रदर्शन को बेंचमार्क करने के लिए किया जाता है। EcomMMMU के हमारे विश्लेषण से पता चलता है कि उत्पाद छवियां हमेशा प्रदर्शन में सुधार नहीं करती हैं और कुछ मामलों में, इसे ख़राब भी करती हैं। इस अंतर्दृष्टि के आधार पर, हम SUMEI का प्रस्ताव करते हैं ,

Takeaways, Limitations

Takeaways:
ई-कॉमर्स प्लेटफार्मों में मल्टीमॉडल डेटा का लाभ उठाने पर एक नया परिप्रेक्ष्य: यह खुलासा कि छवि डेटा हमेशा फायदेमंद नहीं होता है।
एमएलएलएम की बहु-छवि उपयोग क्षमता का मूल्यांकन करना और बड़े पैमाने पर बहु-मॉडल डेटासेट ईकॉमएमएमएमयू का उपयोग करके संभावित सुधारों का सुझाव देना।
छवि उपयोगिता भविष्यवाणी पर आधारित एक कुशल बहु-छवि उपयोग विधि, SUMEI, प्रस्तावित है।
इससे पता चलता है कि एमएलएलएम को ई-कॉमर्स परिचालन में समृद्ध दृश्य सामग्री का प्रभावी ढंग से लाभ उठाने में संघर्ष करना पड़ सकता है।
Limitations:
ईकॉमएमएमएमयू डेटासेट में विशिष्ट ई-कॉमर्स प्लेटफार्मों के प्रति संभावित पूर्वाग्रह।
SUMEI पद्धति की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
प्रस्तुत आठ कार्यों के अलावा अन्य ई-कॉमर्स-संबंधी कार्यों के लिए भी प्रदर्शन सत्यापन आवश्यक है।
👍