दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्रॉस-प्लेटफ़ॉर्म ई-कॉमर्स उत्पाद वर्गीकरण और पुनर्वर्गीकरण: एक बहुविध पदानुक्रमित वर्गीकरण दृष्टिकोण

Created by
  • Haebom

लेखक

लोटे ग्रॉस, रेबेका वाल्टर, निकोल ज़ोप्पी, एड्रियन जस्टस, एलेसेंड्रो गैम्बेटी, किवेई हान, मैक्सिमिलियन कैसर

रूपरेखा

यह अध्ययन ई-कॉमर्स उत्पाद वर्गीकरण की औद्योगिक चुनौतियों, जैसे प्लेटफ़ॉर्म विविधता और मौजूदा वर्गीकरण प्रणालियों की संरचनात्मक सीमाओं, का समाधान करने के लिए एक बहुविध पदानुक्रमित वर्गीकरण ढाँचा विकसित और परिनियोजित करता है। 40 अंतर्राष्ट्रीय फ़ैशन ई-कॉमर्स प्लेटफ़ॉर्म से एकत्रित 271,700 उत्पादों के डेटासेट का उपयोग करते हुए, हमने पाठ्य विशेषताओं (RoBERTa), दृश्य विशेषताओं (ViT), और एक संयुक्त दृश्य-भाषाई निरूपण (CLIP) को एकीकृत किया है। हम एक पदानुक्रमित संरचना के भीतर प्रारंभिक, विलंबित और ध्यान-आधारित संलयन रणनीतियों का अन्वेषण करते हैं, और वर्गीकरण प्रणाली की एकरूपता सुनिश्चित करने के लिए गतिशील मास्किंग को बढ़ाते हैं। परिणामस्वरूप, MLP-आधारित विलंबित संलयन रणनीति का उपयोग करते हुए CLIP एम्बेडिंग ने उच्चतम पदानुक्रमित F1 स्कोर (98.59%) प्राप्त किया, जो एकल-मोडल बेसलाइन मॉडल से बेहतर प्रदर्शन करता है। उथली या असंगत श्रेणियों को संबोधित करने के लिए, हमने SimCLR, UMAP, और कैस्केड क्लस्टरिंग का उपयोग करके एक स्व-पर्यवेक्षित शिक्षण-आधारित "उत्पाद पुनर्वर्गीकरण" पाइपलाइन प्रस्तुत की है। यह पाइपलाइन 86% से अधिक क्लस्टर शुद्धता वाली नई, सूक्ष्म श्रेणियों (जैसे, "जूते" के उपप्रकार) की खोज करती है। क्रॉस-प्लेटफ़ॉर्म प्रयोग परिनियोजन ट्रेडऑफ़ प्रदर्शित करते हैं। जहाँ जटिल लेट-फ़्यूज़न विधियाँ विविध प्रशिक्षण डेटा का उपयोग करके सटीकता को अधिकतम करती हैं, वहीं सरल अर्ली-फ़्यूज़न विधियाँ अनदेखे प्लेटफ़ॉर्म पर अधिक प्रभावी ढंग से सामान्यीकृत होती हैं। अंत में, हम एक हल्के RoBERTa चरण और एक GPU-त्वरित बहु-मोडल चरण को मिलाकर दो-चरणीय अनुमान पाइपलाइन का उपयोग करके EURWEB के वाणिज्यिक लेनदेन सूचना प्लेटफ़ॉर्म पर फ़्रेमवर्क को परिनियोजित करके औद्योगिक मापनीयता प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
बहु-मॉडल (पाठ, छवि) सूचना संलयन के माध्यम से ई-कॉमर्स उत्पाद वर्गीकरण सटीकता में सुधार (98.59% F1 स्कोर प्राप्त)।
मौजूदा वर्गीकरण प्रणालियों की सीमाओं पर काबू पाना और स्व-पर्यवेक्षित शिक्षण-आधारित उत्पाद पुनर्वर्गीकरण पाइपलाइन के माध्यम से परिष्कृत श्रेणियों की खोज करना।
हम क्रॉस-प्लेटफॉर्म सामान्यीकरण प्रदर्शन और सटीकता के बीच समझौता सुझाते हुए वास्तविक दुनिया के परिनियोजन वातावरण के लिए उपयुक्त मॉडल चयन रणनीति प्रस्तुत करते हैं।
औद्योगिक मापनीयता के साथ वास्तविक दुनिया प्रणालियों के निर्माण और तैनाती के सफल मामलों को प्रस्तुत करना।
Limitations:
परिणाम एक विशिष्ट क्षेत्र (फ़ैशन) तक सीमित थे। अन्य क्षेत्रों में इसके सामान्यीकरण की संभावना निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
प्रदर्शन बड़े डेटासेट पर निर्भर करता है। कम डेटा वाले वातावरण में प्रदर्शन में गिरावट संभव है।
लेट फ़्यूज़न विधि की जटिलता से कम्प्यूटेशनल लागत बढ़ जाती है। लाइटवेटिंग और ऑप्टिमाइज़ेशन पर और शोध की आवश्यकता है।
स्व-पर्यवेक्षित शिक्षण-आधारित पुनर्वर्गीकरण पाइपलाइनों के क्लस्टरिंग प्रदर्शन का आगे विश्लेषण आवश्यक है।
👍