दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

छवियों से परे: खाद्य वर्गीकरण के लिए दृश्य और पाठ्य डेटा का अनुकूली संयोजन

Created by
  • Haebom

लेखक

प्रतीक मित्तल, पुनीत गोयल, जूही चौहान

रूपरेखा

यह शोधपत्र एक नवीन बहुविध खाद्य पहचान ढाँचा प्रस्तुत करता है जो खाद्य पहचान की सटीकता और सुदृढ़ता में सुधार के लिए दृश्य और पाठ्य विधियों को संयोजित करता है। प्रस्तावित दृष्टिकोण एक गतिशील बहुविध संलयन रणनीति का उपयोग करता है जो एकविध दृश्य इनपुट और पूरक पाठ मेटाडेटा से सुविधाओं को अनुकूली रूप से एकीकृत करता है। यह संलयन तंत्र सूचना सामग्री के उपयोग को अधिकतम करने के साथ-साथ अनुपलब्ध या असंगत विधि डेटा के नकारात्मक प्रभाव को कम करने के लिए डिज़ाइन किया गया है। UPMC Food-101 डेटासेट पर कठोर मूल्यांकन छवियों के लिए 73.60% और पाठ के लिए 88.84% की एकविध वर्गीकरण सटीकता प्रदर्शित करता है। दोनों विधियों में संलयन करने पर, मॉडल 97.84% सटीकता प्राप्त करता है, जो कई अत्याधुनिक विधियों से बेहतर प्रदर्शन करता है। व्यापक प्रयोगात्मक विश्लेषण प्रस्तावित सेटअप की सुदृढ़ता, अनुकूलनशीलता और गणनात्मक दक्षता को प्रदर्शित करता है, जो वास्तविक दुनिया के बहुविध खाद्य पहचान परिदृश्यों के लिए इसकी व्यावहारिक प्रयोज्यता पर प्रकाश डालता है।

Takeaways, Limitations

Takeaways:
दृश्य और पाठ विधियों के प्रभावी संयोजन के माध्यम से खाद्य पहचान सटीकता में सुधार (97.84%)।
गुम या असंगत डेटा के विरुद्ध दृढ़ता।
गतिशील बहुविधीय संलयन रणनीति की दक्षता और अनुकूलनशीलता का प्रमाण।
व्यावहारिक अनुप्रयोग की संभावनाएं प्रस्तुत करना।
Limitations:
मूल्यांकन केवल UPMC फूड-101 डेटासेट पर किया गया था, इसलिए सामान्यीकरण की आगे की पुष्टि की आवश्यकता है।
यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या किसी विशिष्ट डेटासेट के लिए अनुकूलित सेटिंग्स अन्य डेटासेट पर समान प्रदर्शन की गारंटी दे सकती हैं।
विभिन्न प्रकार के पाठ मेटाडेटा के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन करने की आवश्यकता है।
👍