दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मल्टीमॉडल फाउंडेशन मॉडल का उपयोग करके मीडिया सामग्री में चरित्र प्रतिनिधित्व का विश्लेषण: प्रभावशीलता और विश्वास

Created by
  • Haebom

लेखक

एव्डोक्सिया टाका, देबद्युति भट्टाचार्य, जोआन गार्डे-हैनसेन, संजय शर्मा, तनया गुहा

रूपरेखा

यह शोधपत्र एक AI-आधारित वर्ण अभिव्यक्ति विश्लेषण उपकरण प्रस्तुत करता है और उपयोगकर्ता अनुसंधान के माध्यम से इसकी उपयोगिता और विश्वसनीयता का मूल्यांकन करता है। कॉन्ट्रास्टिव लैंग्वेज इमेज प्रीट्रेनिंग (CLIP) पर आधारित विश्लेषण निष्कर्षण मॉडल का उपयोग करते हुए, यह उपकरण छवि डेटा से लिंग और आयु के आधार पर वर्ण अभिव्यक्तियों का परिमाणन करता है और इसमें विज़ुअलाइज़ेशन घटक शामिल होते हैं जो इन परिणामों को सामान्य उपयोगकर्ताओं के लिए प्रभावी ढंग से प्रदर्शित करते हैं। उपयोगकर्ता अनुसंधान परिणामों से पता चला कि प्रतिभागियों ने विज़ुअलाइज़्ड विश्लेषण परिणामों को समझा और उपकरण की समग्र उपयोगिता को पहचाना, लेकिन उन्होंने ऐसे विज़ुअलाइज़ेशन की आवश्यकता पर भी प्रकाश डाला जिसमें अधिक विस्तृत जनसांख्यिकीय श्रेणियां और प्रासंगिक जानकारी शामिल हो। हालाँकि AI-आधारित लिंग और आयु मॉडल में विश्वास मध्यम से निम्न था, लेकिन उनके उपयोग का कोई विरोध नहीं था। उपकरण कोड, बेंचमार्किंग और उपयोगकर्ता अनुसंधान डेटा GitHub पर उपलब्ध हैं।

Takeaways, Limitations

Takeaways:
एआई-आधारित चरित्र अभिव्यक्ति विश्लेषण उपकरण की उपयोगिता का अनुभवजन्य सत्यापन।
सामान्य उपयोगकर्ताओं के लिए AI-आधारित विश्लेषण परिणामों को दृश्यमान करने के महत्व पर जोर दें।
एआई मॉडलों की विश्वसनीयता में सुधार लाने और उपयोगकर्ता की आवश्यकताओं को पूरा करने के लिए आगे के अनुसंधान निर्देशों का सुझाव देना।
Limitations:
उपयोगकर्ता अनुसंधान में प्रतिभागियों के आकार और विविधता की सीमाएं।
विश्लेषण में शामिल जनसांख्यिकीय श्रेणियां सीमित हैं।
एआई मॉडलों में विश्वास मध्यम से निम्न पाया गया है।
अधिक विस्तृत दृश्यावलोकन और प्रासंगिक जानकारी की आवश्यकता की पहचान करें।
👍