दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

MuSeD: सोशल मीडिया वीडियो में लिंगभेद का पता लगाने के लिए एक बहुविध स्पेनिश डेटासेट

Created by
  • Haebom

लेखक

लौरा डी ग्राज़िया, पोल पेस्टल्स, माउरो वाज़क्वेज़ चास, डेसमंड इलियट, डेने एस एंचेज विलेगास, मिरिया फर्र यूएस, मैरियोना टॉल ई

रूपरेखा

यह शोधपत्र ऑनलाइन वीडियो सामग्री, विशेष रूप से टिकटॉक और विटुत जैसे सोशल मीडिया प्लेटफॉर्म पर, में लिंगभेद का पता लगाने के लिए एक बहुविध दृष्टिकोण प्रस्तुत करता है। हम एक नया स्पेनिश-भाषा बहुविध लिंगभेद पहचान डेटासेट, MuSeD (लगभग 11 घंटे का वीडियो) प्रस्तुत करते हैं, और एक अभिनव एनोटेशन ढाँचा प्रस्तावित करते हैं जो पाठ, वाक् और दृश्य रूपों के योगदान का विश्लेषण करता है। हम लिंगभेद पहचान कार्यों पर विभिन्न बड़े पैमाने के भाषा मॉडल (LLM) और बहुविध LLM का मूल्यांकन करते हैं, और पाते हैं कि दृश्य जानकारी लिंगभेदी सामग्री को चिह्नित करने में महत्वपूर्ण भूमिका निभाती है। हालाँकि ये मॉडल स्पष्ट लिंगभेद का प्रभावी ढंग से पता लगाते हैं, लेकिन वे लिंगभेद के अंतर्निहित रूपों, जैसे रूढ़िवादिता, से जूझते हैं, जो व्याख्याकारों के बीच कम सहमति के अनुरूप है। यह अंतर्निहित लिंगभेद की पहचान करने में अंतर्निहित कठिनाई को रेखांकित करता है, क्योंकि यह सामाजिक और सांस्कृतिक संदर्भ पर निर्भर करता है।

Takeaways, Limitations

Takeaways:
पेश है MuSeD, सोशल मीडिया वीडियो सामग्री में लिंग भेदभाव का पता लगाने के लिए एक नया मल्टीमॉडल डेटासेट।
हम एक अभिनव लिंग भेदभाव पहचान एनोटेशन फ्रेमवर्क प्रस्तुत करते हैं जो पाठ, आवाज और दृश्य तौर-तरीकों को एकीकृत करता है।
विभिन्न एलएलएम और मल्टीमॉडल एलएलएम में लिंग भेदभाव का पता लगाने के प्रदर्शन का मूल्यांकन करना और दृश्य जानकारी के महत्व की पुष्टि करना।
अंतर्निहित लिंगभेदवाद का पता लगाने की कठिनाई और सामाजिक-सांस्कृतिक संदर्भ के महत्व पर बल दिया गया है।
Limitations:
डेटासेट पूरी तरह से स्पेनिश भाषा से बना है, तथा अन्य भाषाओं तक इसका सामान्यीकरण सीमित है।
मॉडल को अंतर्निहित लिंगवाद (रूढ़िवादिता, आदि) का पता लगाने में कठिनाई होती है।
एनोटेशन की विश्वसनीयता को लेकर चिंताएं हैं, क्योंकि ऐसे मामले हैं जहां एनोटेटर्स के बीच सहमति का स्तर कम है।
👍