दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एमएमबर्ट: क्लोकिंग गड़बड़ी के तहत मजबूत चीनी घृणास्पद भाषण का पता लगाने के लिए विशेषज्ञों का स्केल्ड मिश्रण मल्टीमॉडल बीईआरटी

Created by
  • Haebom

लेखक

क़ियाओ ज़ू, युचेन डू, रयान शी, जियांग लोरेन ली, वेई गाओ

रूपरेखा

यह शोधपत्र चीनी भाषा में घृणास्पद भाषणों का पता लगाने की चुनौती पर केंद्रित है, जो चीनी सोशल नेटवर्क पर छद्म तकनीकों के बढ़ते प्रचलन से और भी चुनौतीपूर्ण हो गया है। मौजूदा टेक्स्ट-आधारित पहचान प्रणालियों को दरकिनार करने के लिए छद्म तकनीकों का व्यापक उपयोग इस चुनौती को और बढ़ा देता है। इस समस्या के समाधान के लिए, यह शोधपत्र MMBERT का प्रस्ताव करता है, जो एक नवीन BERT-आधारित बहुविध ढाँचा है जो विशेषज्ञों के मिश्रण (MoE) आर्किटेक्चर के माध्यम से टेक्स्ट, वाक् और दृश्य तौर-तरीकों को एकीकृत करता है। BERT-आधारित मॉडलों में MoE को सीधे एकीकृत करने से जुड़ी अस्थिरता को दूर करने के लिए, यह शोधपत्र एक त्रि-चरणीय प्रगतिशील प्रशिक्षण प्रतिमान विकसित करता है। MMBERT, तौर-तरीके-विशिष्ट विशेषज्ञों, एक साझा स्व-ध्यान तंत्र और एक राउटर-आधारित विशेषज्ञ असाइनमेंट रणनीति को शामिल करके प्रतिकूल विक्षोभों के विरुद्ध दृढ़ता को बढ़ाता है। कई चीनी घृणास्पद भाषण डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि MMBERT एक परिष्कृत BERT-आधारित एनकोडर मॉडल, परिष्कृत LLM और संदर्भ-आधारित शिक्षण दृष्टिकोण का उपयोग करने वाले LLM से काफी बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
हम एक नवीन मल्टीमॉडल फ्रेमवर्क (MMBERT) प्रस्तुत करते हैं जो चीनी सोशल नेटवर्क पर घृणास्पद भाषण का पता लगाने के प्रदर्शन में उल्लेखनीय सुधार करता है।
BERT-आधारित मॉडलों की स्थिरता में सुधार करना तथा MoE आर्किटेक्चर और तीन-चरणीय प्रगतिशील प्रशिक्षण प्रतिमान के माध्यम से प्रतिकूल हमलों के खिलाफ मजबूती सुनिश्चित करना।
बहुविध विधियों (पाठ, ध्वनि और दृश्य) को एकीकृत करके व्यापक घृणास्पद भाषण पहचान प्रदर्शन में सुधार करना।
मौजूदा एकल-मोडल या एकल-एलएलएम आधारित दृष्टिकोणों की तुलना में बेहतर प्रदर्शन प्रदर्शित करता है।
Limitations:
एमएमबीईआरटी का प्रदर्शन मूल्यांकन एक विशिष्ट चीनी डेटासेट तक सीमित है, जिसके सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
तीन-चरणीय प्रगतिशील प्रशिक्षण प्रतिमान की जटिलता के कारण प्रशिक्षण समय और संसाधन खपत में संभावित वृद्धि।
विभिन्न भेस तकनीकों के विरुद्ध MMBERT के सामान्यीकरण प्रदर्शन को निर्धारित करने के लिए आगे के प्रयोगों और विश्लेषण की आवश्यकता है।
अन्य भाषाओं या अन्य सोशल मीडिया प्लेटफॉर्मों के लिए मापनीयता का सत्यापन आवश्यक है।
👍